special charaters
1伏伯、基本的
\ 將下一個字符標(biāo)記為一個特殊字符橘洞、或一個原義字符、或一個 向后引用说搅、或一個八進制轉(zhuǎn)義符炸枣。
. 匹配除換行符(\n、\r)之外的任何單個字符
( ) 子表達式
[ ] 字符范圍弄唧,該內(nèi)的元字符會被當(dāng)作普通字符處理适肠,連字符-除外
定位符:
^ 定位符,字符串開始位置候引,本身并不匹配任何字符
$ 定位符侯养,字符串結(jié)束位置,本身并不匹配任何字符
\b 定位符澄干,單詞邊界
\B 定位符逛揩,非單詞邊界;如 er\B 可匹配 verb傻寂,但不能匹配teacher
限定符:前面表達式的匹配的次數(shù)
{ } 限定符,{n} 確定的次數(shù)携兵,{n,}次數(shù)>=n疾掰,{n,m}n<=次數(shù)<=m;
? 限定符,次數(shù)為0或者1徐紧;
* 限定符静檬,次數(shù)>=0;
+ 限定符炭懊,次數(shù)>=1;
\d 匹配一個數(shù)字字符。等價于 [0-9]拂檩。
\D 與\d相反
\w 匹配字母侮腹、數(shù)字、下劃線稻励。等價于'[A-Za-z0-9_]'
\W 與\w相反
\s 匹配任何空白字符父阻,包括空格、制表符望抽、換頁符等等加矛。等價于 [ \f\n\r\t\v]。
\S 與\s相反
\r 回車
\n 換行
[\u4e00-\u9fa5] 表示匹配一個漢字
2殴蹄、高端一點的
(?:pattern)
匹配 pattern 但不獲取匹配結(jié)果纷妆,也就是說這是一個非獲取匹配轴猎,不進行存儲供以后使用。這在使用 "或" 字符 (|) 來組合一個模式的各個部分是很有用苛茂。例如, 'industr(?:y|ies) 就是一個比 'industry|industries' 更簡略的表達式鸠窗。
(?=pattern)
正向肯定預(yù)查(look ahead positive assert)妓羊,在任何匹配pattern的字符串開始處匹配查找字符串。這是一個非獲取匹配塌鸯,也就是說侍瑟,該匹配不需要獲取供以后使用。例如丙猬,"Windows(?=95|98|NT|2000)"能匹配"Windows2000"中的"Windows"涨颜,但不能匹配"Windows3.1"中的"Windows"。預(yù)查不消耗字符茧球,也就是說庭瑰,在一個匹配發(fā)生后,在最后一次匹配之后立即開始下一次匹配的搜索抢埋,而不是從包含預(yù)查的字符之后開始弹灭。
(?!pattern)
正向否定預(yù)查(negative assert),在任何不匹配pattern的字符串開始處匹配查找字符串揪垄。這是一個非獲取匹配穷吮,也就是說,該匹配不需要獲取供以后使用饥努。例如"Windows(?!95|98|NT|2000)"能匹配"Windows3.1"中的"Windows"捡鱼,但不能匹配"Windows2000"中的"Windows"。預(yù)查不消耗字符酷愧,也就是說驾诈,在一個匹配發(fā)生后缠诅,在最后一次匹配之后立即開始下一次匹配的搜索,而不是從包含預(yù)查的字符之后開始乍迄。
(?<=pattern) 反向(look behind)肯定預(yù)查管引,與正向肯定預(yù)查類似,只是方向相反闯两。例如褥伴,"(?<=95|98|NT|2000)Windows"能匹配"2000Windows"中的"Windows",但不能匹配"3.1Windows"中的"Windows"生蚁。
(?<!pattern) 反向否定預(yù)查噩翠,與正向否定預(yù)查類似,只是方向相反邦投。例如"(?<!95|98|NT|2000)Windows"能匹配"3.1Windows"中的"Windows"伤锚,但不能匹配"2000Windows"中的"Windows"。
比如:2000windows98 (?<=2000)windows(?=98)
3志衣、要注意的
普通語言中屯援,\表示 我要插入一個普通的反斜杠;但在java中念脯,\的含義是 我要插入一個正則 表達式的反斜杠狞洋,其后的字符有特殊意義。所以其他語言\d能表示意味數(shù)字绿店,在java中需要使用 \d.
根據(jù) Java Language Specification的要求吉懊,Java 源代碼的字符串中的反斜線\被解釋為 Unicode 轉(zhuǎn)義或其他字符轉(zhuǎn)義。因此必須在字符串字面值中使用兩個反斜線假勿,表示正則表達式受到保護借嗽,不被 Java 字節(jié)碼編譯器解釋。例如转培,當(dāng)解釋為正則表達式時恶导,字符串字面值 "\b" 與單個退格字符匹配,而 "\b" 與單詞邊界匹配浸须。字符串字面值 "(hello)" 是非法的惨寿,將導(dǎo)致編譯時錯誤;要與字符串 (hello) 匹配删窒,必須使用字符串字面值 "\(hello\)"裂垦。