1. Overall Concepts
正則表達(dá)式中的保留字:
[ 锤窑、?(?and?)璧针、?\、?*渊啰、?+探橱、??、?{?and?}绘证、?^隧膏、?$、?.嚷那、 ?|?(pipe)私植、 ?/
這些字符被用作高級(jí)模式匹配。如果你想搜索這些字符中的一個(gè)车酣,你需要用反斜線(\)轉(zhuǎn)義它,例如曲稼,為了搜索一個(gè)文本塊中的句號(hào),不是用.湖员,而是用\.贫悄。
用以下兩點(diǎn)來(lái)澄清以上概念:
①字面的“\\.”定義了一個(gè)字符串 \.
②正則表達(dá)式\. 則是匹配一個(gè)單個(gè)的句號(hào)字符.。
(1) 截獲圓括號(hào)(capturing parentheses) 被用作組模式的一部分娘摔。例如:3 (pm|am)會(huì)匹配文本“3 pm” ,也會(huì)匹配“3 am”窄坦。豎線字符(|)執(zhí)行的是或操作。只要你樂(lè)意,你可以包含多個(gè)豎線字符在你的正則表達(dá)式中鸭津。例如彤侍,(Tom|Dick|Harry)是一個(gè)有效的模式,它能匹配那三個(gè)名字中的任一個(gè)逆趋。
(2) 當(dāng)你需要選擇性的匹配特定的字符串時(shí)盏阶,圓括號(hào)組用起來(lái)很方便。比方說(shuō)你要在一個(gè)文本中查找“November”闻书,但是它可能被簡(jiǎn)寫(xiě)為“Nov”.你就能定義一個(gè)模式Nov(ember)?,在捕獲圓括號(hào)(capturing parentheses)后加上問(wèn)號(hào)名斟,意味著這個(gè)圓括號(hào)內(nèi)的內(nèi)容是可選的。
這個(gè)圓括號(hào)(parentheses)被定義為術(shù)語(yǔ)捕獲(capturing)因?yàn)樗麄儾东@匹配的內(nèi)容魄眉,并允許在你的正則表達(dá)式的其他地方引用它砰盐。
(3) 舉個(gè)例子,假使你有一個(gè)字符串“Say hi to Harry”.如果你創(chuàng)建一個(gè)搜索并替換的正則表達(dá)式坑律,用that guy $1來(lái)替換任一處出現(xiàn)的(Tom|Dick|Harry)岩梳,結(jié)果就會(huì)是“Say hi to that guy Harry”.$1允許你引用前面規(guī)則中的第一個(gè)截獲組。
(4) 字符組(Character classes)相當(dāng)于一組字符中匹配單個(gè)字符晃择。字符組出現(xiàn)在中括號(hào)([和])之間冀值。
例如,正則表達(dá)式t[aeiou]會(huì)匹配“ta”藕各、“te”、“ti”焦除、“to”或“tu”激况。你可以放任意多的字符在中括號(hào)中,但是請(qǐng)記住膘魄,只能匹配一個(gè)字符乌逐。[aeiou]看起來(lái)是五個(gè)字符,但它真實(shí)意義卻是“a”或”e“或”i“或”o“或”u“创葡。
如果字符連續(xù)出現(xiàn)浙踢,你也能在字符組中定義一個(gè)范圍。例如灿渴,為了搜索在100到109的數(shù)字洛波,模式應(yīng)該用10[0-9]。這和10[0123456789]會(huì)返回同樣地結(jié)果骚露,不過(guò)蹬挤,使用范圍來(lái)定義你的正則表達(dá)式看起來(lái)更簡(jiǎn)潔和易于理解。
字符組不止局限于數(shù)字棘幸,你同樣可以用字符來(lái)這樣做焰扳。比如,[a-f]會(huì)匹配”a“,”b“吨悍,”c“扫茅,”d“,”e“或”f“育瓜。
(5) 字符集通常包含你想要匹配的字符葫隙,但是如果你想明確指出不要匹配的字符該怎么辦?同樣你能定義除此之外的字符組爆雹,把^放在前面停蕉。例如,模式t[^o]就會(huì)匹配包含”t“并且后面緊跟的字符是非o的字符钙态。
2.NSRegularExpressions Cheat Sheet
(1).匹配任一字符慧起。p.p匹配pop,pup,pmp,p@p等等。
(2)\w匹配任意“word-like”字符册倒,包括數(shù)字蚓挤,字母,下劃線驻子,不過(guò)不能匹配標(biāo)點(diǎn)符號(hào)和其他字符灿意。hello\w會(huì)匹配”hello_“,”hello9”和”helloo”,但不匹配”hello!”。
(3)\d匹配數(shù)字崇呵,大部分情況下是[0-9]缤剧。\d\d?:\d\d會(huì)匹配時(shí)間格式的字符串,比如”9:30“和”12:45“域慷。
(4)\b匹配額外的字符荒辕,例如空格,標(biāo)點(diǎn)符號(hào)犹褒。to\b會(huì)匹配”to the moon”和“to!”中得“to”,但是不會(huì)匹配“tomorrow”抵窒。\b用在整個(gè)單詞的匹配方面和方便。
(5)\s會(huì)匹配空白字符叠骑,比如李皇,空格,制表符宙枷,換行符掉房。hello\s會(huì)匹配“Well,hello there!”中的 “hello ”。
(6)^用在一行的開(kāi)始慰丛。記住圃阳,這個(gè)特殊的^不同于方括號(hào)中的^!例如,^Hello會(huì)匹配字符串“Hello there”璧帝,而不會(huì)去匹配“He said Hello”捍岳。
(7)$用在一行的結(jié)束,例如,the end$會(huì)匹配“It was the end”?而不會(huì)去匹配 “the end was near”锣夹。
(8)*匹配?它之前的元素0次或多次页徐。12*3會(huì)匹配 13, 123, 1223, 122223, 和 1222222223。
(9)+匹配?它之前的元素1次或多次.12+3會(huì)匹配 ?123, 1223, 122223, 和 1222222223银萍。
(10)花括號(hào){}包含了匹配的最大和值最小個(gè)數(shù)变勇。例如,10{1贴唇,2}1會(huì)匹配“101”和“1001”搀绣,而不會(huì)匹配“10001”,因?yàn)槠ヅ涞淖钚€(gè)數(shù)為1戳气,最大個(gè)數(shù)為2链患。He[LI]{2,}o會(huì)匹配“HeLLo”和“HellLLLIo”和任意其他的“hello”添加多個(gè)L的變種,所以沒(méi)有限制瓶您,因?yàn)槁槟恚钌俚膫€(gè)數(shù)是2,最大的個(gè)數(shù)沒(méi)有設(shè)置呀袱。