[\u4e00-\u9fa5] 匹配中文字符
- 將數(shù)字123456丧枪,1234567變成123,456,1,234,567的樣式构捡,使用正則表達(dá)式(\d)(?=((\d{3})+$))
let reg = try?NSRegularExpression(pattern: "(\\d)(?=((\\d{3})+$))", options: .allowCommentsAndWhitespace)
var mu = NSMutableString(string: str)
reg?.replaceMatches(in: mu, options: .reportProgress, range: NSMakeRange(0, mu.length), withTemplate: "$1,")
print(mu)
- 字符串將連續(xù)重復(fù)的字符替換成單個(gè)字符,并將去重后的字符串反轉(zhuǎn),例如 "aabbbcccddeeggkkk",去重并反轉(zhuǎn)后變成"kgedcba",使用正則表達(dá)式(\w)\1{1,}
let reg = try? NSRegularExpression(pattern: "(\\w)\\1{1,}", options: .allowCommentsAndWhitespace);
let muStr = NSMutableString(string: str)
reg?.replaceMatches(in: muStr, options: .reportProgress, range: NSMakeRange(0, muStr.length), withTemplate: "$1")
var valStr = muStr as String
let valStrCharts:[String] = valStr.sorted { (d,f) -> Bool in
true
}.map { (cr) -> String in
String(cr)
}
valStr = valStrCharts.joined()
print(valStr)
元字符 | 描述 |
---|---|
\ | 將下一個(gè)字符標(biāo)記符、或一個(gè)向后引用刻剥、或一個(gè)八進(jìn)制轉(zhuǎn)義符。 例如滩字,“\n”匹配\n造虏∮蹋“\n”匹配換行符。序列“\”匹配“\”而“(”則匹配“(”漓藕。即相當(dāng)于多種編程語(yǔ)言中都有的“轉(zhuǎn)義字符”的概念陶珠。 |
^ | 匹配輸入字行首。如果設(shè)置了RegExp對(duì)象的Multiline屬性享钞,^也匹配“\n”或“\r”之后的位置揍诽。 |
$ | 匹配輸入行尾。如果設(shè)置了RegExp對(duì)象的Multiline屬性栗竖,$也匹配“\n”或“\r”之前的位置暑脆。 |
* | 匹配前面的子表達(dá)式任意次。 例如狐肢,zo能匹配“z”添吗,也能匹配“zo”以及“zoo”。等價(jià)于{0,}份名。 |
+ | 匹配前面的子表達(dá)式一次或多次(大于等于1次)碟联。 例如,“zo+”能匹配“zo”以及“zoo”僵腺,但不能匹配“z”鲤孵。+等價(jià)于{1,}。 |
? | 匹配前面的子表達(dá)式零次或一次辰如。 例如普监,“do(es)?”可以匹配“do”或“does”。?等價(jià)于{0,1}琉兜。 |
{n} | n是一個(gè)非負(fù)整數(shù)鹰椒。匹配確定的n次。 例如呕童,“o{2}”不能匹配“Bob”中的“o”,但是能匹配“food”中的兩個(gè)o淆珊。 |
{n,} | n是一個(gè)非負(fù)整數(shù)夺饲。至少匹配n次。 例如施符,“o{2,}”不能匹配“Bob”中的“o”往声,但能匹配“foooood”中的所有o〈亮撸“o{1,}”等價(jià)于“o+”浩销。“o{0,}”則等價(jià)于“o*”听哭。 |
{n,m} | m和n均為非負(fù)整數(shù)慢洋,其中n<=m塘雳。最少匹配n次且最多匹配m次。例如普筹,“o{1,3}”將匹配“fooooood”中的前三個(gè)o為一組败明,后三個(gè)o為一組√溃“o{0,1}”等價(jià)于“o?”妻顶。請(qǐng)注意在逗號(hào)和兩個(gè)數(shù)之間不能有空格。 |
? | 當(dāng)該字符緊跟在任何一個(gè)其他限制符(*,+,?蜒车,{n}讳嘱,{n,},{n,m})后面時(shí)酿愧,匹配模式是非貪婪的沥潭。非貪婪模式盡可能少地匹配所搜索的字符串,而默認(rèn)的貪婪模式則盡可能多地匹配所搜索的字符串寓娩。 例如叛氨,對(duì)于字符串“oooo”,“o+”將盡可能多地匹配“o”棘伴,得到結(jié)果[“oooo”]寞埠,而“o+?”將盡可能少地匹配“o”,得到結(jié)果 ['o', 'o', 'o', 'o'] |
.點(diǎn) | 匹配除“\n”和"\r"之外的任何單個(gè)字符焊夸。要匹配包括“\n”和"\r"在內(nèi)的任何字符仁连,請(qǐng)使用像“[\s\S]”的模式。 |
(pattern) | 匹配pattern并獲取這一匹配阱穗。所獲取的匹配可以從產(chǎn)生的Matches集合得到饭冬,在VBScript中使用SubMatches集合,在JScript中則使用9屬性揪阶。要匹配圓括號(hào)字符昌抠,請(qǐng)使用“\(”或“\)”。 |
(?:pattern) | 非獲取匹配鲁僚,匹配pattern但不獲取匹配結(jié)果炊苫,不進(jìn)行存儲(chǔ)供以后使用。這在使用或字符“(|)”來(lái)組合一個(gè)模式的各個(gè)部分時(shí)很有用冰沙。 例如“industr(?:y|ies)”就是一個(gè)比“industry|industries”更簡(jiǎn)略的表達(dá)式侨艾。 |
(?=pattern) | 非獲取匹配,正向肯定預(yù)查拓挥,在任何匹配pattern的字符串開(kāi)始處匹配查找字符串唠梨,該匹配不需要獲取供以后使用。 例如侥啤,“Windows(?=95|98|NT|2000)”能匹配“Windows2000”中的“Windows”当叭,但不能匹配“Windows3.1”中的“Windows”茬故。預(yù)查不消耗字符,也就是說(shuō)科展,在一個(gè)匹配發(fā)生后均牢,在最后一次匹配之后立即開(kāi)始下一次匹配的搜索,而不是從包含預(yù)查的字符之后開(kāi)始才睹。 |
(?!pattern) | 非獲取匹配徘跪,正向否定預(yù)查,在任何不匹配pattern的字符串開(kāi)始處匹配查找字符串琅攘,該匹配不需要獲取供以后使用垮庐。 例如“Windows(?!95|98|NT|2000)”能匹配“Windows3.1”中的“Windows”,但不能匹配“Windows2000”中的“Windows”坞琴。 |
(?<=pattern) | 非獲取匹配哨查,反向肯定預(yù)查,與正向肯定預(yù)查類似剧辐,只是方向相反寒亥。 例如,“(?<=95|98|NT|2000)Windows”能匹配“2000Windows”中的“Windows”荧关,但不能匹配“3.1Windows”中的“Windows”溉奕。*python的正則表達(dá)式?jīng)]有完全按照正則表達(dá)式規(guī)范實(shí)現(xiàn),所以一些高級(jí)特性建議使用其他語(yǔ)言如java忍啤、scala等 |
(?<!patte_n) | 非獲取匹配加勤,反向否定預(yù)查,與正向否定預(yù)查類似同波,只是方向相反鳄梅。 例如“(?<!95|98|NT|2000)Windows”能匹配“3.1Windows”中的“Windows”,但不能匹配“2000Windows”中的“Windows”未檩。*python的正則表達(dá)式?jīng)]有完全按照正則表達(dá)式規(guī)范實(shí)現(xiàn)戴尸,所以一些高級(jí)特性建議使用其他語(yǔ)言如java、scala等 |
x|y | 匹配x或y冤狡。 例如校赤,“z|food”能匹配“z”或“food”(此處請(qǐng)謹(jǐn)慎)⊥怖#“[z|f]ood”則匹配“zood”或“food”。 |
[xyz] | 字符集合沾乘。匹配所包含的任意一個(gè)字符怜奖。例如,“[abc]”可以匹配“plain”中的“a”翅阵。 |
[^xyz] | 負(fù)值字符集合歪玲。匹配未包含的任意字符迁央。 例如,“[^abc]”可以匹配“plain”中的“plin”任一字符滥崩。 |
[a-z] | 字符范圍岖圈。匹配指定范圍內(nèi)的任意字符。 例如钙皮,“[a-z]”可以匹配“a”到“z”范圍內(nèi)的任意小寫(xiě)字母字符蜂科。 注意:只有連字符在字符組內(nèi)部時(shí),并且出現(xiàn)在兩個(gè)字符之間時(shí),才能表示字符的范圍; 如果出字符組的開(kāi)頭,則只能表示連字符本身. |
[^a-z] | 負(fù)值字符范圍。匹配任何不在指定范圍內(nèi)的任意字符短条。 例如导匣,“[^a-z]”可以匹配任何不在“a”到“z”范圍內(nèi)的任意字符。 |
\b | 匹配一個(gè)單詞的邊界茸时,也就是指單詞和空格間的位置(即正則表達(dá)式的“匹配”有兩種概念贡定,一種是匹配字符,一種是匹配位置可都,這里的\b就是匹配位置的)缓待。 例如,“er\b”可以匹配“never”中的“er”渠牲,但不能匹配“verb”中的“er”旋炒;“\b1_”可以匹配“1_23”中的“1_”,但不能匹配“21_3”中的“1_”嘱兼。 |
\B | 匹配非單詞邊界国葬。“er\B”能匹配“verb”中的“er”芹壕,但不能匹配“never”中的“er”汇四。 |
\cx | 匹配由x指明的控制字符。 例如踢涌,\cM匹配一個(gè)Control-M或回車符通孽。x的值必須為A-Z或a-z之一。否則睁壁,將c視為一個(gè)原義的“c”字符背苦。 |
\d | 匹配一個(gè)數(shù)字字符。等價(jià)于[0-9]潘明。grep 要加上-P行剂,perl正則支持 |
\D | 匹配一個(gè)非數(shù)字字符。等價(jià)于[^0-9]钳降。grep要加上-P厚宰,perl正則支持 |
\f | 匹配一個(gè)換頁(yè)符。等價(jià)于\x0c和\cL。 |
\n | 匹配一個(gè)換行符铲觉。等價(jià)于\x0a和\cJ澈蝙。 |
\r | 匹配一個(gè)回車符。等價(jià)于\x0d和\cM撵幽。 |
\s | 匹配任何不可見(jiàn)字符灯荧,包括空格、制表符盐杂、換頁(yè)符等等逗载。等價(jià)于[ \f\n\r\t\v]。 |
\S | 匹配任何可見(jiàn)字符况褪。等價(jià)于[^ \f\n\r\t\v]撕贞。 |
\t | 匹配一個(gè)制表符。等價(jià)于\x09和\cI测垛。 |
\v | 匹配一個(gè)垂直制表符捏膨。等價(jià)于\x0b和\cK。 |
\w | 匹配包括下劃線的任何單詞字符食侮。類似但不等價(jià)于“[A-Za-z0-9_]”号涯,這里的"單詞"字符使用Unicode字符集。 |
\W | 匹配任何非單詞字符锯七。等價(jià)于“[^A-Za-z0-9_]”链快。 |
\xn | 匹配n,其中n為十六進(jìn)制轉(zhuǎn)義值眉尸。十六進(jìn)制轉(zhuǎn)義值必須為確定的兩個(gè)數(shù)字長(zhǎng)域蜗。例如,“\x41”匹配“A”噪猾∶够觯“\x041”則等價(jià)于“\x04&1”。正則表達(dá)式中可以使用ASCII編碼袱蜡。 |
\num | 匹配num丝蹭,其中num是一個(gè)正整數(shù)。對(duì)所獲取的匹配的引用坪蚁。例如奔穿,“(.)\1”匹配兩個(gè)連續(xù)的相同字符。 |
\n | 標(biāo)識(shí)一個(gè)八進(jìn)制轉(zhuǎn)義值或一個(gè)向后引用敏晤。如果\n之前至少n個(gè)獲取的子表達(dá)式贱田,則n為向后引用。否則嘴脾,如果n為八進(jìn)制數(shù)字(0-7)男摧,則n為一個(gè)八進(jìn)制轉(zhuǎn)義值。 |
\nm | 標(biāo)識(shí)一個(gè)八進(jìn)制轉(zhuǎn)義值或一個(gè)向后引用。如果\nm之前至少有nm個(gè)獲得子表達(dá)式彩倚,則nm為向后引用。如果\nm之前至少有n個(gè)獲取扶平,則n為一個(gè)后跟文字m的向后引用帆离。如果前面的條件都不滿足,若n和m均為八進(jìn)制數(shù)字(0-7)结澄,則\nm將匹配八進(jìn)制轉(zhuǎn)義值nm哥谷。 |
\nml | 如果n為八進(jìn)制數(shù)字(0-7),且m和l均為八進(jìn)制數(shù)字(0-7)麻献,則匹配八進(jìn)制轉(zhuǎn)義值nml们妥。 |
\un | 匹配n,其中n是一個(gè)用四個(gè)十六進(jìn)制數(shù)字表示的Unicode字符勉吻。例如监婶,\u00A9匹配版權(quán)符號(hào)(?)。 |
\p{P} | 小寫(xiě) p 是 property 的意思齿桃,表示 Unicode 屬性惑惶,用于 Unicode 正表達(dá)式的前綴。中括號(hào)內(nèi)的“P”表示Unicode 字符集七個(gè)字符屬性之一:標(biāo)點(diǎn)字符短纵。 其他六個(gè)屬性: L:字母带污; M:標(biāo)記符號(hào)(一般不會(huì)單獨(dú)出現(xiàn)); Z:分隔符(比如空格香到、換行等)鱼冀; S:符號(hào)(比如數(shù)學(xué)符號(hào)、貨幣符號(hào)等)悠就; N:數(shù)字(比如阿拉伯?dāng)?shù)字千绪、羅馬數(shù)字等); C:其他字符理卑。 *注:此語(yǔ)法部分語(yǔ)言不支持翘紊,例:javascript。 |
\< \> | 匹配詞(word)的開(kāi)始(<)和結(jié)束(>)藐唠。例如正則表達(dá)式<the>能夠匹配字符串"for the wise"中的"the"帆疟,但是不能匹配字符串"otherwise"中的"the"。注意:這個(gè)元字符不是所有的軟件都支持的宇立。 |
( ) | 將( 和 ) 之間的表達(dá)式定義為“組”(group)踪宠,并且將匹配這個(gè)表達(dá)式的字符保存到一個(gè)臨時(shí)區(qū)域(一個(gè)正則表達(dá)式中最多可以保存9個(gè)),它們可以用 \1 到\9 的符號(hào)來(lái)引用妈嘹。 |
| | 將兩個(gè)匹配條件進(jìn)行邏輯“或”(or)運(yùn)算柳琢。例如正則表達(dá)式(him|her) 匹配"it belongs to him"和"it belongs to her",但是不能匹配"it belongs to them."。注意:這個(gè)元字符不是所有的軟件都支持的柬脸。 |