ES6中在正則表達(dá)式中昆淡,新增了許多新的特性和一些新的API
一跺涤、RegExp構(gòu)造函數(shù)? ??
????????1.在 ES5 中粹淋,RegExp構(gòu)造函數(shù)的參數(shù)有兩種情況。
????????????1.1 第一種情況是匙头,第一個(gè)參數(shù)是字符串漫谷,第二個(gè)參數(shù)是表示正則表達(dá)式的修飾符(flag)
????????????1.2 第二種情況是蹂析,參數(shù)是一個(gè)正則表示式舔示,這時(shí)會返回一個(gè)原有正則表達(dá)式的拷貝碟婆。
RegExp構(gòu)造函數(shù)的參數(shù)是一個(gè)正則表達(dá)式的時(shí)候,ES5 不允許此時(shí)使用第二個(gè)參數(shù)添加修飾符惕稻,否則會報(bào)錯(cuò)竖共。
????????2. ES6 改變了這種行為(第一個(gè)參數(shù)是正則表達(dá)式的情況)肘迎。在ES6中,RegExp構(gòu)造函數(shù)第一個(gè)參數(shù)是一個(gè)正則對象锻煌,那么可以使用第二個(gè)參數(shù)指定修飾符妓布。而且,返回的正則表達(dá)式會忽略原有的正則表達(dá)式的修飾符宋梧,只使用新指定的修飾符匣沼。
二、U修飾符
? ??????ES6 對正則表達(dá)式添加了u修飾符捂龄,含義為“Unicode 模式”释涛,用來正確處理大于\uFFFF的 Unicode 字符。也就是說倦沧,會正確處理四個(gè)字節(jié)的 UTF-16 編碼唇撬。
????????上面代碼中,\uD83D\uDC2A是一個(gè)四個(gè)字節(jié)的 UTF-16 編碼展融,代表一個(gè)字符窖认。但是,ES5 不支持四個(gè)字節(jié)的 UTF-16 編碼告希,會將其識別為兩個(gè)字符扑浸,導(dǎo)致第二行代碼結(jié)果為true。加了u修飾符以后燕偶,ES6 就會識別其為一個(gè)字符喝噪,所以第一行代碼結(jié)果為false。
????????一旦加上u修飾符號指么,就會修改下面這些正則表達(dá)式的行為酝惧。
? ? ? ?2.1?點(diǎn)字符?
? ??????點(diǎn)(.)字符在正則表達(dá)式中,含義是除了換行符以外的任意單個(gè)字符伯诬。對于碼點(diǎn)大于0xFFFF的 Unicode 字符晚唇,點(diǎn)字符不能識別,必須加上u修飾符姑廉。
? ??????2.2?Unicode 字符表示法
? ??????ES6 新增了使用大括號表示 Unicode 字符缺亮,這種表示法在正則表達(dá)式中必須加上u修飾符,才能識別當(dāng)中的大括號,否則會被解讀為量詞萌踱。
? ??????2.3量詞
????????使用u修飾符后葵礼,所有量詞都會正確識別碼點(diǎn)大于0xFFFF的 Unicode 字符。
? ??????2.4? U修飾符可以正確返回字符串的長度
? ? ? ?2-4-1? ?length屬性讀取長度是每兩個(gè)字節(jié)當(dāng)做長度1并鸵,所以在默認(rèn)情況下鸳粉,對于大于\uFFFF的Unicode字符會識別為長度2,這顯然不符合我們的條件园担。
? ? ? ?2-4-2? 在u修飾符下届谈,對于大于\uFFFF的Unicode字符會正確識別為長度1,符合我們預(yù)期的要求
三弯汰、 y 修飾符(“粘連”修飾符)
????????3.1? ES6 還為正則表達(dá)式添加了y修飾符偶垮,叫做“粘連”(sticky)修飾符堰怨。
? ??????3.2? y修飾符的作用與g修飾符類似嗜桌,也是全局匹配赴涵,后一次匹配都從上一次匹配成功的下一個(gè)位置開始。不同之處在于鸽嫂,g修飾符只要剩余位置中存在匹配就可纵装,而y修飾符確保匹配必須從剩余的第一個(gè)位置開始,這也就是“粘連”的涵義据某。
? ? ? ? 上面代碼有兩個(gè)正則表達(dá)式橡娄,一個(gè)使用g修飾符,另一個(gè)使用y修飾符癣籽。這兩個(gè)正則表達(dá)式各執(zhí)行了兩次挽唉,第一次執(zhí)行的時(shí)候,兩者行為相同才避,剩余字符串都是_aa_a橱夭。由于g修飾沒有位置要求,所以第二次執(zhí)行會返回結(jié)果桑逝,而y修飾符要求匹配必須從頭部開始,所以返回null俏让。
? ??????3.3 使用lastIndex屬性楞遏,可以更好地說明y修飾符
? ? ? ? ????3.3.1 改變lastIndex屬性的值,對于正則修飾符g的影響首昔。
? ? ? ??? ??3.3.2 改變lastIndex屬性的值寡喝,對于正則修飾符y的影響。
? ? ? ? ????3.3.3? 總結(jié)一下:其實(shí)y修飾符號隱含了頭部匹配的標(biāo)志^勒奇。y修飾符的設(shè)計(jì)本意预鬓,就是讓頭部匹配的標(biāo)志^在全局匹配中都有效。
? ? ? ? 3.4? y修飾符與正則的replace()方法
????????????3.4.1 y修飾符和其他修飾符一起作用正則表達(dá)式的時(shí)候赊颠,修飾符的順序?qū)Y(jié)果無影響
? ? ? ? ????3.4.2? 在replace()方法中格二,y修飾符在g修飾符下可以匹配所有的結(jié)果
? ? ? ? 3.5? y修飾符與match()方法
? ??????單單一個(gè)y修飾符對match方法劈彪,只能返回第一個(gè)匹配,必須與g修飾符聯(lián)用顶猜,才能返回所有匹配沧奴。
? ??????3.6? y修飾符與split()方法
? ??????3.7 y修飾符的一個(gè)應(yīng)用,是從字符串提取 token(詞元)长窄,y修飾符確保了匹配之間不會有漏掉的字符滔吠。
? ??????
????????上面代碼中,如果字符串里面沒有非法字符挠日,y修飾符與g修飾符的提取結(jié)果是一樣的疮绷。但是,一旦出現(xiàn)非法字符嚣潜,兩者的行為就不一樣了矗愧。
? ??上面代碼中,g修飾符會忽略非法字符郑原,而y修飾符不會唉韭,這樣就很容易發(fā)現(xiàn)錯(cuò)誤。
? ??????四犯犁、s修飾符:dotAll 模式 提案階段
? ??????正則表達(dá)式中属愤,點(diǎn)(.)是一個(gè)特殊字符,代表任意的單個(gè)字符酸役,但是行終止符(line terminator character)除外住诸。以下四個(gè)字符屬于”行終止符“。
????????1.U+000A 換行符(\n)
????????2.U+000D 回車符(\r)
????????3.U+2028 行分隔符(line separator)
????????4.U+2029 段分隔符(paragraph separator)
? ? ? ? 例如:
????????但是涣澡,很多時(shí)候我們希望匹配的是任意單個(gè)字符贱呐,這時(shí)有幾種變通的寫法。
????????s修飾符相當(dāng)于是給.這個(gè)特殊的字符增加‘功力’的入桂,讓他能夠匹配到任意的單個(gè)字符奄薇,但是目前還屬于提案階段。
? ? ? ? s修飾符還引入了一個(gè)dotAll屬性抗愁,返回布爾值馁蒂,驗(yàn)證該正則表達(dá)式是否處在dotAll模式。
? ??????五蜘腌、sticky屬性
? ??????ES6 的正則對象多了sticky屬性沫屡,表示是否設(shè)置了y修飾符。
? ??????六撮珠、flags屬性
? ??????ES6 為正則表達(dá)式新增了flags屬性沮脖,會返回正則表達(dá)式的修飾符。
ES6關(guān)于正則的擴(kuò)展其實(shí)還有一些其他的新特性,例如具名組匹配勺届,后行斷言驶俊,但由于都還處于提案中,因此就不細(xì)說下去