概述
RegExp
對(duì)象提供正則表達(dá)式的功能。
新建正則表達(dá)式的兩種方法:
1椎椰、使用字面量,以斜杠表示開始和結(jié)束沾鳄。第一種方法在引擎編譯代碼時(shí)慨飘,就會(huì)新建正則表達(dá)式
var regex = /xyz/;
2、使用RegExp構(gòu)造函數(shù)译荞。第二種方法在運(yùn)行時(shí)新建正則表達(dá)式瓤的,所以前者的效率較高
var regex = new RegExp('xyz');
實(shí)例屬性
正則對(duì)象的實(shí)例屬性分成兩類。
一類是修飾符相關(guān)吞歼,用于了解設(shè)置了什么修飾符圈膏。
- RegExp.prototype.ignoreCase
:返回一個(gè)布爾值,表示是否設(shè)置了i修飾符篙骡。
- RegExp.prototype.global
:返回一個(gè)布爾值本辐,表示是否設(shè)置了g修飾符桥帆。
- RegExp.prototype.multiline
:返回一個(gè)布爾值,表示是否設(shè)置了m修飾符慎皱。
- RegExp.prototype.flags
:返回一個(gè)字符串老虫,包含了已經(jīng)設(shè)置的所有修飾符,按字母排序茫多。
上面四個(gè)屬性都是只讀的祈匙。
另一類是與修飾符無關(guān)的屬性,主要是下面兩個(gè)天揖。
RegExp.prototype.lastIndex
:返回一個(gè)整數(shù)夺欲,表示下一次開始搜索的位置。該屬性可讀寫今膊,但是只在進(jìn)行連續(xù)搜索時(shí)有意義些阅,詳細(xì)介紹請(qǐng)看后文。RegExp.prototype.source
:返回正則表達(dá)式的字符串形式(不包括反斜杠)斑唬,該屬性只讀市埋。
實(shí)例方法
RegExp.prototype.test()
正則實(shí)例對(duì)象的test
方法返回一個(gè)布爾值,表示當(dāng)前模式是否能匹配參數(shù)字符串
/cat/.test('cats and dogs') // true
//驗(yàn)證參數(shù)字符串之中是否包含cat恕刘,結(jié)果返回true缤谎。
-
g
修飾符,表示是全局搜索,會(huì)有多個(gè)結(jié)果褐着。 - 如果正則表達(dá)式帶有
g
修飾符坷澡,則每一次test
方法都從上一次結(jié)束的位置開始向后匹配。 - 帶有
g
修飾符時(shí)含蓉,可以通過正則對(duì)象的lastIndex
屬性指定開始搜索的位置频敛。
var r = /x/g;
var s = '_x_x';
r.lastIndex = 4;
r.test(s) // false
r.lastIndex // 0
r.test(s)
上面代碼指定從字符串的第五個(gè)位置開始搜索,這個(gè)位置為空馅扣,所以返回false
斟赚。同時(shí),lastIndex
屬性重置為0岂嗓,所以第二次執(zhí)行r.test(s)
會(huì)返回true
。
RegExp.prototype.exec()
正則實(shí)例對(duì)象的exec
方法鹊碍,用來返回匹配結(jié)果厌殉。如果發(fā)現(xiàn)匹配,就返回一個(gè)數(shù)組侈咕,成員是匹配成功的子字符串公罕,否則返回null
。
var s = '_x_x';
var r1 = /x/;
var r2 = /y/;
r1.exec(s) // ["x"]
r2.exec(s) // null
-
exec
方法的返回?cái)?shù)組還包含以下兩個(gè)屬性:
1耀销、input
:整個(gè)原字符串楼眷。
2、index
:整個(gè)模式匹配成功的開始位置(從0開始計(jì)數(shù))。
var r = /a(b+)a/;
var arr = r.exec('_abbba_aba_');
arr // ["abbba", "bbb"]
arr.index // 1
arr.input // "_abbba_aba_"
上面代碼中的index
屬性等于1罐柳,是因?yàn)閺脑址牡诙€(gè)位置開始匹配成功掌腰。
- 如果正則表達(dá)式加上g修飾符,則可以使用多次exec方法张吉,下一次搜索的位置從上一次匹配成功結(jié)束的位置開始齿梁。
字符串的實(shí)例方法
字符串的實(shí)例方法之中,有4種與正則表達(dá)式有關(guān):
1肮蛹、String.prototype.match()
:返回一個(gè)數(shù)組勺择,成員是所有匹配的子字符串。
2伦忠、String.prototype.search()
:按照給定的正則表達(dá)式進(jìn)行搜索省核,返回一個(gè)整數(shù),表示匹配開始的位置昆码。
3气忠、String.prototype.replace()
:按照給定的正則表達(dá)式進(jìn)行替換,返回替換后的字符串未桥。
4笔刹、String.prototype.split()
:按照給定規(guī)則進(jìn)行字符串分割,返回一個(gè)數(shù)組冬耿,包含分割后的各個(gè)成員舌菜。
String.prototype.match()
- 字符串實(shí)例對(duì)象的
match
方法對(duì)字符串進(jìn)行正則匹配,返回匹配結(jié)果
var s = '_x_x';
var r1 = /x/;
var r2 = /y/;
s.match(r1) // ["x"]
s.match(r2) // null
String.prototype.search()
- 字符串對(duì)象的
search
方法亦镶,返回第一個(gè)滿足條件的匹配結(jié)果在整個(gè)字符串中的位置日月。如果沒有任何匹配,則返回-1
'_x_x'.search(/x/)
// 1
String.prototype.replace()
- 字符串對(duì)象的replace方法可以替換匹配的值缤骨。它接受兩個(gè)參數(shù)爱咬,第一個(gè)是正則表達(dá)式,表示搜索模式绊起,第二個(gè)是替換的內(nèi)容精拟。
str.replace(search, replacement)
String.prototype.split()
- 字符串對(duì)象的
split
方法按照正則規(guī)則分割字符串,返回一個(gè)由分割后的各個(gè)部分組成的數(shù)組虱歪。
str.split(separator, [limit])
- 該方法接受兩個(gè)參數(shù)蜂绎,第一個(gè)參數(shù)是正則表達(dá)式,表示分隔規(guī)則笋鄙,第二個(gè)參數(shù)是返回?cái)?shù)組的最大成員數(shù)师枣。
// 非正則分隔
'a, b,c, d'.split(',')
// [ 'a', ' b', 'c', ' d' ]
// 正則分隔,去除多余的空格
'a, b,c, d'.split(/, */)
// [ 'a', 'b', 'c', 'd' ]
// 指定返回?cái)?shù)組的最大成員
'a, b,c, d'.split(/, */, 2)
[ 'a', 'b' ]
字面量字符和元字符
- 比如
/a/
匹配a
萧落,/b/
匹配b
践美。如果在正則表達(dá)式之中洗贰,某個(gè)字符只表示它字面的含義(就像前面的a和b),那么它們就叫做“字面量字符”(literal characters)陨倡。
元字符
1敛滋、點(diǎn)字符
點(diǎn)字符(.
)匹配除回車(\r
)、換行(\n
) 玫膀、行分隔符(\u2028
)和段分隔符(\u2029
)以外的所有字符矛缨。注意,對(duì)于碼點(diǎn)大于0xFFFF
字符帖旨,點(diǎn)字符不能正確匹配箕昭,會(huì)認(rèn)為這是兩個(gè)字符。
/c.t/
上面代碼中解阅,c.t
匹配c
和t
之間包含任意一個(gè)字符的情況落竹,只要這三個(gè)字符在同一行,比如cat货抄、c2t述召、c-t等等,但是不匹配coot蟹地。
2积暖、位置字符
位置字符用來提示字符所處的位置,主要有兩個(gè)字符怪与。
^
表示字符串的開始位置
$
表示字符串的結(jié)束位置
// test必須出現(xiàn)在開始位置
/^test/.test('test123') // true
// test必須出現(xiàn)在結(jié)束位置
/test$/.test('new test') // true
// 從開始位置到結(jié)束位置只有test
/^test$/.test('test') // true
/^test$/.test('test test') // false
3夺刑、選擇符(|
)
豎線符號(hào)(|
)在正則表達(dá)式中表示“或關(guān)系”(OR),即cat|dog表示匹配cat或dog分别。
/11|22/.test('911') // true
//正則表達(dá)式指定必須匹配11或22
// 匹配fred遍愿、barney、betty之中的一個(gè)
/fred|barney|betty/
4耘斩、轉(zhuǎn)義符
正則表達(dá)式中那些有特殊含義的元字符沼填,如果要匹配它們本身,就需要在它們前面要加上反斜杠括授。比如要匹配+
坞笙,就要寫成\+
/1+1/.test('1+1')
// false
/1\+1/.test('1+1')
// true
正則表達(dá)式中,需要反斜杠轉(zhuǎn)義的荚虚,一共有12個(gè)字符:^
薛夜、.
、[
曲管、$
却邓、(
硕糊、)
院水、|
腊徙、*
、+
檬某、?
撬腾、{
和\
。
注意恢恼,如果使用RegExp
方法生成正則對(duì)象民傻,轉(zhuǎn)義需要使用兩個(gè)斜杠,因?yàn)樽址畠?nèi)部會(huì)先轉(zhuǎn)義一次
(new RegExp('1\+1')).test('1+1')
// false
(new RegExp('1\\+1')).test('1+1')
// true
5场斑、特殊字符
正則表達(dá)式對(duì)一些不能打印的特殊字符漓踢,提供了表達(dá)方法。
-
\cX
表示Ctrl-[X]
漏隐,其中的X是A-Z
之中任一個(gè)英文字母喧半,用來匹配控制字符。 -
[\b]
匹配退格鍵(U+0008)
青责,不要與\b
混淆挺据。 -
\n
匹配換行鍵。 -
\r
匹配回車鍵脖隶。 -
\t
匹配制表符tab
(U+0009)扁耐。 -
\v
匹配垂直制表符(U+000B)。 -
\f
匹配換頁符(U+000C)产阱。 -
\0
匹配null字符(U+0000)婉称。 -
\xhh
匹配一個(gè)以兩位十六進(jìn)制數(shù)(\x00-\xFF)表示的字符。 -
\uhhhh
匹配一個(gè)以四位十六進(jìn)制數(shù)(\u0000-\uFFFF)表示的 - Unicode 字符
6心墅、字符類
字符類(class)表示有一系列字符可供選擇酿矢,只要匹配其中一個(gè)就可以了。所有可供選擇的字符都放在方括號(hào)內(nèi)怎燥,比如[xyz]
表示x瘫筐、y、z
之中任選一個(gè)匹配铐姚。
/[abc]/.test('hello world') // false
/[abc]/.test('apple') // true
上面代碼中策肝,字符串hello world不包含a、b隐绵、c這三個(gè)字母中的任一個(gè)之众,所以返回false;字符串a(chǎn)pple包含字母a依许,所以返回true棺禾。
-
有兩個(gè)字符在字符類中有特殊含義。
1峭跳、脫字符(^
)
如果方括號(hào)內(nèi)的第一個(gè)字符是[^
]膘婶,則表示除了字符類之中的字符缺前,其他字符都可以匹配。比如悬襟,[^xyz]表示除了x衅码、y、z之外都可以匹配脊岳。
/[^abc]/.test('bbc news') // true
/[^abc]/.test('bbc') // false
注意逝段,脫字符只有在字符類的第一個(gè)位置才有特殊含義,否則就是字面含義割捅。
2奶躯、連字符(-
)
某些情況下,對(duì)于連續(xù)序列的字符亿驾,連字符(-
)用來提供簡(jiǎn)寫形式巫糙,表示字符的連續(xù)范圍。比如颊乘,[abc]
可以寫成[a-c]
参淹,[0123456789]
可以寫成[0-9]
,同理[A-Z]
表示26個(gè)大寫字母乏悄。
/a-z/.test('b') // false
/[a-z]/.test('b') // true
預(yù)定義模式
預(yù)定義模式指的是某些常見模式的簡(jiǎn)寫方式浙值。
\d
匹配0-9之
間的任一數(shù)字,相當(dāng)于[0-9]
檩小。
\D
匹配所有0-9以外的字符开呐,相當(dāng)于[^0-9]。
\w
匹配任意的字母规求、數(shù)字和下劃線筐付,相當(dāng)于[A-Za-z0-9_]。
\W
除所有字母阻肿、數(shù)字和下劃線以外的字符瓦戚,相當(dāng)于[^A-Za-z0-9_]。
\s
匹配空格(包括換行符丛塌、制表符较解、空格符等),相等于[ \t\r\n\v\f]赴邻。
\S
匹配非空格的字符印衔,相當(dāng)于[^ \t\r\n\v\f]。
\b
匹配詞的邊界姥敛。
\B
匹配非詞邊界奸焙,即在詞的內(nèi)部。
重復(fù)類
模式的精確匹配次數(shù),使用大括號(hào)({}
)表示与帆。{n}
表示恰好重復(fù)n次金顿,{n,}表示至少重復(fù)n次,{n,m}表示重復(fù)不少于n次鲤桥,不多于m次。
/lo{2}k/.test('look') // true
/lo{2,5}k/.test('looook') // true
上面代碼中渠概,第一個(gè)模式指定o連續(xù)出現(xiàn)2次茶凳,第二個(gè)模式指定o連續(xù)出現(xiàn)2次到5次之間。
量詞符
量詞符用來設(shè)定某個(gè)模式出現(xiàn)的次數(shù)播揪。
?
問號(hào)表示某個(gè)模式出現(xiàn)0次或1次贮喧,等同于{0, 1}
。
*
星號(hào)表示某個(gè)模式出現(xiàn)0次或多次猪狈,等同于{0,}
箱沦。
+
加號(hào)表示某個(gè)模式出現(xiàn)1次或多次,等同于{1,}
雇庙。
// t 出現(xiàn)0次或1次
/t?est/.test('test') // true
/t?est/.test('est') // true
// t 出現(xiàn)1次或多次
/t+est/.test('test') // true
/t+est/.test('ttest') // true
/t+est/.test('est') // false
// t 出現(xiàn)0次或多次
/t*est/.test('test') // true
/t*est/.test('ttest') // true
/t*est/.test('tttest') // true
/t*est/.test('est') // true
貪婪模式
量詞符在默認(rèn)情況下都是最大可能匹配谓形,即匹配直到下一個(gè)字符不滿足匹配規(guī)則為止。這被稱為貪婪模式疆前。
var s = 'aaa';
s.match(/a+/) // ["aaa"]
上面代碼中寒跳,模式是/a+/
,表示匹配1個(gè)a或多個(gè)a竹椒,那么到底會(huì)匹配幾個(gè)a呢童太?因?yàn)槟J(rèn)是貪婪模式,會(huì)一直匹配到字符a不出現(xiàn)為止胸完,所以匹配結(jié)果是3個(gè)a书释。
- 如果想將貪婪模式改為非貪婪模式,可以在量詞符后面加一個(gè)問號(hào)赊窥。
var s = 'aaa';
s.match(/a+?/) // ["a"]
這時(shí)就改為非貪婪模式爆惧,一旦條件滿足,就不再往下匹配锨能。
- 除了非貪婪模式的加號(hào)检激,還有非貪婪模式的星號(hào)(
*
)和非貪婪模式的問號(hào)(?
)。
+?
:表示某個(gè)模式出現(xiàn)1次或多次腹侣,匹配時(shí)采用非貪婪模式叔收。
*?
:表示某個(gè)模式出現(xiàn)0次或多次,匹配時(shí)采用非貪婪模式傲隶。
??
:表格某個(gè)模式出現(xiàn)0次或1次饺律,匹配時(shí)采用非貪婪模式。
'abb'.match(/ab*b/) // ["abb"]
'abb'.match(/ab*?b/) // ["ab"]
'abb'.match(/ab?b/) // ["abb"]
'abb'.match(/ab??b/) // ["ab"]
修飾符
修飾符(modifier)表示模式的附加規(guī)則跺株,放在正則模式的最尾部复濒。
修飾符可以單個(gè)使用脖卖,也可以多個(gè)一起使用。
// 單個(gè)修飾符
var regex = /test/i;
// 多個(gè)修飾符
var regex = /test/ig;
1巧颈、g
修飾符
- g
修飾符表示全局匹配(global)畦木,加上它以后,正則對(duì)象將匹配全部符合條件的結(jié)果砸泛,主要用于搜索和替換十籍。
正則模式含有g(shù)修飾符,每次都是從上一次匹配成功處唇礁,開始向后匹配
2勾栗、i
修飾符
默認(rèn)情況下,正則對(duì)象區(qū)分字母的大小寫盏筐,加上i修飾符以后表示忽略大小寫(ignoreCase)围俘。
/abc/.test('ABC') // false
/abc/i.test('ABC') // true
//加了i修飾符以后,不考慮大小寫琢融,所以模式abc匹配字符串ABC
3界牡、m
修飾符
m
修飾符表示多行模式(multiline),會(huì)修改^
和$
的行為漾抬。默認(rèn)情況下(即不加m修飾符時(shí))欢揖,^
和$
匹配字符串的開始處和結(jié)尾處,加上m
修飾符以后奋蔚,^
和$
還會(huì)匹配行首和行尾她混,即^
和$
會(huì)識(shí)別換行符(\n
)。
組匹配
正則表達(dá)式的括號(hào)表示分組匹配泊碑,括號(hào)中的模式可以用來匹配分組的內(nèi)容坤按。
/fred+/.test('fredd') // true
//第一個(gè)模式?jīng)]有括號(hào),結(jié)果+只表示重復(fù)字母d
/(fred)+/.test('fredfred') // true
//第二個(gè)模式有括號(hào)馒过,結(jié)果+就表示匹配fred這個(gè)詞臭脓。