正則對(duì)象
生成正則對(duì)象
有兩種方法可以創(chuàng)建并得到一個(gè)正則表達(dá)式對(duì)象
字面量聲明方式
var reg = /abc/g;
顯式創(chuàng)建
var reg =new RegExp("abc", "g");
可選項(xiàng)標(biāo)記
上文生成正則對(duì)象中最后有用到g巫湘,其實(shí)這就是生成正則的可選項(xiàng)標(biāo)記,可以組合使用士复,如下
g 全文匹配探熔,即匹配一個(gè)成功后被因,如果沒有結(jié)束拢蛋,會(huì)繼續(xù)匹配
i 忽略大小寫匹配
m 多行匹配
可以通過如下示例進(jìn)一步了解
/g的用法
加上/g后會(huì)全局搜索所有匹配結(jié)果
var str = 'abcabcabc';
// ['abc', index: 0, input: "abcabcabc"]
str.match(/abc/);
// ['abc', 'abc', 'abc']
str.match(/abc/g);
/i的用法
加上/i后大小寫一視同仁玄妈,很多時(shí)候凰荚,如果不加/i曲伊,很容易出現(xiàn)大小寫不匹配的錯(cuò)誤(比如去除字符串中script標(biāo)簽時(shí))
var str = 'Script';
// null
str.match(/script/);
// ["Script", index: 0, input: "Script"]
str.match(/script/i);
/m的用法
多行匹配比較少用到叽讳,但在一些場(chǎng)景下不得不用,比如下例中熊昌,只有\(zhòng)m多行匹配的情況下才能正常的將每一行的行尾(\n形成不同的行)的數(shù)字替換成#绽榛,否則默認(rèn)會(huì)認(rèn)為只有一行
var str = 'a1\nb1\nc1\nd1\ne1\nf1';
/**
* a1
* b1
* c1
* d1
* e1
* f#
*/
str.replace(/\d+$/g, '#')
/**
* a#
* b#
* c#
* d#
* e#
* f#
*/
str.replace(/\d+$/mg, '#')
子表達(dá)式
正則表達(dá)式中,用圓括號(hào)包圍的就是子表達(dá)式(子模式)
一般婿屹,在match的非全局匹配中或exec中灭美,在匹配完整個(gè)正則表達(dá)表達(dá)式后,都會(huì)再次匹配子表達(dá)式
另外昂利,在字符串的replace與split中届腐,子表達(dá)式也會(huì)經(jīng)常用到
var str = 'a1.b2.c3.d4';
// 第一個(gè)結(jié)果是 整個(gè)正則表達(dá)式的匹配,之后則分別是子表達(dá)式的匹配
/(\w)(\d)[.]/.exec(str); // ["a1.", "a", "1", index: 0, input: "a1.b2.c3.d4"]
正則的test()
pattern.test(str);
檢索字符串中是否存在指定模式蜂奸,匹配成功則返回true犁苏,否則返回false
var str = 'abcdefg';
/^abc/.test(str); // true
/^abce/.test(str); // false
正則的compile()
reg.compile(pattern);
編譯正則表達(dá)式,編譯之后正則的執(zhí)行速度會(huì)提高
編譯的時(shí)候也可以改變檢索模式或者改變可選項(xiàng)標(biāo)識(shí)
var str = 'abcdabcdabc';
var reg = /abc/;
reg.test(str)扩所; // true
reg.compile();
reg.test(str)围详; // true,僅僅是被編譯祖屏,沒有被改變
reg.compile(/aB/);
reg.test(str)助赞; // false,匹配式改成了aB袁勺,因此不匹配
reg.compile(/aB/i);
reg.test(str)雹食; // true,改成了aB并且忽略大小的形式期丰,因此匹配
正則的exec()
pattern.exec(str);
在字符串中檢索特定的模式群叶,匹配成功則返回找到的值吃挑,否則返回null
有兩種情況
第一種:非全局匹配
如果沒有找到,則返回null
找到則返回一個(gè)數(shù)組街立,arr[0]是匹配結(jié)果舶衬,余下元素是arr[0]中匹配圓括號(hào)中子表達(dá)式的結(jié)果,以及最后的index和input
而且非全局模式中几晤,不會(huì)保存index约炎,也就是說不管匹配多少次,結(jié)果都是一樣的
var str = 'a1.b2.c3.d4';
var reg1 = /(\w)(\d)[.]/;
reg1.exec(str); // ["a1.", "a", "1", index: 0, input: "a1.b2.c3.d4"]
reg1.exec(str); // ["a1.", "a", "1", index: 0, input: "a1.b2.c3.d4"]
reg1.exec(str); // ["a1.", "a", "1", index: 0, input: "a1.b2.c3.d4"]
/abc/.exec(str); // null
第二種:g全局匹配
正則的exec全局匹配可以保存index蟹瘾,并且下一次繼續(xù)匹配時(shí),將不會(huì)是重新從0開始掠手,而是從保存的index開始
var str = 'a1.b2.c3.d4';
var reg2 = /(\w)(\d)[.]/g;
reg2.exec(str); // ["a1.", "a", "1", index: 0, input: "a1.b2.c3.d4"]
reg2.exec(str); // ["b2.", "b", "2", index: 3, input: "a1.b2.c3.d4"]
reg2.exec(str); // ["c3.", "c", "3", index: 6, input: "a1.b2.c3.d4"]
/abc/.exec(str); // null
字符串的正則應(yīng)用
上文中提到的都是正則對(duì)象上的方法憾朴,但實(shí)際上,JS的String對(duì)象也支持正則表達(dá)式
字符串的match()
match是字符串中最常用的方法
str.match(pattern);
如果pattern中有g(shù)喷鸽,代表全局匹配众雷,則返回的數(shù)組包含所有匹配結(jié)果
如果無g,則返回的數(shù)組的第1個(gè)元素(arr[0])是第一個(gè)匹配結(jié)果做祝,余下元素是arr[0]中匹配圓括號(hào)中子表達(dá)式的結(jié)果
var str = 'a.b2.c3.d445.e';
str.match(/\d[.]/); // ["2.", index: 3, input: "a.b2.c3.d445.e"]
// 非全局匹配下砾省,并且有圓括號(hào)子表達(dá)式,先匹配整個(gè)正則表達(dá)式一次
// 然后在匹配結(jié)果中再匹配子表達(dá)式
str.match(/(\d)[.]/); // ["2.", "2", index: 3, input: "a.b2.c3.d445.e"]
// g 模式下是對(duì)整個(gè)正則表達(dá)式(包括圓括號(hào)子表達(dá)式)進(jìn)行全局匹配
str.match(/(\d)[.]/g); // ["2.", "3.", "5."]
字符串的replace()
字符串中用來快速替換的方法混槐,有多種用法
第一種情況
str.replace(str1, str2);
第一個(gè)參數(shù)是字符串编兄,那么返回的結(jié)果只有str1被替換成str2了
var str = 'a.b2.c3.d4';
// 只會(huì)替換 . 一次
str.replace('.', '#'); // a#b2.c3.d445.e
第二種情況
str.replace(pattern, str2);
第一個(gè)參數(shù)是正則表達(dá)式,此時(shí)如果是g全局匹配模式声登,會(huì)替換所有的匹配結(jié)果為str2狠鸳,否則只會(huì)替換一個(gè)匹配結(jié)果
var str = 'a.b2.c3.d4';
str.replace(/[.]/, '#'); // a#b2.c3.d445.e
str.replace(/[.]/g, '#'); // a#b2#c3#d445#e
另外此模式下,str2還可以使用一些有特殊含義的特殊字符悯嗓,例如
var str = 'a1.b2.c3.d4';
// $2和$1分別代表第2個(gè),第1個(gè)子表達(dá)式
str.replace(/(\w)(\d)[.]*/g, '$2$1~'); // 1a~2b~3c~4d~
str2中可用的特殊字符表
字符???????????? 替換
$1,$2,...,$99 ? 匹配第1~99個(gè)pattern中的圓括號(hào)子表達(dá)式的文本
$& ? ? ? ? ? ? ? 匹配pattern的子串
$` ? ? ? ? ? ? ?? 匹配子串的左邊文本
$' ? ? ? ? ? ? ?? 匹配子串的右邊文本
$$ ? ? ? ? ? ? ? 美元符號(hào)
第三種情況
str.replace(pattern, func);
這種模式下件舵,第二個(gè)參數(shù)為一個(gè)函數(shù),func將會(huì)在每一個(gè)匹配結(jié)果中調(diào)用脯厨,func返回的字符串將作為替換文本铅祸,func接收的參數(shù),第一個(gè)是匹配pattern的字符串合武,之后的參數(shù)(可能是多個(gè))是匹配該pattern中某個(gè)圓括號(hào)子表達(dá)式的字符串临梗,在這之后的參數(shù)就是index(匹配結(jié)果的位置),再之后就是完整的input
var str = a1.b2.c3.d4;
// 最終結(jié)果為: 1a~2b~3c~4d~
str.replace(/(\w)(\d)[.]*/g, function(word, child1, child2, index, input) {
console.log(word); // 依次打印的是a1. b2. c3. d4
console.log(child1); // 依次打印的是a b c d
console.log(child2); // 依次打印的是1 2 3 4
console.log(index); // 依次打印的是0 3 6 9
console.log(input); // 每次都是打印 a1.b2.c3.d4
return child2 + child1 + '~';
});
字符串的search()
返回第1個(gè)與patten匹配的字符串子串的起始位置眯杏,如果找不到夜焦,則返回-1,不支持全局檢索岂贩,也就是說茫经,會(huì)省略g
var str = 'abcdefg1234567';
str.search(/efg/); // 4
str.search(/efg/g); // 4
str.search(/aabc/g); // -1
字符串的split()
split方法可以讓一個(gè)字符串分割成數(shù)組巷波,同樣忽略g
str.split(pattern, limit); // pattern為字符串或正則
將str拆分為子串組成的數(shù)組,子串中不包括pattern(特例除外)卸伞。limit是可選參數(shù)抹镊,指定返回的數(shù)組的最大長(zhǎng)度
特例: 如果pattern包含圓括號(hào)子表達(dá)式,則匹配這個(gè)圓括號(hào)子表達(dá)式的子串(不是匹配整個(gè)正則)會(huì)包含在返回?cái)?shù)組中
var str = 'a1.b2.c3.d4';
str.split(/\d[.]/); // ["a", "b", "c", "d4"]
// 包含了圓括號(hào)的子串荤傲,返回?cái)?shù)組中出現(xiàn)了匹配圓括號(hào)的子串
str.split(/(\d)[.]/); // ["a", "1", "b", "2", "c", "3", "d4"]
var str2 = '.b2.c3.';
// 3.后面沒有字符了冀值,但是由于它符合匹配,所以后續(xù)結(jié)果中會(huì)多一個(gè)""
str2.split(/\d[.]/); // [".b", "c", ""]
// 同上慎式,只不過圓括號(hào)中的內(nèi)容也在返回結(jié)果中
str.split(/(\d)[.]/); // [".b", "2", "c", "3", ""]