本文參考自:慕課網(wǎng) JavaScript正則表達(dá)式 http://www.imooc.com/learn/706 是自己看完視頻后總結(jié)整理的筆記碰逸。
1.什么是正則表達(dá)式
Regular Expression使用單個(gè)字符串來(lái)描述、匹配一系列某個(gè)句法規(guī)則
的字符串---按照某種規(guī)則去匹配符合條件的字符串
正則表達(dá)式應(yīng)用場(chǎng)景
1.在IDE中使用正則表達(dá)式處理規(guī)則復(fù)雜的字符串查找环疼、替換需求
2.在JavaScript程序設(shè)計(jì)中使用正則表達(dá)式處理字符串
3.在其他語(yǔ)言中
**推薦一個(gè)可視化正則表達(dá)式網(wǎng)站:http://regexper.com**
2.Regexp對(duì)象
JavaScript通過(guò)內(nèi)置對(duì)象RegExp支持正則表達(dá)式
有兩種方法實(shí)例化RegExp對(duì)象:
2.1 字面量
var reg = /\bis\b/g;
var str = 'He is a boy.This is a dog. Where is she?';
console.info(str.replace(reg,'IS'));
2.2 構(gòu)造函數(shù)
//這里和字面量定義不一樣鳞青,因?yàn)閖s中\(zhòng)斜線是特殊字符此洲,需要進(jìn)行轉(zhuǎn)義港准,
所以需要在\斜線前面加多一個(gè)\代表轉(zhuǎn)義
var reg = new RegExp('\\bis\\b','g');
console.info('He is a boy. Is he?'.replace(/\bis\b/g,'IS'));
console.info('He is a boy. Is he?'.replace(/\bis\b/g,'IS'));
2.3 匹配模式:
g (global): 全文搜索鹃愤,不添加g暴凑,搜索到第一個(gè)匹配停止;
i (ignore case) : 忽略大小寫(xiě)黍匾,不添加則默認(rèn)為大小寫(xiě)敏感栏渺;
m ( multiple lines):多行搜索
3.元字符
正則表達(dá)式由兩種基本字符類型組成
1.原義文本字符:代表它原來(lái)含義的字符 例如:abc、123
2.元字符:在正則表達(dá)式中有特殊意義的非字母字符 例如:
\b表示匹配單詞邊界膀捷,而非\b
在正則表達(dá)式中具體特殊含義的字符:* + ? $ ^ . \ () {} []
元字符:
\t:水平制表符迈嘹;
\v:垂直制表符;
\n:換行符全庸;
\r:回車符秀仲;
\0:空字符;
\f:換頁(yè)符壶笼;
\cX:與X對(duì)應(yīng)的控制字符(ctrl + x)
4.類
可以使用元字符[]來(lái)構(gòu)建一個(gè)簡(jiǎn)單的類神僵,所謂類是指符合某些特征的對(duì)象,一個(gè)泛指覆劈,而不是特指某個(gè)字符
4.1 字符類
一般情況下正則表達(dá)式一個(gè)字符對(duì)應(yīng)字符串一個(gè)字符
表達(dá)式 ab\t 的含義是: 一個(gè)字母a一個(gè)字母b加一個(gè)水平制表符
console.info('a1b2c3d4'.replace(/[abc]/g,'X'));
console.info('xw中文123中文cv'.replace(/[\u4e00-\u9fa5]/g,'#'));
4.2 反向類
使用元字符 ^ 創(chuàng)建 反向類/負(fù)向類保礼,反向類的意思是:不屬于某類的內(nèi)容
表達(dá)式 [^abc] 表示 不是字符a或b或c 的內(nèi)容
'a1b2c3d4'.replace(/[^abc]/g,'字符');//"a字符b字符c字符字符字符"
4.3 范圍類
正則表達(dá)式提供了范圍類
使用字符類匹配數(shù)字 [0123456789]可以簡(jiǎn)寫(xiě)[0-9]
可以使用 [a-z] 來(lái)連接兩個(gè)字符表示 從a到z的任意字符,閉區(qū)間,包含a和z本身责语,如:
'a1b2c3zx4z9'.replace(/[a-z]/g,'Q');
[0-9]表示0到9的值
[a-z]表示小寫(xiě)字母a到z
[a-zA-Z]表示小寫(xiě)和大寫(xiě)字母a到z
注意:a-z中間的-并不是代表字符哦 而是范圍
如果要包括字符-的話炮障,則加在后面,如[a-z-]
橫線在之內(nèi)是表示范圍坤候,之外是表示橫線
4.4 預(yù)定義類
正則表達(dá)式預(yù)定義類:
.:出了回車符和換行符之外的所有字符胁赢,等價(jià)于[^\r\n]
\d:數(shù)字字符,等價(jià)于[0-9] digit
\D:非數(shù)字字符,等價(jià)于[^0-9]
\s:空白符,等價(jià)于[\t\n\x0B\f\r] space
\S:非空白符,等價(jià)于[^\t\b\x0B\f\r]
\w:單詞字符(字母,數(shù)字白筹,下劃線),等價(jià)于[a-zA-Z_0-9] word
\W:菲單詞字符,等價(jià)于[^a-zA-Z_0-9]
提示:大寫(xiě)的表示取反
例子:
匹配一個(gè) ab+數(shù)字+任意字符 的字符串
使用范圍類:ab[0-9][^\r\n] 使用預(yù)定義類:ab\d.
常見(jiàn)的邊界匹配字符:
^ 以XXX開(kāi)始
$ 以XXX結(jié)束
\b 單詞邊界
\B非單詞邊界
例子:
'@123@abc@'.replace(/^@./g,'Q');//Q23@abc@
'@123@abc@'.replace(/.@$/g,'Q');//@123@abQ
'@123@abc@'.replace(/.@/g,'Q');//@12QabQ
5. 量詞
?出現(xiàn)0或1次(最多一次)
+出現(xiàn)1或多次(至少一次)
*出現(xiàn)0或多次(任意次)
{n}出現(xiàn)n次
{n智末,m}出現(xiàn)n到m次
{n,}至少出現(xiàn)n次
例子:
/\d{20}\w\d?\w+\d*\d{3}\w{3,5}\d{3,}/
正則中的量詞。正則中的量詞作用是緊挨著他的字符(如果沒(méi)有使用分組的話)徒河;使用分組則會(huì)匹配分組系馆。
6. 貪婪模式
貪婪模式 {3,5}盡量多的匹配5個(gè),正則表達(dá)式在匹配時(shí)顽照,盡可能多的匹配由蘑,直到匹配失敗
非貪婪模式 {3,5}?盡可能少的匹配3個(gè),正則表達(dá)式盡可能少的匹配代兵,即一旦成功匹配就不再繼續(xù)匹配
貪婪模式:JS正則表達(dá)式模式為貪婪模式纵穿,在數(shù)字常量后面加上?就可以使用非貪婪模式奢人。
'123456789'.replace(/\d{3,5}/g,'A')
"AA"
'123456'.replace(/\d{3,5}/g,'A')
"A6"
7. 分組
1. 匹配字符串 Byron 連續(xù)出現(xiàn) 3 次的場(chǎng)景
使用()可以達(dá)到分組的功能,使量詞作用于分組 (Byron){3}淆院,如果直接Byron{3}則匹配到的是Byronnn
例子:小寫(xiě)字母連續(xù)出現(xiàn)3次
'a1b2c3d4'.replace(/[a-z]\d{3}/g,'Q');
"a1b2c3d4"
'a1b2c3d4'.replace(/([a-z]\d){3}/g,'Q');
"Qd4"
分組引用
在分組的基礎(chǔ)上何乎,分組取值使用'$1 $2....'代表捕獲分組內(nèi)容
實(shí)現(xiàn):
2015-12-25 => 12/25/2015
'2015-12-25'.replace(/(\d{4})-(\d{2})-(\d{2})/g,'$2/$3/$1');
"12/25/2015"
忽略分組
不希望捕獲某些分組句惯,只需要在分組內(nèi)加上 ?:即可
'2015-07-09'.replace(/(?:\d{4})-(\d{2})-(\d{2})/g,'$2/$3/$1');
"09/$3/07"
2. 使用|將正則表達(dá)式分成前后兩部分支救,可以達(dá)到 或 的效果
例子:
'ByronCasper'.replace(/Byron|Casper/g,'Q');
"QQ"
'ByrCasperByronsper'.replace(/Byr(on|Ca)sper/g,'Q');
"QQ"
8. 前瞻
正則表達(dá)式從文本頭部向尾部開(kāi)始解析抢野,文本尾部方向,成為“前”
前瞻 就是在正則表達(dá)式匹配到規(guī)則的時(shí)候各墨,向前檢查是否符合斷言指孤。比如找到兒子為張三,還得看看他的父親是否是李四
后顧/后瞻方向相反
注意:JavaScript不支持后顧
符合特定斷言稱為 肯定/正向 匹配
不符合特定斷言稱為 否定/負(fù)向 匹配
正向前瞻 exp(?=assert) 先判斷是否符合正則贬堵,再符合正則的基礎(chǔ)上判斷是否符合斷言
負(fù)向前瞻 exp(?!asseret)
正向后顧 exp(?<=assert) js不支持
負(fù)向后顧 exp(?<!assert) js不支持
例子:\w(?=\d) 正向前瞻 符合斷言 匹配單詞字符恃轩,要求首先是一個(gè)單詞,并且這個(gè)單詞符合斷言黎做,后跟一個(gè)數(shù)字
'a2*3'.replace(/\w(?=\d)/g,'A') "A2*3"
'a2*3bb'.replace(/\w(?=\d)/g,'A') "A2*3bb"
斷言不參與規(guī)則部分叉跛,所以不會(huì)被替換
9. javascript regex對(duì)象
9.1 對(duì)象屬性
global:是否全文搜索,默認(rèn)false
ignoreCase:是否大小寫(xiě)敏感蒸殿,默認(rèn)是false
multiline:多行搜索筷厘,默認(rèn)值是false
lastIndex:是當(dāng)前表達(dá)式匹配內(nèi)容的最后一個(gè)字符的下一個(gè)位置
source:正則表達(dá)式的文本字符串
9.2 regex對(duì)象方法
9.2.1. RegExp.prototype.test(str)
用于測(cè)試字符串參數(shù)中是否存在匹配正則表達(dá)式模式的字符串,如果存在則返回true宏所,否則返回false
lastIndex 記錄當(dāng)前匹配結(jié)果的酥艳、最后一個(gè)字符的、下一個(gè)字符的位置
注意:test()方法在匹配的時(shí)候當(dāng)匹配到一個(gè)結(jié)果時(shí)爬骤,會(huì)從lastIndex位置開(kāi)始匹配下一個(gè)結(jié)果充石,直到不存在的時(shí)候才置為0。因此盖腕,當(dāng)使用全局g屬性標(biāo)識(shí)時(shí)赫冬,當(dāng)匹配到最后一個(gè)結(jié)果時(shí),lastIndex值指向不存在的位置溃列,此時(shí)再執(zhí)行test()會(huì)返回false劲厌。
例子:多次執(zhí)行test()方法,會(huì)在true听隐、false之間循環(huán)
(/\w/g).test('a')每次執(zhí)行都是正確的补鼻,但是通過(guò)實(shí)例化對(duì)象,需要很大的開(kāi)銷
test()方法:原意就是測(cè)試有沒(méi)有雅任、能不能匹配上风范,當(dāng)使用test原意時(shí),沒(méi)必要加g
9.2.1. RegExp.prototype.exec(str)
使用正則表達(dá)式模式對(duì)字符串執(zhí)行搜索沪么,并將更新全局RegExp對(duì)象的屬性一反映匹配結(jié)果
如果沒(méi)有匹配的文本則返回 null硼婿,否則返回一個(gè)結(jié)果數(shù)組:
- index 聲明匹配文本的第一個(gè)字符位置
- input 存放被檢索的字符串 string
非全局調(diào)用
調(diào)用非全局的RegExp對(duì)象的 exec()時(shí),返回?cái)?shù)組
第一個(gè)元素是與正則表達(dá)式相匹配的文本
第二個(gè)元素是與RegExpObject的第一個(gè)子表達(dá)式相匹配的文本(如果有的話)
第三個(gè)元素是與RegExp對(duì)象的第二個(gè)子表達(dá)式相匹配的文本(如果有的話)禽车,以此類推
例子:
var reg3 = /\d(\w)(\w)\d/;
var reg4 = /\d(\w)(\w)\d/g;
var ts = '$1az2bb3cy4dd5ee';
var ret1 = reg3.exec(ts);
//0 1 1az2,a,z
console.log(reg3.lastIndex + '\t' + ret1.index + '\t' + ret1.toString());
var ret2 = null;
while (ret2 = reg4.exec(ts)) {
console.log(reg4.lastIndex + '\t' + ret2.index + '\t' + ret2.toString());
//5 1 1az2,a,z
//11 7 3cy4,c,y
}
9.3 String方法的正則表達(dá)式應(yīng)用
9.3.1 String.prototype.search(reg)
用于檢索字符串中指定的子字符串寇漫,或檢索與正則表達(dá)式相匹配的子字符串刊殉,方法返回第一個(gè)匹配結(jié)果的index,查找不到返回-1州胳;
search()方法不執(zhí)行全局匹配记焊,它將忽略標(biāo)志g,并且總是從字符串的開(kāi)始進(jìn)行檢索栓撞。
例子:
'A11B2C3D4'.search(/\d/) //1
9.3.2 String.prototype.match(reg)
match()方法將檢索字符串遍膜,以找到一個(gè)或多個(gè)與RegExp匹配的文本
RegExp是否具有標(biāo)志 g 對(duì)結(jié)果影響跟大
非全局調(diào)用,即沒(méi)有 g
如果RegExp沒(méi)有標(biāo)志 g,那么 match()方法就只能在字符串中執(zhí)行一次匹配
如果沒(méi)有找到任何匹配的文本瓤湘,將返回null
否則它將返回一個(gè)數(shù)組瓢颅,其中存放了與它找到的匹配文本有關(guān)的信息
返回?cái)?shù)組的第一個(gè)元素存放的是匹配文本,而其余的元素存放的是與正則表達(dá)式的子表達(dá)式匹配的文本
除了常規(guī)的數(shù)組元素之外岭粤,返回的數(shù)組還含有2個(gè)對(duì)象屬性
index 聲明匹配文本的起始字符在字符串的位置
input 聲明對(duì) stringObject的引用
全局調(diào)用
如果RegExp具有標(biāo)志 g,則match()方法將執(zhí)行全局檢索惜索,找到字符串中的所有匹配子字符串
沒(méi)有找到任何匹配的子串,則返回null
如果找到了一個(gè)或多個(gè)匹配的子串剃浇,則返回一個(gè)數(shù)組
數(shù)組元素中存放地字符串中所有的匹配子串巾兆,而且也沒(méi)有index 屬性或input屬性
例子:
var reg3 = /\d(\w)\d/;
var reg4 = /\d(\w)\d/g;
var ts = '$1a2b3c4d5e';
var ret1 = ts.match(reg3);
console.info(ret1);//[ '1a2', 'a', index: 1, input: '$1a2b3c4d5e' ]
console.info(ret1.index + '\t' + reg3.lastIndex);//1 0
var ret2 = ts.match(reg4);
console.info(ret2);//[ '1a2', '3c4' ]
console.info(ret2.index + '\t' + reg4.lastIndex);//undefined 0
9.3.3 String.prototype.replace
replace方法比較強(qiáng)大,除了常規(guī)的 String.prototype.replace(str,replaceStr)和 String.prototype.replace(reg,replaceStr)之外虎囚,
還有String.prototype.replace(reg,function)
function參數(shù)含義
function會(huì)在每次匹配替換的時(shí)候調(diào)用角塑,有四個(gè)參數(shù)
match:匹配字符串
group...:正則表達(dá)式分組內(nèi)容,沒(méi)有分組則沒(méi)有該參數(shù)
index:匹配項(xiàng)在字符串中 index
origin:原字符串
例子:
console.info('a1b2c3d4e5'.replace(/\d/g, function(match, index, origin) {
//console.info(match);
console.info(index);
//console.info(origin);
return parseInt(match) + 1;
}));//a2b3c4d5e6
console.info('a1b2c3d4e5'.replace(/(\d)(\w)(\d)/g, function(match, group1, group2, group3, index, origin) {
console.info(match);
return group1 + group3;
})); //a12c34e5
9.3.4 String.prototype.split(reg)
我們經(jīng)常使用split方法把字符串分割為字符數(shù)組
'a,b,c,d'.split(',');//[ 'a', 'b', 'c', 'd' ]
在一些復(fù)雜的分割情況下我們可以使用正則表達(dá)式解決
'a1b2c3d'.split(/\d/);//[ 'a', 'b', 'c', 'd' ]