replace
match
match、
matchAll、
replace稍算、
search
split
g i m
- g 表示全文匹配
- i 表示匹配時(shí)忽略大小寫
- m 表示多行匹配
- 如果多個(gè)條件同時(shí)使用時(shí)混埠,則寫成:gim
()、[]痒蓬、{}
- () 的作用是提取匹配的字符串,表達(dá)式中有幾個(gè)()就會(huì)得到幾個(gè)相應(yīng)的匹配字符串徽级。比如 (\s+) 表示連續(xù)空格的字符串舌剂。
- [] 查找方括號(hào)之間的任何字符,是定義匹配的字符范圍霍转。比如 [a-zA-Z0-9] 表示字符文本要匹配英文字符和數(shù)字荐绝。
- {}一般用來表示匹配的長度避消,比如 \d{3} 表示匹配三個(gè)空格,\d[1,3]表示匹配1~3個(gè)空格岩喷。
^ 和 $
- ^ 匹配一個(gè)字符串的開頭,比如 (^a) 就是匹配以字母a開頭的字符串
- ^ 還有另個(gè)一個(gè)作用就是取反均驶,比如[^xyz] 表示匹配的字符串不包含xyz
-
$
匹配一個(gè)字符串的結(jié)尾,比如 (b$) 就是匹配以字母b結(jié)尾的字符串
需要注意的是:如果^出現(xiàn)在[]中一般表示取反,而出現(xiàn)在其他地方則是匹配字符串的開頭
\d \s \w \n .
- \d 匹配一個(gè)非負(fù)整數(shù)妇穴, 等價(jià)于 [0-9]
- \s 匹配一個(gè)空白字符
- \w 匹配一個(gè)數(shù)字、字母及下劃線腾它,等價(jià)于 [0-9a-zA-Z_]
- \n 匹配換行符
- . 匹配除換行符以外的任意字符,等價(jià)于 [^\n]
* + ?
-
*
表示匹配前面元素0次或多次瞒滴,比如 (\s*) 就是匹配0個(gè)或多個(gè)空格 -
+
表示匹配前面元素1次或多次,比如 (\d+) 就是匹配由至少1個(gè)整數(shù)組成的字符串 -
?
表示匹配前面元素0次或1次妓忍,相當(dāng)于 {0,1} ,比如 (\w?) 就是匹配最多由1個(gè)字母或數(shù)字組成的字符串
支持正則表達(dá)式的 String 對(duì)象的方法
replace
str.replace(regexp|substr, newSubStr|function)
當(dāng)?shù)诙€(gè)參數(shù)是函數(shù)時(shí)世剖,這個(gè)函數(shù)會(huì)在每次匹配發(fā)生時(shí)被調(diào)用,函數(shù)的返回值將被用作替換字符串旁瘫。
var str = "Visit Microsoft! Microsoft is a company.";
var res = str.replace(/Microsoft/g, function(match) {
return match.toUpperCase();
});
console.log(res); // "Visit MICROSOFT! MICROSOFT is a company."
函數(shù)參數(shù)
當(dāng)使用函數(shù)作為 replace() 方法的第二個(gè)參數(shù)時(shí),這個(gè)函數(shù)可以接收若干個(gè)參數(shù):
- match:匹配的全字符串酬凳。
- p1, p2, ...:如果正則表達(dá)式中包含括號(hào)分組(捕獲組)惠况,那么每個(gè)括號(hào)中的匹配字符串將作為參數(shù)傳遞給這個(gè)函數(shù)。
- offset:匹配到的子字符串在原字符串中的偏移量(即匹配到的字符串的起始索引)宁仔。
- string:被匹配檢索的原字符串稠屠。
- groups:一個(gè)包含所有命名捕獲組的對(duì)象(如果使用了命名捕獲組)。
var originalString = 'John Smith';
var newString = originalString.replace(/(\w+) (\w+)/, function(match, p1, p2, offset, string) {
console.log('match=',match) //match= John Smith
console.log('p1=',p1) //p1= John
console.log('p2=',p2) //p2= Smith
console.log('offset=',offset) //offset= 0
console.log('string=',string) //string= John Smith
return [p1, p2].join(' - '); // 返回值將替換掉原始的匹配項(xiàng)
});
console.log(newString); // 輸出: "John - Smith"
在這個(gè)例子中,正則表達(dá)式 (\w+) (\w+) 匹配了 "John Smith" 中的兩個(gè)單詞完箩,并將它們作為兩個(gè)分組傳遞給 replacer 函數(shù)赐俗。函數(shù)接收這些分組作為 p1 和 p2拉队,然后返回一個(gè)新的字符串 "John - Smith"弊知,這個(gè)字符串將替換原始的匹配項(xiàng)。
利用函數(shù)進(jìn)行復(fù)雜替換
使用函數(shù)作為 replace() 的第二個(gè)參數(shù)非常有用粱快,特別是當(dāng)你需要對(duì)匹配項(xiàng)進(jìn)行一些復(fù)雜處理時(shí)秩彤。比如,你可以根據(jù)匹配的內(nèi)容進(jìn)行條件判斷事哭,或者利用匹配項(xiàng)的位置信息來決定如何替換漫雷。
var text = "The quick brown fox jumps over the lazy dog.";
var newText = text.replace(/[aeiou]/g, function(match, offset) {
return offset + ":" + match.toUpperCase();
});
console.log(newText);
// Th2:E q5:U6:Ick br12:Own f17:Ox j21:Umps 26:Ov28:Er th33:E l36:Azy d41:Og.
在這個(gè)例子中,正則表達(dá)式 [aeiou] 匹配了文本中的所有元音字母鳍咱,并且通過提供的函數(shù)將每個(gè)元音字母做了相應(yīng)的替換
假設(shè)我們有一個(gè)字符串降盹,想要將里面的數(shù)字增加一,可以利用 replace() 方法和一個(gè)函數(shù)來實(shí)現(xiàn):
const str = '在2023年谤辜,我希望我的代碼錯(cuò)誤少一點(diǎn)蓄坏。';
const newStr = str.replace(/\d+/g, (match) => {
// 將匹配到的數(shù)字字符串轉(zhuǎn)換成數(shù)字,增加1丑念,然后轉(zhuǎn)回字符串
return parseInt(match, 10) + 1;
});
console.log(newStr);
// 輸出:在2024年涡戳,我希望我的代碼錯(cuò)誤少一點(diǎn)。
在這個(gè)例子中脯倚,正則表達(dá)式 \d+ 匹配字符串中的所有數(shù)字序列渔彰。對(duì)于每個(gè)匹配,replace() 調(diào)用提供的函數(shù)推正,將匹配的字符串(如 "2023")作為 match 參數(shù)傳遞給這個(gè)函數(shù)恍涂。函數(shù)解析這個(gè)字符串為數(shù)字,將其加一植榕,然后返回這個(gè)新值的字符串表示乳丰,這個(gè)返回值隨后用于替換原來的匹配部分。
使用括號(hào)捕獲組
當(dāng)正則表達(dá)式中包含括號(hào)捕獲組時(shí)内贮,這些組匹配的字符串也會(huì)作為參數(shù)傳遞給函數(shù):
const str = '我在2023年寫了1000行代碼产园。';
const newStr = str.replace(/(\d+)年寫了(\d+)行代碼/, (match, year, lines) => {
return `我在${parseInt(year, 10) + 1}年寫了${parseInt(lines, 10) + 500}行代碼`;
});
console.log(newStr);
// 輸出:我在2024年寫了1500行代碼。
這個(gè)例子展示了如何使用捕獲組和函數(shù)參數(shù)來實(shí)現(xiàn)更復(fù)雜的替換邏輯夜郁。正則表達(dá)式 (\d+)年寫了(\d+)行代碼 匹配一個(gè)年份和一個(gè)數(shù)字,這些數(shù)字分別表示年份和代碼行數(shù)屎即。在替換函數(shù)中,通過參數(shù) year 和 lines 接收這些匹配的數(shù)字字符串
replace 特殊替換模式
在 JavaScript 的 replace() 方法中乘陪,除了可以使用字符串或函數(shù)作為替換參數(shù)之外雕擂,還可以使用一些特殊的替換模式井赌。這些模式在使用字符串作為替換參數(shù)時(shí)非常有用,因?yàn)樗鼈兲峁┝艘环N方式來插入特定的匹配信息到替換字符串中流部。以下是一些常用的特殊替換模式:
- $&
插入整個(gè)匹配的子串纹坐。例如:
'The cat sat on the mat'.replace(/cat/, '($&)') // "The (cat) sat on the mat"
- `$``
插入當(dāng)前匹配的子串左邊的內(nèi)容耘子。例如:
'The cat sat on the mat'.replace(/cat/, '$`') // "The The sat on the mat"
- $'
插入當(dāng)前匹配的子串右邊的內(nèi)容。例如:
'The cat sat on the mat'.replace(/cat/, "$'") // "The sat on the mat sat on the mat"
- $n
其中 n 是從1到99的數(shù)字跨晴,表示第n個(gè)括號(hào)匹配的子串端盆。例如:
'The cat sat on the mat'.replace(/(c)(a)t/, '$2$1') // "The ac sat on the mat"
如果正則表達(dá)式中有括號(hào)(即捕獲組)费封,2等可以用來引用第1、第2等捕獲組匹配的文本末患。
- $$
插入一個(gè)$符號(hào)璧针。例如:
'The cat sat on the mat'.replace(/cat/, '$$') // "The $ sat on the mat"
這些特殊替換模式使得 replace() 方法在進(jìn)行字符串替換時(shí)更加靈活和強(qiáng)大渊啰。它們可以用來動(dòng)態(tài)地構(gòu)造替換字符串申屹,根據(jù)匹配的上下文來調(diào)整替換結(jié)果哗讥。
match()
JavaScript 中的 match() 方法是用于在字符串中查找匹配正則表達(dá)式的內(nèi)容杆煞。這個(gè)方法返回匹配到的結(jié)果作為一個(gè)數(shù)組曲稼,或者當(dāng)沒有找到匹配時(shí)返回 null贫悄。match() 方法對(duì)于字符串的解析和數(shù)據(jù)提取非常有用娘摔。
語法 str.match(regexp)
- str: 要進(jìn)行搜索的字符串。
- regexp: 一個(gè)正則表達(dá)式對(duì)象鸭津。如果傳入的是一個(gè)非正則表達(dá)式對(duì)象逆趋,則會(huì)隱式地使用 new RegExp(obj) 將其轉(zhuǎn)換為正則表達(dá)式對(duì)象晒奕。
返回值 - 如果使用了全局搜索標(biāo)志(g),match() 方法會(huì)返回一個(gè)數(shù)組魄眉,其中包含所有匹配的整個(gè)字符串坑律,而不會(huì)返回捕獲組囊骤。
- 如果沒有使用全局搜索標(biāo)志,match() 返回的數(shù)組包含了第一個(gè)完整匹配及其相關(guān)的捕獲組(如果有的話)宫屠。在這種情況下激况,返回的數(shù)組還擁有額外的屬性:index 和 input:
index 表示匹配項(xiàng)在字符串中的開始位置。
input 是進(jìn)行匹配搜索的初始字符串竭讳。
使用全局標(biāo)志
var text = "The rain in SPAIN stays mainly in the plain";
var result = text.match(/ain/g);
console.log(result); // 輸出: ["ain", "ain", "ain"]
不使用全局標(biāo)志
var text = "The rain in SPAIN stays mainly in the plain";
var result = text.match(/ain/);
console.log(result);
// 輸出: ["ain", index: 5, input: "The rain in SPAIN stays mainly in the plain", groups: undefined]
使用捕獲組
var text = "The rain in SPAIN stays mainly in the plain";
var result = text.match(/(ai)n/);
console.log(result);
// 輸出: ["ain", "ai", index: 5, input: "The rain in SPAIN stays mainly in the plain", groups: undefined]
在這個(gè)例子中绢慢,正則表達(dá)式 (ai)n 匹配 "ain"胰舆,并且有一個(gè)捕獲組 ai蹬挤。返回的數(shù)組中,第一個(gè)元素是整個(gè)匹配的字符串 "ain"倦零,第二個(gè)元素是第一個(gè)捕獲組匹配的 "ai"扫茅。
注意事項(xiàng)
如果正則表達(dá)式包含一個(gè)或多個(gè)捕獲組育瓜,并且使用了全局標(biāo)志 g,那么返回的數(shù)組不會(huì)包含捕獲組的匹配恋脚,只包含整個(gè)正則表達(dá)式的匹配钙态。如果你需要捕獲組的信息册倒,可以使用 RegExp.exec() 方法在一個(gè)循環(huán)中逐個(gè)處理匹配。
如果 match() 方法的參數(shù)不是一個(gè)正則表達(dá)式對(duì)象灿意,那么會(huì)將其轉(zhuǎn)換為一個(gè)正則表達(dá)式對(duì)象崇呵。
match() 方法是處理字符串和正則表達(dá)式匹配的強(qiáng)大工具域慷,可以用來進(jìn)行復(fù)雜的文本分析和數(shù)據(jù)提取汗销。