正則表達(dá)式簡(jiǎn)單語(yǔ)法總結(jié)
一舆吮、什么是正則表達(dá)式
從概念上來(lái)說(shuō)揭朝,正則表達(dá)式也是一門(mén)小巧而精煉的語(yǔ)言,它可以用來(lái)簡(jiǎn)化檢索特定的字符串色冀,替換特定字符等功能潭袱,有許多開(kāi)發(fā)語(yǔ)言工具,都內(nèi)嵌支持正則表達(dá)式呐伞。那么一個(gè)正則表達(dá)式敌卓,究竟是什么?其實(shí)它就是一個(gè)字符串伶氢,但這個(gè)字符串具有特定含義趟径。
二、正則表達(dá)式的基礎(chǔ)語(yǔ)法
1癣防、字面值
所謂字面值蜗巧,就是沒(méi)有任何轉(zhuǎn)義,查找的對(duì)象就是其本身蕾盯,比如正則表達(dá)式 abc 幕屹,查找的結(jié)果就是返回要查找字符串中 a,b级遭,c三個(gè)字母連在一起的字符串望拖。又如,123 就是查找到123這個(gè)子串挫鸽。
2说敏、特殊字符(元字符)
(1)句號(hào)
“.”在正則表達(dá)式中表示匹配任意字符,很相似于通配符*丢郊。如果我們查找a.b這個(gè)正則表達(dá)式盔沫,我們可以找到所有開(kāi)頭和結(jié)尾為a医咨,b,中間是任意字符的字符串架诞,比如abc拟淮,adc,a2c等谴忧。
(2)字符類(lèi)([])
如果你在一個(gè)正則表達(dá)式中看到有一些字符被[]括號(hào)括起來(lái)很泊,那么他們的含義將不再是簡(jiǎn)單的字面值,他們表示某一個(gè)被括號(hào)中屬性約束的字符俏蛮。比如[123456]撑蚌,這個(gè)正則表達(dá)式表示找到1-6中的任意一個(gè)字符,又比如a[bd]c搏屑,這表示查找abc或者adc争涌。
注意:
1.在字符類(lèi)中字符的順序和重復(fù)性都不是我們關(guān)心的。[123]和[2233111]辣恋,含義是一模一樣的亮垫。
2.句號(hào)在字符類(lèi)中表示的就是其本身,[.]就是查找一個(gè)句號(hào)伟骨。
(3)區(qū)間符號(hào)(-)
如果我們需要查找一個(gè)數(shù)字饮潦,[0123456789],這樣做是可以達(dá)到目的的携狭,但這寫(xiě)起非常麻煩继蜡,并不符合正則表達(dá)式小巧的特性,這時(shí)我們可以使用區(qū)間符號(hào)來(lái)簡(jiǎn)化逛腿,[0-9]和上面的式子意義完全一樣稀并。同樣,我們可以[a-zA-Z]单默,表示任意一個(gè)字母碘举。
注意:
1.區(qū)間的范圍應(yīng)該有意義,[a-1]這樣的區(qū)間并無(wú)任何意義搁廓,盡管它在語(yǔ)法上可能沒(méi)有錯(cuò)誤引颈。
2.區(qū)間左右兩端對(duì)應(yīng)的是字符,并不是數(shù)字境蜕,比如[2-41]蝙场,這個(gè)式子的含義是找到2-4的一個(gè)數(shù)字或者1,和[1-4]是一樣的粱年。
(4)取反符號(hào)(^)
“^”在正則表達(dá)式中表示取反售滤,這個(gè)很好理解,[^a]逼泣,表示找到除了a之外的任意字符趴泌。[^0-9],表示找到一個(gè)非數(shù)字的字符拉庶。
注意:
1.^必須在中括號(hào)內(nèi)嗜憔,及字符類(lèi)屬性中使用。
2.^是將后面的整體作為取反條件的氏仗。
(5)簡(jiǎn)化的字符類(lèi)
某些符號(hào)具有和字符類(lèi)相同的含義:
\d和[0-9]相同
\w和[0-9A-Za-z_]相同 表示數(shù)字吉捶,字母或者下劃線
\s表示匹配空格,tab和換行等不可見(jiàn)符皆尔。
與此相對(duì)的\D,\W,\S呐舔,則表示上述條件的取反情況。
(6)乘法集({})
乘法集的最大用處也是簡(jiǎn)化正則表達(dá)式慷蠕,用大括號(hào)表示珊拼。比如,a{2}流炕,表示找到aa這個(gè)字符串澎现。
注意:
乘法集是已前面整體為乘法條件的,比如[ab]{2}每辟,不是簡(jiǎn)單的比配aa剑辫,bb,而是和[ab][ab]含義是相同的渠欺,會(huì)匹配ab妹蔽,ba,aa挠将,bb胳岂。
(7)乘法集中的區(qū)間(,)
乘法集和字符類(lèi)相同,也可以用區(qū)間進(jìn)行簡(jiǎn)化捐名,但是符號(hào)不相同旦万。a{1,3},表示找到a镶蹋,aa成艘,aaa這三個(gè)字符串。a{0,1}是合法的贺归,表示找到空字符淆两,或者a。
注意:
1.乘法集的"越長(zhǎng)越好"屬性:乘法集具有這樣的特點(diǎn)拂酣,比如a{2,4}秋冰,如果我搜索myaaaa,它不會(huì)找到aa后就停止婶熬,而是會(huì)找到aaaa剑勾。
2.乘法集的"全部獲取"屬性:比如a{2.4}埃撵,如果搜索myaayouaaaa,它會(huì)找到aa和aaaa虽另。
3.乘法集支持開(kāi)區(qū)間暂刘,a{1,}是合法的,表示找到任何a相連的字符串捂刺。
(8)判斷符號(hào)(谣拣?)
這個(gè)符號(hào)的含義和{0,1}完全相同,123?4族展,表示匹配1234或者124森缠;
(9)統(tǒng)配符號(hào)(*)
這個(gè)符號(hào)的含義和{0,}相同,比如.* 表示通配一切字符串仪缸。
(10)+符號(hào)
這個(gè)符號(hào)和{1,}相同贵涵。
(11)或符號(hào)(|)
“|”符號(hào)表示或的關(guān)系,比如abc|edf恰画,表示找到abc或者def
(12)組合(())
小括號(hào)在正則表達(dá)式中表示組合独悴,比如(a|b|c)d,表示找到ad锣尉,bd刻炒,cd,可以將小括號(hào)的作用理解為優(yōu)先級(jí)自沧。
(13)單詞邊界(\b)
\b表示單詞的邊界坟奥,比如\b[a-z]{3}\b,表示匹配一個(gè)三個(gè)字母的小寫(xiě)單詞拇厢。
(14)行邊界(^ $)
單單的一個(gè)^符號(hào)表示的是行的開(kāi)頭爱谁,$表示行的結(jié)束。
注意:
[^]是非法的孝偎,[$]表示匹配一個(gè)$符號(hào)访敌。
三、做些小總結(jié)
上面說(shuō)了這么多正則表達(dá)式的語(yǔ)法規(guī)則衣盾,我們現(xiàn)在來(lái)做下總結(jié):
1寺旺、幾個(gè)概念:
1、字面值:直接查找的字符势决,比如123阻塑,avb。
2果复、字符類(lèi):描述字符的一些屬性陈莽,比如[123],[a-z],\d,\w,\s,.。
3、乘法集:簡(jiǎn)化表達(dá)式走搁,比如{0,3},?,+,*独柑。
4、或和組合:比如(a|b|v)私植。
5群嗤、單詞,行的邊界\b ^ $
2兵琳、元字符列表
. \ [ ] { }? ? * + | ( ) ^ $
3、字符類(lèi)中元字符列表
[ ] \ - ^
四骇径、一個(gè)特別重要的字符
最后躯肌,還有一個(gè)特別特別重要的字符我們沒(méi)考慮到,如果我們要查找元字符怎么辦破衔,在正則表達(dá)式中還有一個(gè)轉(zhuǎn)義字符"\"清女,如果我們要查找. 只要查找\. 同理\[\]是查找"[]"這個(gè)字符串。如果要查找"\"晰筛,再加一個(gè)轉(zhuǎn)義字符就好:\\嫡丙。