python筆記(2) 正則表達(dá)式

1

正則表達(dá)式在Python中最好以r'xx'這樣的形式作為輸入哲银，這能避免反斜杠()使用混亂闰挡。以r開頭的字符串涕蜂，在python中是原始字符串(raw string)的意思馒稍。

特殊字符	解釋	例子
.	匹配所有字符不包括換行（如果DOTALL沒有設(shè)置的話）
^	匹配字符串的開頭，在MULTILINE模式下匹配每行的開頭
$	匹配字符串的結(jié)尾浅侨，在MULTILINE模式下匹配每個(gè)新行的開頭
*	匹配0或者多個(gè)前置正則表達(dá)式
+	匹配1或者多個(gè)前置正則表達(dá)式
?	匹配0或者1個(gè)前置正則表達(dá)式
*?, +?, ??	*,+,?都是貪婪的纽谒，加了？能改變著模式
m	匹配m個(gè)前置表達(dá)式
{m,n}	匹配m到n個(gè)前置表達(dá)式
{m,n}如输？	改變 {m,n}貪婪模式
\	轉(zhuǎn)義特殊字符
[]	定義匹配集合鼓黔，特殊字符（例如`(+*)`）在集合中失去特殊意義，使用-可以匹配一個(gè)序列不见，如果`-`放在集合的開頭或者轉(zhuǎn)義就能匹配`-`澳化，`^`放在開頭可以翻轉(zhuǎn)整個(gè)匹配，匹配`]`要么放在開頭要么轉(zhuǎn)義
豎線	或匹配
(...)	匹配括號(hào)中的字符串稳吮，形成一個(gè)組(````)
(?:...)	只匹配字符串但是不記錄匹配的內(nèi)容
(?P<name>...)	匹配之后形成一個(gè)組缎谷，組名為name
(?=...)	超前匹配
(?!...)	超前不匹配
(?<=...)	滯后匹配
(?<!...)	滯后不匹配
\number	引用一個(gè)組
\A	字符串的開頭匹配
\b	匹配空字符，在開始和結(jié)束處
\B	匹配空字符灶似，不在開始和結(jié)束處
\d	匹配數(shù)字0-9
\D	匹配非數(shù)字
\s	匹配空字符列林，相當(dāng)于[ \t\n\r\f\v]
\S	與\s相反
\w	[a-zA-Z0-9_]
\W	與\w相反
\Z	匹配字符串的結(jié)尾
\u	Unicode字符

貪婪模式

正則表達(dá)式默認(rèn)的情況是貪婪的，所謂貪婪就是盡量多匹配也可以叫最長(zhǎng)匹配酪惭，但是有時(shí)候這又是不合適的.

貪婪模式

2

正則表達(dá)式的使用希痴，可以先編譯正則表達(dá)式然后調(diào)用方法，也可以直接從re模塊調(diào)用方法春感。

pattern = re.compile(r'dongge')
m = pattern.match('dongge zeus')
#或者
m = re.match(r'dongge','dongge zeus')

`match`,`search`,`fullmatch`

這三個(gè)函數(shù)返回值都是match對(duì)象砌创，match從頭開始匹配虏缸，fullmatch匹配整個(gè)，search匹配第一個(gè)嫩实。

import re

test_str = 'abcd 1234 dongge'

pattern = re.compile(r'1234')

pattern.match(test_str)

pattern.search(test_str)

<_sre.SRE_Match object; span=(5, 9), match='1234'>

pattern.fullmatch(test_str)

p1 = re.compile(r'abcd')

p1.match(test_str)

<_sre.SRE_Match object; span=(0, 4), match='abcd'>

p1.search(test_str)

<_sre.SRE_Match object; span=(0, 4), match='abcd'>

p1.fullmatch(test_str)

p1.fullmatch(test_str,0,4)

<_sre.SRE_Match object; span=(0, 4), match='abcd'>

（注：上面的代碼來自jupyter notebook）

`split findall finditer`

這三個(gè)函數(shù)都返回一個(gè)列表刽辙。

分割字符串split

re.split('\W+', 'Words, words, words.')
['Words', 'words', 'words', '']
re.split('(\W+)', 'Words, words, words.')
['Words', ', ', 'words', ', ', 'words', '.', '']

注意代碼中的第三行，在正則表達(dá)式中加了分組之后舶赔，那個(gè)分割元素也成了返回值扫倡。

查找所有匹配的元素findall

test_str = 'dongge , dongge ,zeus'
re.findall(r'dongge',test_str)
['dongge', 'dongge']

迭代查找元素finditer

迭代查找

`sub subn`

sub(pattern, repl, string, count=0, flags=0)
這兩個(gè)函數(shù)有查找和替換功能，repl這個(gè)參數(shù)既可以是字符串也可以是一個(gè)函數(shù)竟纳，函數(shù)接收一個(gè)match object撵溃。

查找替換

3

Match Object這在上面多次提到，如果一個(gè)函數(shù)返回這個(gè)對(duì)象锥累，那么判斷值肯定就是True缘挑。
這個(gè)對(duì)象最重要的概念就是group，相關(guān)函數(shù)作用在下面截圖中桶略。

group

start([group]) end([group]) span([group])
這里三個(gè)函數(shù)都是用來計(jì)算group的位置语淘，span返回的一個(gè)元組（start，end）际歼，group默認(rèn)值是0惶翻。

Paste_Image.png

最后編輯于：2017.12.05 22:43:35

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市鹅心，隨后出現(xiàn)的幾起案子吕粗，更是在濱河造成了極大的恐慌，老刑警劉巖旭愧，帶你破解...
沈念sama閱讀 222,464評(píng)論 6贊 517
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件颅筋，死亡現(xiàn)場(chǎng)離奇詭異，居然都是意外死亡输枯，警方通過查閱死者的電腦和手機(jī)议泵，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 95,033評(píng)論 3贊 399
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來桃熄，“玉大人先口，你說我怎么就攤上這事◎卟Γ” “怎么了池充？”我有些...
開封第一講書人閱讀 169,078評(píng)論 0贊 362
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長(zhǎng)缎讼。經(jīng)常有香客問我收夸，道長(zhǎng)，這世上最難降的妖魔是什么血崭？我笑而不...
開封第一講書人閱讀 59,979評(píng)論 1贊 299
?港島之戀（遺憾婚禮）
正文為了忘掉前任卧惜，我火速辦了婚禮厘灼，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘咽瓷。我一直安慰自己设凹，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 69,001評(píng)論 6贊 398
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布茅姜。她就那樣靜靜地躺著闪朱，像睡著了一般。火紅的嫁衣襯著肌膚如雪钻洒。梳的紋絲不亂的頭發(fā)上奋姿，一...
開封第一講書人閱讀 52,584評(píng)論 1贊 312
城市分裂傳說
那天，我揣著相機(jī)與錄音素标，去河邊找鬼称诗。笑死，一個(gè)胖子當(dāng)著我的面吹牛头遭，可吹牛的內(nèi)容都是我干的寓免。我是一名探鬼主播，決...
沈念sama閱讀 41,085評(píng)論 3贊 422
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼计维，長(zhǎng)吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼袜香！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起鲫惶，我...
開封第一講書人閱讀 40,023評(píng)論 0贊 277
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤困鸥，失蹤者是張志新（化名）和其女友劉穎，沒想到半個(gè)月后剑按，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 46,555評(píng)論 1贊 319
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡澜术，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 38,626評(píng)論 3贊 342
?白月光啟示錄
正文我和宋清朗相戀三年艺蝴，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片鸟废。...
茶點(diǎn)故事閱讀 40,769評(píng)論 1贊 353
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡猜敢，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出盒延，到底是詐尸還是另有隱情缩擂，我是刑警寧澤，帶...
沈念sama閱讀 36,439評(píng)論 5贊 351
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布添寺，位于F島的核電站胯盯，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏计露。R本人自食惡果不足惜博脑，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 42,115評(píng)論 3贊 335
男人毒藥：我在死后第九天來索命
文/蒙蒙一憎乙、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧叉趣，春花似錦泞边、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,601評(píng)論 0贊 25
一樁弒父案阵谚，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)。三九已至烟具，卻和暖如春梢什，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背净赴。一陣腳步聲響...
開封第一講書人閱讀 33,702評(píng)論 1贊 274
情欲美人皮
我被黑心中介騙來泰國(guó)打工绳矩，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人玖翅。一個(gè)月前我還...
沈念sama閱讀 49,191評(píng)論 3贊 378
代替公主和親
正文我出身青樓翼馆，卻偏偏與公主長(zhǎng)得像，于是被迫代替她去往敵國(guó)和親金度。傳聞我的和親對(duì)象是個(gè)殘疾皇子应媚，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,781評(píng)論 2贊 361

python筆記(2) 正則表達(dá)式

1

貪婪模式

2

match,search,fullmatch

split findall finditer

sub subn

3

推薦閱讀更多精彩內(nèi)容

`match`,`search`,`fullmatch`

`split findall finditer`

`sub subn`