re正則表達式——python

使用形式化模式搜索和修改文本逃顶。python中正則表達式通過re模塊使用語法以per語言語法為基礎(chǔ)弊决。

查找文本中的模式

re最常見的用法就是搜索文本中的模式危融。 search()函數(shù)取模式和要掃描的文本作為輸入陵刹,如果找到這個模式則返回一個match對象啃洋。如果未找到模式,search()將返回None遍希。
每個match對象包含有關(guān)匹配性質(zhì)的性質(zhì)的信息等曼,包括原輸入字符串,使用的正則表達式凿蒜,以及模式在原字符串中出現(xiàn)的位置。
start()可以給出字符串中的相應(yīng)索引胁黑,
end()方法給出字符串中的相應(yīng)索引废封,指示與模式匹配的文本在字符串中出現(xiàn)位置
例如:

#!/usr/bin/env python

import re

pattern = 'this'
text = 'Does this text matcht the pattern?'
match = re.search(pattern,text)
s = match.start()
e = match.end()

print 'start in %s' % s
print 'end in %s' % e
print 'Found "%s"\nin "%s"\nfrom %d to %d ("%s")' % (match.re.pattern,match.string,s,e,text[s:e])
print text
print text[s:e]

re包含一些高級模塊用于處理作為文本字符串的正則表達式,不過對于對于過程序頻繁使用的表達式丧蘸,編譯這些表達式會更高效漂洋。compile()會把正則表達式編譯成一個RegexObject對象如下:
search()用來查找字面量文本,字符串的單個實例
力喷,findall()函數(shù)返回輸入中與模式匹配而不重疊的所有子串刽漂。
可以使用5種方式表示重復(fù),表示方法如下:
× 表示0次或多次
(允許一個模式重復(fù)0次弟孟,匹配不存在情況

  • 表示至少匹配一次
    贝咙? 表示0次或一次
    {n} 表示出現(xiàn)指定的次數(shù)
    {m,n} 表示至少出現(xiàn)m次,最多出現(xiàn)m次
    [ab] 表示a或b
    [^] 表示禁止查找相應(yīng)字符
    python中還可以使用轉(zhuǎn)譯 碼拂募,主要轉(zhuǎn)譯碼如下:
    \d 一個數(shù)字
    \D 一個非數(shù)字
    \s 一個空白符
    \S 一個非空白符
    \w 一個字母數(shù)字
    \W 一個非字母數(shù)字
    ^ 字符串或行的開始
    $ 字符菜或行的結(jié)束
    \A 字符串開始
    \Z 字符串結(jié)束
    \b 一個單詞開頭或末尾的空串
    \B 不再單詞開頭或結(jié)尾的空串
    限制搜索
    搜索可以使用re.match和re.search()庭猩,
    re.match()
    僅當(dāng)搜索對象位于字符串最前面時才能有效識別,而search可以隨時找到他陈症。

用組解析匹配

使用group()可以得到某個組織的匹配蔼水,如果使用分組來查找字符串的各部分不過結(jié)果中并不需要某些與組匹配的部分,此時group()會很有用录肯。
示例代碼如下:

text = 'this is some text -- with punctuation.'
>>> print 'input text   :', text
input text  : this is some text -- with punctuation.
>>> regex = re.compile(r'(\bt\w+)\W+(\w+)')
>>> match = regex.search(text)
>>> print 'entire match         :', match.group(0)
entire match        : this is
>>> print 'entire match         :', match.group(1)
entire match        : this
>>> print 'entire match         :', match.group(2)
entire match        : is
>>> print 'entire match         :', match.group(3)
entire match        :

第0組表示與整個表達式匹配的字符串趴腋,子組按其左小括號在表達式中出現(xiàn)順序重1開始標(biāo)號。
分組可以設(shè)置一個名字稱命名組語法:(?P<name>pattern)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末优炬,一起剝皮案震驚了整個濱河市颁井,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌穿剖,老刑警劉巖蚤蔓,帶你破解...
    沈念sama閱讀 212,542評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異糊余,居然都是意外死亡秀又,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,596評論 3 385
  • 文/潘曉璐 我一進店門贬芥,熙熙樓的掌柜王于貴愁眉苦臉地迎上來吐辙,“玉大人,你說我怎么就攤上這事蘸劈』杷眨” “怎么了?”我有些...
    開封第一講書人閱讀 158,021評論 0 348
  • 文/不壞的土叔 我叫張陵威沫,是天一觀的道長贤惯。 經(jīng)常有香客問我,道長棒掠,這世上最難降的妖魔是什么孵构? 我笑而不...
    開封第一講書人閱讀 56,682評論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮烟很,結(jié)果婚禮上颈墅,老公的妹妹穿的比我還像新娘。我一直安慰自己雾袱,他們只是感情好恤筛,可當(dāng)我...
    茶點故事閱讀 65,792評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著芹橡,像睡著了一般毒坛。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上僻族,一...
    開封第一講書人閱讀 49,985評論 1 291
  • 那天粘驰,我揣著相機與錄音,去河邊找鬼述么。 笑死蝌数,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的度秘。 我是一名探鬼主播顶伞,決...
    沈念sama閱讀 39,107評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼饵撑,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了唆貌?” 一聲冷哼從身側(cè)響起滑潘,我...
    開封第一講書人閱讀 37,845評論 0 268
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎锨咙,沒想到半個月后语卤,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,299評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡酪刀,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,612評論 2 327
  • 正文 我和宋清朗相戀三年粹舵,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片骂倘。...
    茶點故事閱讀 38,747評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡眼滤,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出历涝,到底是詐尸還是另有隱情诅需,我是刑警寧澤,帶...
    沈念sama閱讀 34,441評論 4 333
  • 正文 年R本政府宣布荧库,位于F島的核電站堰塌,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏分衫。R本人自食惡果不足惜蔫仙,卻給世界環(huán)境...
    茶點故事閱讀 40,072評論 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望丐箩。 院中可真熱鬧,春花似錦恤煞、人聲如沸屎勘。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,828評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽概漱。三九已至,卻和暖如春喜喂,著一層夾襖步出監(jiān)牢的瞬間瓤摧,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,069評論 1 267
  • 我被黑心中介騙來泰國打工玉吁, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留照弥,地道東北人。 一個月前我還...
    沈念sama閱讀 46,545評論 2 362
  • 正文 我出身青樓进副,卻偏偏與公主長得像这揣,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,658評論 2 350

推薦閱讀更多精彩內(nèi)容

  • re模塊手冊 本模塊提供了和Perl里的正則表達式類似的功能给赞,不關(guān)是正則表達式本身還是被搜索的字符串机打,都可以...
    喜歡吃栗子閱讀 3,995評論 0 13
  • 1.正則表達式概述 正則表達式,又稱正規(guī)表示式片迅、正規(guī)表示法残邀、正規(guī)表達式、規(guī)則表達式柑蛇、常規(guī)表示法(英語:Regula...
    TENG書閱讀 838評論 0 1
  • 本文介紹了Python對于正則表達式的支持芥挣,包括正則表達式基礎(chǔ)以及Python正則表達式標(biāo)準(zhǔn)庫的完整介紹及使用示例...
    Python程序媛閱讀 1,347評論 0 22
  • Python中的re模塊--正則表達式 使用match從字符串開頭匹配 以匹配國內(nèi)手機號為例,通常手機號為11位唯蝶,...
    sunhaiyu閱讀 984評論 0 2
  • 語法 Markdown官網(wǎng)Markdown 語法說明獻給寫作者的 Markdown 新手指南 零九秀、插入代碼塊 PS...
    宇玄丶閱讀 796評論 0 1