2.爬蟲-正則表達(dá)式

正則表達(dá)式在線測試工具:http://tool.oschina.net/regex/#

常見匹配模式

正則:

常規(guī)匹配

泛匹配 . *

匹配目標(biāo)

group(n):第n個用小括號括起來的

貪婪匹配

可以看到group(1)只匹配到了‘7’一個數(shù)字潜沦,因?yàn)?*會盡可能多的匹配字符春瞬,所以稱為貪婪模式匹配

非貪婪匹配

這次group(1)匹配到了‘1234567’,為什么呢,兔朦?指定匹配模式為非貪婪模式,會盡可能匹配少的字符。

匹配模式

為什么結(jié)果時None呢?因?yàn)門his后面有個換行符拆魏,而.*不能匹配換行符。但是當(dāng)我們指定匹配模式慈俯,就可以匹配到換行符了渤刃。

轉(zhuǎn)義

匹配特殊字符是需要使用\進(jìn)行轉(zhuǎn)義

總結(jié):盡量使用泛匹配、使用括號得到匹配目標(biāo)贴膘、盡量使用非貪婪模式卖子、有換行符就用re.S


如圖刑峡,同樣的字符串洋闽,同樣的正則表達(dá)式,re.match匹配不出結(jié)果氛琢,因?yàn)閞e.match是從字符串的起始位置開始匹配的喊递。

總結(jié):為了方便随闪,能用re.search就不用re.match阳似。

匹配練習(xí)

目的 匹配齊秦,往事隨風(fēng)铐伴。

匹配任賢齊 滄海一聲笑

去掉匹配模式re.S查看一下匹配到了什么

匹配所有含有超鏈接的內(nèi)容:

匹配所有歌名:

把數(shù)字替換成‘替換’兩個字

替換的同時保存原字符串本身撮奏,\1 代表group(1)

使用sub和findall結(jié)合匹配所有歌名:

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市当宴,隨后出現(xiàn)的幾起案子畜吊,更是在濱河造成了極大的恐慌,老刑警劉巖户矢,帶你破解...
    沈念sama閱讀 221,273評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件玲献,死亡現(xiàn)場離奇詭異,居然都是意外死亡梯浪,警方通過查閱死者的電腦和手機(jī)捌年,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,349評論 3 398
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來挂洛,“玉大人礼预,你說我怎么就攤上這事÷簿ⅲ” “怎么了托酸?”我有些...
    開封第一講書人閱讀 167,709評論 0 360
  • 文/不壞的土叔 我叫張陵褒颈,是天一觀的道長。 經(jīng)常有香客問我励堡,道長谷丸,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,520評論 1 296
  • 正文 為了忘掉前任念秧,我火速辦了婚禮淤井,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘摊趾。我一直安慰自己币狠,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,515評論 6 397
  • 文/花漫 我一把揭開白布砾层。 她就那樣靜靜地躺著漩绵,像睡著了一般。 火紅的嫁衣襯著肌膚如雪肛炮。 梳的紋絲不亂的頭發(fā)上止吐,一...
    開封第一講書人閱讀 52,158評論 1 308
  • 那天,我揣著相機(jī)與錄音侨糟,去河邊找鬼碍扔。 笑死,一個胖子當(dāng)著我的面吹牛秕重,可吹牛的內(nèi)容都是我干的不同。 我是一名探鬼主播,決...
    沈念sama閱讀 40,755評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼溶耘,長吁一口氣:“原來是場噩夢啊……” “哼二拐!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起凳兵,我...
    開封第一講書人閱讀 39,660評論 0 276
  • 序言:老撾萬榮一對情侶失蹤百新,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后庐扫,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體饭望,經(jīng)...
    沈念sama閱讀 46,203評論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,287評論 3 340
  • 正文 我和宋清朗相戀三年形庭,在試婚紗的時候發(fā)現(xiàn)自己被綠了铅辞。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,427評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡碘勉,死狀恐怖巷挥,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情验靡,我是刑警寧澤倍宾,帶...
    沈念sama閱讀 36,122評論 5 349
  • 正文 年R本政府宣布雏节,位于F島的核電站,受9級特大地震影響高职,放射性物質(zhì)發(fā)生泄漏钩乍。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,801評論 3 333
  • 文/蒙蒙 一怔锌、第九天 我趴在偏房一處隱蔽的房頂上張望寥粹。 院中可真熱鬧,春花似錦埃元、人聲如沸涝涤。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,272評論 0 23
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽阔拳。三九已至,卻和暖如春类嗤,著一層夾襖步出監(jiān)牢的瞬間糊肠,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,393評論 1 272
  • 我被黑心中介騙來泰國打工遗锣, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留货裹,地道東北人。 一個月前我還...
    沈念sama閱讀 48,808評論 3 376
  • 正文 我出身青樓精偿,卻偏偏與公主長得像弧圆,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子还最,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,440評論 2 359

推薦閱讀更多精彩內(nèi)容

  • python的re模塊--細(xì)說正則表達(dá)式 可能是東半球最詳細(xì)最全面的re教程,翻譯自官方文檔,因?yàn)楣俜轿臋n寫的是真...
    立而人閱讀 22,901評論 4 46
  • Python中的正則表達(dá)式(re) import rere.match #從開始位置開始匹配墓阀,如果開頭沒有則無re...
    BigJeffWang閱讀 7,087評論 0 99
  • re模塊手冊 本模塊提供了和Perl里的正則表達(dá)式類似的功能毡惜,不關(guān)是正則表達(dá)式本身還是被搜索的字符串拓轻,都可以...
    喜歡吃栗子閱讀 4,012評論 0 13
  • 搞懂Python 正則表達(dá)式用法 Python 正則表達(dá)式 正則表達(dá)式是一個特殊的字符序列,它能幫助你方便的檢查一...
    廈熱閱讀 1,585評論 0 2
  • 正則表達(dá)式经伙、re模塊扶叉、匹配單個字符、匹配多個字符帕膜、匹配開頭結(jié)尾枣氧、匹配分組、re模塊的高級用法垮刹、python貪婪和非...
    Cestine閱讀 1,483評論 0 1