Python爬蟲入門酷师,如何使用正則表達(dá)式

按照之前的課程安排珠闰,此次課程應(yīng)該講python基礎(chǔ)第十六講爬蟲惜浅,但是如果正則一筆帶過(guò)大家可能還是沒(méi)辦法寫出自己想要實(shí)現(xiàn)的結(jié)果,所以把正則匹配詳解提前學(xué)習(xí)一下伏嗜,此次課程的學(xué)習(xí)路線會(huì)翻譯官方的re模塊文檔坛悉,并且篩選出重點(diǎn)知識(shí),完善文章中沒(méi)有的DEMO承绸。

學(xué)完此次課程裸影,我能做什么?

此次課程我們會(huì)系統(tǒng)的學(xué)習(xí)一下python的正則表達(dá)式军熏,以及可以根據(jù)自己的需求寫出正確的正則表達(dá)式轩猩。

學(xué)習(xí)此次課程,需要多久荡澎?

15-20分鐘均践,建議每個(gè)表達(dá)式跟著實(shí)踐一下,加深印象

課程內(nèi)容

Python中正則表達(dá)式 在 re 模塊 — Regular expression operations

Python中的re模塊提供與Perl類似的正則表達(dá)式匹配操作摩幔,但是要注意的是

需要注意的是:正則匹配時(shí) 表達(dá)式和要查詢的字符串可以是 unicode字符串彤委,也可是8-bit 字符串,但是兩種模式不可以混合使用或衡,也就是說(shuō) 表達(dá)式和要查詢的字符串必須一致焦影。

正則表達(dá)式特殊字符:

.(點(diǎn)): 默認(rèn)模式下,.可以匹配除了換行外的所有字符封断,如果需要匹配換行斯辰,可以傳參 re.DOTALL。

image

運(yùn)行結(jié)果:

image

^:只匹配字符串的開(kāi)始位置坡疼,可以使用re.MULTILINE(匹配多行)彬呻,匹配每一行的開(kāi)始位置。

image

代碼中每一行的開(kāi)頭都有ae字符串,所以開(kāi)啟多行模式后废岂,會(huì)匹配兩個(gè)結(jié)果祖搓。

運(yùn)行結(jié)果:

image

$ : 與^相反,匹配字符串的結(jié)束位置湖苞,可以使用re.MULTILINE(匹配多行)拯欧,匹配每一行的結(jié)尾位置。

image

運(yùn)行結(jié)果:

image
  • : 匹配0個(gè)或多個(gè)的表達(dá)式
image

運(yùn)行結(jié)果:

image

分析:c*表示财骨,匹配字符"c"0次或者多次镐作,也就是說(shuō)會(huì)匹配 a,ac。

  • : 匹配1個(gè)或多個(gè)的表達(dá)式
image

運(yùn)行結(jié)果:

image

分析:匹配字符a并且c一次或者多次隆箩,所以會(huì)匹配ac或者accccc

? : 匹配0次或1次该贾,非貪婪方式

image

運(yùn)行結(jié)果:

image

分析:表達(dá)式“ac?” 匹配字符a或者ac(?只匹配0次或者1次捌臊,比較懶惰杨蛋,不像上面的+或者*會(huì)匹配多次)

.? : 這三個(gè)特殊符號(hào)上面都講過(guò)了,.是匹配任意字符匹配0次或者多次理澎,連在一起使用也就是匹配全文了逞力,加上?號(hào)糠爬,非貪婪模式匹配寇荧,將盡可能少的匹配結(jié)果。

image

匹配結(jié)果:

image

小結(jié)

正則匹配的語(yǔ)法是通用的执隧,大家學(xué)會(huì)這些特殊字符揩抡,無(wú)論什么語(yǔ)言都能迅速入門。所以有必要好好學(xué)習(xí)一下镀琉。

接下來(lái)學(xué)習(xí)什么峦嗤?

Python的基礎(chǔ)教程暫時(shí)告一段落。

關(guān)注公眾號(hào)滚粟,回復(fù) Python基礎(chǔ) 下載全部代碼+PDF版電子書

image
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末寻仗,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子凡壤,更是在濱河造成了極大的恐慌署尤,老刑警劉巖,帶你破解...
    沈念sama閱讀 212,454評(píng)論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件亚侠,死亡現(xiàn)場(chǎng)離奇詭異曹体,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)硝烂,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,553評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門箕别,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人,你說(shuō)我怎么就攤上這事串稀〕祝” “怎么了?”我有些...
    開(kāi)封第一講書人閱讀 157,921評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵母截,是天一觀的道長(zhǎng)到忽。 經(jīng)常有香客問(wèn)我,道長(zhǎng)清寇,這世上最難降的妖魔是什么喘漏? 我笑而不...
    開(kāi)封第一講書人閱讀 56,648評(píng)論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮华烟,結(jié)果婚禮上翩迈,老公的妹妹穿的比我還像新娘。我一直安慰自己盔夜,他們只是感情好负饲,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,770評(píng)論 6 386
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著比吭,像睡著了一般绽族。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上衩藤,一...
    開(kāi)封第一講書人閱讀 49,950評(píng)論 1 291
  • 那天,我揣著相機(jī)與錄音涛漂,去河邊找鬼赏表。 笑死,一個(gè)胖子當(dāng)著我的面吹牛匈仗,可吹牛的內(nèi)容都是我干的瓢剿。 我是一名探鬼主播,決...
    沈念sama閱讀 39,090評(píng)論 3 410
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼悠轩,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼间狂!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起火架,我...
    開(kāi)封第一講書人閱讀 37,817評(píng)論 0 268
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤鉴象,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后何鸡,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體纺弊,經(jīng)...
    沈念sama閱讀 44,275評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,592評(píng)論 2 327
  • 正文 我和宋清朗相戀三年骡男,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了淆游。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,724評(píng)論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖犹菱,靈堂內(nèi)的尸體忽然破棺而出拾稳,到底是詐尸還是另有隱情,我是刑警寧澤腊脱,帶...
    沈念sama閱讀 34,409評(píng)論 4 333
  • 正文 年R本政府宣布熊赖,位于F島的核電站,受9級(jí)特大地震影響虑椎,放射性物質(zhì)發(fā)生泄漏震鹉。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,052評(píng)論 3 316
  • 文/蒙蒙 一捆姜、第九天 我趴在偏房一處隱蔽的房頂上張望传趾。 院中可真熱鬧,春花似錦泥技、人聲如沸浆兰。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 30,815評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)簸呈。三九已至,卻和暖如春店茶,著一層夾襖步出監(jiān)牢的瞬間蜕便,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 32,043評(píng)論 1 266
  • 我被黑心中介騙來(lái)泰國(guó)打工贩幻, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留轿腺,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,503評(píng)論 2 361
  • 正文 我出身青樓丛楚,卻偏偏與公主長(zhǎng)得像族壳,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子趣些,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,627評(píng)論 2 350

推薦閱讀更多精彩內(nèi)容

  • python的re模塊--細(xì)說(shuō)正則表達(dá)式 可能是東半球最詳細(xì)最全面的re教程,翻譯自官方文檔,因?yàn)楣俜轿臋n寫的是真...
    立而人閱讀 22,846評(píng)論 4 46
  • Python中的正則表達(dá)式(re) import rere.match #從開(kāi)始位置開(kāi)始匹配仿荆,如果開(kāi)頭沒(méi)有則無(wú)re...
    BigJeffWang閱讀 7,064評(píng)論 0 99
  • 搞懂Python 正則表達(dá)式用法 Python 正則表達(dá)式 正則表達(dá)式是一個(gè)特殊的字符序列,它能幫助你方便的檢查一...
    廈熱閱讀 1,572評(píng)論 0 2
  • re模塊手冊(cè) 本模塊提供了和Perl里的正則表達(dá)式類似的功能坏平,不關(guān)是正則表達(dá)式本身還是被搜索的字符串拢操,都可以...
    喜歡吃栗子閱讀 3,995評(píng)論 0 13
  • 【道德經(jīng)妙解序文】 道德經(jīng)流傳兩千五百多年,版本很多種功茴,為道德經(jīng)注解的超過(guò)一千種版本庐冯。雖注解的版本很多,一般人還是...
    愛(ài)相續(xù)閱讀 1,173評(píng)論 0 0