Python基礎(chǔ)語法 - 4 正則表達式和綜合實戰(zhàn)

1 正則表達式的符號和特殊字符
2 正則表達式的匹配和分組
3 re庫:compile match search findall sub split group groups groupdict

1. 正則表達式




有三個匹配模式:

  • 簡單匹配
  • 多個匹配
  • 匹配任意字符

2. 正則表達式的使用

a*bc 匹配0次或者多次a
a+bc 匹配1次或者多次a
a?bc 匹配0次或者1次a
a{3}bc 匹配3次a
a{2,5}bc 匹配2-5次a官册,優(yōu)先匹配最多次的

3. 正則表達式匹配同類型及邊界匹配

匹配同類型:

  • \d 數(shù)字
  • \w 數(shù)字和字符
  • \s 空格
    邊界匹配:
  • ^ 開頭
  • $ 結(jié)尾

4. 正則表達式匹配選項

使用\來進行轉(zhuǎn)義特殊字符
匹配選項:

  • [a-zA-Z]{3} 指定匹配3個
  • [^abc]{2} 指定不匹配這兩個

5. 正則表達式分組

重復(fù)一個字符串進行匹配時

  • () 匹配 如 (\d{1,3}.){3}\d{1,3}
  • 組號:


  • \1 \2 反向引用 如 He (l..e)s her \1r. 來匹配 He loves her lover. He likes her liker.

6. 貪婪和非貪婪模式

  • 貪婪模式掉弛,默認(rèn)是貪婪模式爱葵,盡可能多的去匹配 如 a.+b
  • 非貪婪模式辙谜,盡可能少的去匹配 a.+?b

7. 實戰(zhàn)匹配

  • 身份證匹配: (\d{6})(\d{4})((\d{2})(\d{2}))\d{1}([0-9]|X)
  • 郵箱正則匹配:[a-zA-Z0-9_-]+@[a-zA-Z0-9-]+(.[a-zA-Z0-9-]+)*(.[a-zA-Z]{2,5})

8. python re模塊

  • compile() 和 match()
import re
pattern = re.compile(r'Hello', re.I)
rest = pattern.match('hello word')
print(dir(rest))
print(rest.string)
  • findall() 和 search()
    findall()是找到所有匹配的內(nèi)容,返回一個list眼虱;search()是找到第一個匹配的內(nèi)容拒垃,返回一個對象
# 有兩種方式纺阔,一個是編譯,一個是不編譯
# 編譯
p = re.compile(r'[a-z]+', re.I)
rest = p.findall(content)
# 不編譯
all_rest = re.findall(r'[a-z]+', content, re.I)
  • match() 和 search()
    match是從開頭開始匹配即寡,如果匹配不是就返回空徊哑;search是只要找到就ok
  • group(), groups(), groupdict()
    group(1) 返回該位置的
    groups() 返回tuple
    groupdict() 返回命名的group
p = re.compile(r'(\d{6})(?P<year>\d{4})((?P<month>\d{2})(\d{2}))\d{1}([0-9]|X)')
id1 = '232321199410270017'
rest1 = p.search(id1)
print(rest1.group(4))
print(rest1.groups())
print(rest1.groupdict()) 
  • split() 和 sub()
    split(pattern, string, max=0) 分割匹配的字符(分隔符為匹配的字符)
    sub(pattern, replace, string, max) 替換匹配的字符
s = 'one1two2three'
p = re.compile(r'\d+')
rest = p.split(s, 2)
print(rest)
# 替換
s = 'one1two2three'
p = re.compile(r'\d+')
rest = p.sub('@', s)
# 替換位置
s1 = 'hello world'
p1 = re.compile(r'(\w+) (\w+)')
rest1 = p1.sub('r\2 \1', s1)
# 使用函數(shù)或者lambda來匹配
def f(m):
  return m.group(2).upper() + ' ' + m.group(1)
rest2 = p1.sub(f, s1)
rest3 = p1.sub(lambda m: m.group(2).upper() + ' ' + m.group(1), s1)

9. 實戰(zhàn)取圖片地址

import re
def test_image_url_extraction():
  with open('sample.html', encoding='utf-8') as f:
    html = f.read()
    p = re.compile(r'<img.+?src=\"(?P<src>.+?)\".+?>', re.M|re.I)
    list_img = p.findall(html)
    for i in list_img:
      print(i.replace('&amp;', '&'))
    # requests庫去爬蟲

10. 飛機大戰(zhàn)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市聪富,隨后出現(xiàn)的幾起案子莺丑,更是在濱河造成了極大的恐慌,老刑警劉巖墩蔓,帶你破解...
    沈念sama閱讀 219,110評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件梢莽,死亡現(xiàn)場離奇詭異,居然都是意外死亡钢拧,警方通過查閱死者的電腦和手機蟹漓,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,443評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來源内,“玉大人葡粒,你說我怎么就攤上這事∧さ觯” “怎么了嗽交?”我有些...
    開封第一講書人閱讀 165,474評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長颂斜。 經(jīng)常有香客問我夫壁,道長,這世上最難降的妖魔是什么沃疮? 我笑而不...
    開封第一講書人閱讀 58,881評論 1 295
  • 正文 為了忘掉前任盒让,我火速辦了婚禮梅肤,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘邑茄。我一直安慰自己姨蝴,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,902評論 6 392
  • 文/花漫 我一把揭開白布肺缕。 她就那樣靜靜地躺著左医,像睡著了一般。 火紅的嫁衣襯著肌膚如雪同木。 梳的紋絲不亂的頭發(fā)上浮梢,一...
    開封第一講書人閱讀 51,698評論 1 305
  • 那天,我揣著相機與錄音彤路,去河邊找鬼秕硝。 笑死,一個胖子當(dāng)著我的面吹牛斩萌,可吹牛的內(nèi)容都是我干的缝裤。 我是一名探鬼主播,決...
    沈念sama閱讀 40,418評論 3 419
  • 文/蒼蘭香墨 我猛地睜開眼颊郎,長吁一口氣:“原來是場噩夢啊……” “哼憋飞!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起姆吭,我...
    開封第一講書人閱讀 39,332評論 0 276
  • 序言:老撾萬榮一對情侶失蹤榛做,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后内狸,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體检眯,經(jīng)...
    沈念sama閱讀 45,796評論 1 316
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,968評論 3 337
  • 正文 我和宋清朗相戀三年昆淡,在試婚紗的時候發(fā)現(xiàn)自己被綠了锰瘸。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,110評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡昂灵,死狀恐怖避凝,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情眨补,我是刑警寧澤管削,帶...
    沈念sama閱讀 35,792評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站撑螺,受9級特大地震影響含思,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,455評論 3 331
  • 文/蒙蒙 一含潘、第九天 我趴在偏房一處隱蔽的房頂上張望饲做。 院中可真熱鬧,春花似錦调鬓、人聲如沸艇炎。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,003評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至居砖,卻和暖如春虹脯,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背奏候。 一陣腳步聲響...
    開封第一講書人閱讀 33,130評論 1 272
  • 我被黑心中介騙來泰國打工循集, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人蔗草。 一個月前我還...
    沈念sama閱讀 48,348評論 3 373
  • 正文 我出身青樓咒彤,卻偏偏與公主長得像,于是被迫代替她去往敵國和親咒精。 傳聞我的和親對象是個殘疾皇子镶柱,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,047評論 2 355