re模塊

匹配標(biāo)簽

import re
ret = re.search('<(?P<tag_name>\w+)>\w+</(?P=tag_name)>','<h1>hello</h1>')
#還可以在分組中利用?P<name>的形式給分組起名字
#獲取的匹配結(jié)果可以直接用group('名字')拿到對(duì)應(yīng)的值
print(ret.group())
print(ret.group('tag_name'))
# -------------------------
ret = re.search(r'<(\w+)>\w+</\1>','<h1>hello</h1>')
#如果不給分組起名字,也可以用\序號(hào)來(lái)找到對(duì)應(yīng)的組,表說(shuō)要找的內(nèi)容和前面的組的內(nèi)容一致
#獲取的匹配結(jié)果可以直接用group(序號(hào))拿到對(duì)應(yīng)的值
print(ret.group())
print(ret.group(1))

匹配整數(shù)

import re
ret = re.findall(r'\d+',"1-2*(60+(-40.35/5)-(-4*3))")
print(ret)
import re
ret = re.findall(r'-?\d+\.\d*|(-?\d+)',"1-2*(60+(-40.35/5)-(-4*3))")
print(ret)
ret.remove('')
print(ret)
數(shù)字匹配

數(shù)字匹配

# 3.數(shù)字匹配
# 1.匹配一段文本中的每行的時(shí)間字符串师妙,比如’1990-07-12‘

# 1.分別取出一年的十二個(gè)月:
while True:
    cmd = input('請(qǐng)輸入月份:>>')
    if re.match(r'^(0?[1-9]|1[0-2])$',cmd):
        print('格式正確')
    else:
        print('格式錯(cuò)誤')

# 2.
ret =re.match(r'^(0?[1-9]|1[0-2])$','11')
print(ret.group())

# 一個(gè)月的31天
ret = re.match(r'^((0?[1-9])|((1|2)[0-9])|30|31)$','31')#從頭匹配
print(ret.group())

# 匹配QQ號(hào)
while True:
    cmd = input('請(qǐng)輸入你扣扣號(hào):>>')
    if re.match(r'^[1-9][0-9]{4,10}$',cmd):
        print('輸入正確')
    else:
        print('輸入錯(cuò)誤')

# 浮點(diǎn)數(shù)
ret = re.match(r'-?\d+\.?\d*','21.5')
print(ret.group())
數(shù)字匹配

爬蟲(chóng)練習(xí)

import requests

import re
import json

def getPage(url):

    response=requests.get(url)
    return response.text

def parsePage(s):
    
    com=re.compile('<div class="item">.*?<div class="pic">.*?<em .*?>(?P<id>\d+).*?<span class="title">(?P<title>.*?)</span>'
                   '.*?<span class="rating_num" .*?>(?P<rating_num>.*?)</span>.*?<span>(?P<comment_num>.*?)評(píng)價(jià)</span>',re.S)

    ret=com.finditer(s)
    for i in ret:
        yield {
            "id":i.group("id"),
            "title":i.group("title"),
            "rating_num":i.group("rating_num"),
            "comment_num":i.group("comment_num"),
        }

def main(num):

    url='https://movie.douban.com/top250?start=%s&filter='%num
    response_html=getPage(url)
    ret=parsePage(response_html)
    print(ret)
    f=open("move_info7","a",encoding="utf8")

    for obj in ret:
        print(obj)
        data=json.dumps(obj,ensure_ascii=False)
        f.write(data+"\n")

if __name__ == '__main__':
    count=0
    for i in range(10):
        main(count)
        count+=25
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末市咆,一起剝皮案震驚了整個(gè)濱河市稻薇,隨后出現(xiàn)的幾起案子轴合,更是在濱河造成了極大的恐慌伊脓,老刑警劉巖晓殊,帶你破解...
    沈念sama閱讀 216,402評(píng)論 6 499
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件断凶,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡巫俺,警方通過(guò)查閱死者的電腦和手機(jī)认烁,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,377評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人却嗡,你說(shuō)我怎么就攤上這事舶沛。” “怎么了窗价?”我有些...
    開(kāi)封第一講書(shū)人閱讀 162,483評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵如庭,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我撼港,道長(zhǎng)坪它,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,165評(píng)論 1 292
  • 正文 為了忘掉前任帝牡,我火速辦了婚禮往毡,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘否灾。我一直安慰自己卖擅,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,176評(píng)論 6 388
  • 文/花漫 我一把揭開(kāi)白布墨技。 她就那樣靜靜地躺著惩阶,像睡著了一般。 火紅的嫁衣襯著肌膚如雪扣汪。 梳的紋絲不亂的頭發(fā)上断楷,一...
    開(kāi)封第一講書(shū)人閱讀 51,146評(píng)論 1 297
  • 那天,我揣著相機(jī)與錄音崭别,去河邊找鬼冬筒。 笑死,一個(gè)胖子當(dāng)著我的面吹牛茅主,可吹牛的內(nèi)容都是我干的舞痰。 我是一名探鬼主播,決...
    沈念sama閱讀 40,032評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼诀姚,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼响牛!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起赫段,我...
    開(kāi)封第一講書(shū)人閱讀 38,896評(píng)論 0 274
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤呀打,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后糯笙,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體贬丛,經(jīng)...
    沈念sama閱讀 45,311評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,536評(píng)論 2 332
  • 正文 我和宋清朗相戀三年给涕,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了豺憔。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片额获。...
    茶點(diǎn)故事閱讀 39,696評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖焕阿,靈堂內(nèi)的尸體忽然破棺而出咪啡,到底是詐尸還是另有隱情首启,我是刑警寧澤暮屡,帶...
    沈念sama閱讀 35,413評(píng)論 5 343
  • 正文 年R本政府宣布,位于F島的核電站毅桃,受9級(jí)特大地震影響褒纲,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜钥飞,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,008評(píng)論 3 325
  • 文/蒙蒙 一莺掠、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧读宙,春花似錦彻秆、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,659評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至桦锄,卻和暖如春扎附,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背结耀。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,815評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工留夜, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人图甜。 一個(gè)月前我還...
    沈念sama閱讀 47,698評(píng)論 2 368
  • 正文 我出身青樓碍粥,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親黑毅。 傳聞我的和親對(duì)象是個(gè)殘疾皇子嚼摩,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,592評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容

  • re模塊手冊(cè) 本模塊提供了和Perl里的正則表達(dá)式類似的功能,不關(guān)是正則表達(dá)式本身還是被搜索的字符串博肋,都可以...
    喜歡吃栗子閱讀 4,002評(píng)論 0 13
  • 未經(jīng)允許低斋,不得擅自改動(dòng)和轉(zhuǎn)載 正則表達(dá)式須知 正則表達(dá)式是用來(lái)匹配字符串非常強(qiáng)大的工具,在其他編程語(yǔ)言中同樣有正則...
    雙愚閱讀 1,374評(píng)論 0 9
  • Python中的re模塊--正則表達(dá)式 使用match從字符串開(kāi)頭匹配 以匹配國(guó)內(nèi)手機(jī)號(hào)為例匪凡,通常手機(jī)號(hào)為11位膊畴,...
    sunhaiyu閱讀 986評(píng)論 0 2
  • 該筆記整理自Wesley Chun著,孫波翔病游、李斌唇跨、李晗譯稠通,人民郵電出版社出版的《Python核心編程》第3版,還...
    hufengreborn閱讀 2,041評(píng)論 0 2
  • 為什么要學(xué)正則表達(dá)式 實(shí)際上爬蟲(chóng)一共就四個(gè)主要步驟: 明確目標(biāo) (要知道你準(zhǔn)備在哪個(gè)范圍或者網(wǎng)站去搜索) 爬 (將...
    彡廿閱讀 865評(píng)論 0 1