Python獲取豆瓣Top250電影

豆瓣已經(jīng)列出了評(píng)分排行前250的電影,我需要做的嘀倒,只是用Python編寫一個(gè)非常簡(jiǎn)單的程序屈留,獲得這些電影對(duì)應(yīng)的「鏈接」和「標(biāo)題」局冰,然后打印出來(lái)即可。

運(yùn)行結(jié)果

運(yùn)行結(jié)果.jpg

編碼思路

用爬蟲(chóng)爬取給定初始鏈接的信息灌危,然后用正則表達(dá)式篩選自己需要的信息就好了康二。主要是編寫需要重復(fù)調(diào)用的函數(shù),然后再重復(fù)調(diào)用即可勇蝙。

源碼

#coding:utf-8
#--------------------------------------------------
#   程序:獲取豆瓣top250電影
#   作者:lazyboy
#   博客:http://blog.lazyboy.co/
#   日期:2014-12-20
#   語(yǔ)言:Python 2.7
#--------------------------------------------------
import requests,re
# 初始鏈接
url = 'http://movie.douban.com/top250'
# 函數(shù)沫勿,獲得電影鏈接和標(biāo)題
def getlists(u):
    links = []
    titles = []
    r = requests.get(u)
    if r.status_code == 200:
        t = r.content
        p = re.compile('(?<=<ol\sclass="grid_view">)(.|\n)+?(?=</ol>)')
        m = p.search(t)
        if m:
            alllists = m.group()
            p2 = re.compile('(?<=</li>)\n.+?(?=<li>)')
            m2 = p2.split(alllists)
            p3 = re.compile('(?<=href=").+?(?=")')
            p4 = re.compile('(?<=class="title">).+?(?=</span>)')
            for i in range(0,len(m2)):
                m3 = p3.search(m2[i])
                m4 = p4.search(m2[i])
                if m3 and m4:
                    links.append(m3.group())
                    titles.append(m4.group())
            return (links,titles)
# 函數(shù),獲得下一頁(yè)網(wǎng)頁(yè)鏈接
def nexturl(u):
    r = requests.get(u)
    if r.status_code == 200:
        t = r.content
        p = re.compile('(?<=rel="next"\shref=").+?(?=")')
        m = p.search(t)
        if m:
            return 'http://movie.douban.com/top250' + m.group()
l,t = getlists(url)
# 當(dāng)存在下一頁(yè)鏈接時(shí)味混,運(yùn)行
while nexturl(url):
    url = nexturl(url)
    a,b = getlists(url)
    l,t = l+a,t+b
# 最終鏈接保存在數(shù)組l产雹,標(biāo)題保存在數(shù)組t

# 按照給定格式打印出來(lái)
for i in range(0,len(l)):
    print '%s. [%s](%s)' % (str(i+1),t[i].decode('utf-8').encode('gbk'),l[i])

知識(shí)點(diǎn)拓展

  1. Python requests的安裝與簡(jiǎn)單運(yùn)用
  2. Python正則表達(dá)式指南
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市翁锡,隨后出現(xiàn)的幾起案子蔓挖,更是在濱河造成了極大的恐慌,老刑警劉巖馆衔,帶你破解...
    沈念sama閱讀 217,542評(píng)論 6 504
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件瘟判,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡角溃,警方通過(guò)查閱死者的電腦和手機(jī)拷获,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,822評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)开镣,“玉大人刀诬,你說(shuō)我怎么就攤上這事⌒安疲” “怎么了陕壹?”我有些...
    開(kāi)封第一講書人閱讀 163,912評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)树埠。 經(jīng)常有香客問(wèn)我糠馆,道長(zhǎng),這世上最難降的妖魔是什么怎憋? 我笑而不...
    開(kāi)封第一講書人閱讀 58,449評(píng)論 1 293
  • 正文 為了忘掉前任又碌,我火速辦了婚禮,結(jié)果婚禮上绊袋,老公的妹妹穿的比我還像新娘毕匀。我一直安慰自己,他們只是感情好癌别,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,500評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布皂岔。 她就那樣靜靜地躺著,像睡著了一般展姐。 火紅的嫁衣襯著肌膚如雪躁垛。 梳的紋絲不亂的頭發(fā)上剖毯,一...
    開(kāi)封第一講書人閱讀 51,370評(píng)論 1 302
  • 那天,我揣著相機(jī)與錄音教馆,去河邊找鬼逊谋。 笑死,一個(gè)胖子當(dāng)著我的面吹牛土铺,可吹牛的內(nèi)容都是我干的胶滋。 我是一名探鬼主播,決...
    沈念sama閱讀 40,193評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼舒憾,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼镀钓!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起镀迂,我...
    開(kāi)封第一講書人閱讀 39,074評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤丁溅,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后探遵,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體窟赏,經(jīng)...
    沈念sama閱讀 45,505評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,722評(píng)論 3 335
  • 正文 我和宋清朗相戀三年箱季,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了涯穷。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,841評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡藏雏,死狀恐怖拷况,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情掘殴,我是刑警寧澤赚瘦,帶...
    沈念sama閱讀 35,569評(píng)論 5 345
  • 正文 年R本政府宣布奏寨,位于F島的核電站起意,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏病瞳。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,168評(píng)論 3 328
  • 文/蒙蒙 一亲善、第九天 我趴在偏房一處隱蔽的房頂上張望逗柴。 院中可真熱鬧,春花似錦、人聲如沸于购。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 31,783評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)炕矮。三九已至,卻和暖如春档痪,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 32,918評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留救鲤,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,962評(píng)論 2 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像稀颁,于是被迫代替她去往敵國(guó)和親芬失。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,781評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容

  • 聲明:本文講解的實(shí)戰(zhàn)內(nèi)容匾灶,均僅用于學(xué)習(xí)交流棱烂,請(qǐng)勿用于任何商業(yè)用途! 一阶女、前言 強(qiáng)烈建議:請(qǐng)?jiān)陔娔X的陪同下颊糜,閱讀本文...
    Bruce_Szh閱讀 12,704評(píng)論 6 28
  • Spring Cloud為開(kāi)發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見(jiàn)模式的工具(例如配置管理,服務(wù)發(fā)現(xiàn)秃踩,斷路器衬鱼,智...
    卡卡羅2017閱讀 134,656評(píng)論 18 139
  • -(void)createWeekBtn { _weekAry =@[@"周一",@"周二",@"周三",@"周四...
    Kloar閱讀 412評(píng)論 0 0
  • 無(wú)趣乏味的自己, 我身上有很多毛病憔杨,我自己有的察覺(jué)到了鸟赫,有的沒(méi)有。 我不喜歡刷牙消别,我不喜歡運(yùn)動(dòng)惯疙。 短視,鼠目寸光妖啥。...
    井底的動(dòng)物閱讀 215評(píng)論 0 0
  • 和好友相聚總是讓人開(kāi)心又幸福霉颠,周末的早晨,享受著賴床的感覺(jué)荆虱,東方發(fā)消息說(shuō)蒿偎,她和對(duì)象兩個(gè)人過(guò)來(lái)找我,還說(shuō)帶我散...
    春夏AI閱讀 310評(píng)論 0 1