鳥與蟲(五)豆瓣我想看高分電影

  • 哈羅有見面了诸蚕,幾天剛剛驗(yàn)收學(xué)校仿站項(xiàng)目步势,就來趕博客,上課趕得哦背犯。

  • 我的爬蟲原則: 爬蟲就要有禮貌坏瘩,爬蟲與反爬蟲的戰(zhàn)爭很奇妙。呸漠魏,很費(fèi)精神倔矾。

  • 話不多說上代碼


'''
    這次是抓取豆瓣網(wǎng)的前100部高分影片
    本代碼作者:高佳樂


'''

import requests                                     ##導(dǎo)入requests庫
import json                                         ##導(dǎo)入json庫,對json的一個(gè)解析
import time                                         ##還是那句話柱锹,爬蟲要有禮貌


#######################################################定義一個(gè)類##############################################################################

class spring():                                     ##定義類哪自,
    def __init__(self):                             ##定義構(gòu)造函數(shù)
        self.start = 0                              ##定義初始開始數(shù)
        self.limit = 100                            ##初始電影數(shù)量
        self.type = 1                               ##初始類型,下邊是地址的url
        self.url='https://movie.douban.com/j/chart/top_list?type='+str(self.type)+'&interval_id=100%3A90&action=&start='+str(self.start)+'&limit='+str(self.limit)
        return

    ####################################################獲取HTML#################################################################################

    def html(self,url):                             ##定義一個(gè)獲取html_text的方法封裝
        html = requests.get(url)                    ##html是獲取url
        html_text = html.text                       ##html_text是html的寫出
        html_text = json.loads(html_text)           ##html_text是json解析再一次
        # html_text = json.dumps(html_text,sort_keys=True,indent=4,ensure_ascii=False)           ##格式化輸出實(shí)驗(yàn)一遍
        # for i in html_text:                       ##循環(huán)輸出以便觀看
        #     print(i)
        return html_text                            ##返回json解析后的html_text格式

    ########################################################操作##################################################################################

    def select(self):                               ##這個(gè)方法就是開始解析后的json的格式后然后獲取電影的標(biāo)題禁熏,封面壤巷,分?jǐn)?shù)啥的。
        ##選擇類型瞧毙,上邊的url是types切換數(shù)字的胧华,type就是電影類型。
        self.type = input('請輸入要查詢的代碼,默認(rèn)是紀(jì)錄片:\n1-記錄片宙彪,11-劇情矩动,24-喜劇,5-動(dòng)作释漆,13-愛情悲没,17-科幻,25-動(dòng)畫\n10-懸疑灵汪,19-驚悚檀训,20-恐怖,23-短片享言,6-情色峻凫,26-同性,14-音樂览露,7-歌舞\n28-家庭荧琼,8-兒童,2-傳記,4-歷史命锄,22-戰(zhàn)爭堰乔,3-犯罪,27-西部脐恩,16-奇幻\n15-冒險(xiǎn)镐侯,12-災(zāi)難,29-武俠驶冒,30-古裝苟翻,18-運(yùn)動(dòng),31-黑色電影\n')
        print('正在獲取排行榜前100個(gè)電影資料骗污。')      ##輸出提示崇猫,本來打算給一個(gè)好看的等待條的狀態(tài),結(jié)果有點(diǎn)問題先這樣吧→_→
        i=1                                         ##這開始就是等待條的代碼
        while i<5:
            print('·',end='')
            time.sleep(0.5)
            i+=1
        print()                                     ##嘿需忿,這是等待條的結(jié)束诅炉,可以忽略
        url = self.url                              ##url是初始結(jié)構(gòu)的url,通過上邊type合成后的url
        html_text = self.html(url)                  ##獲取后的url的json的格式
        for i in html_text:                         ##因?yàn)楂@取后的會(huì)是一個(gè)列表屋厘,列表里邊是字典涕烧,所以要遍歷輸出字典
            ##分?jǐn)?shù)和星星
            rating = i['rating']                    ##字典的訪問方式,字典[鍵]擅这,下邊也是
            fenshu = rating[0]                      ##獲取到的是列表用索引
            xing = int(rating[1])/10
            ##第幾個(gè)
            rank = i['rank']
            ##封面
            cover_url = i['cover_url']
            ##類型
            types = i['types']
            types = ','.join(types)
            ##地點(diǎn)
            regions = i['regions']
            regions = ''.join(regions)
            ##電影名字
            title = i['title']
            ##詳細(xì)地址
            url = i['url']
            ##時(shí)間
            release_date = i['release_date']
            ##評論人數(shù)
            vote_count = i['vote_count']
            ##演員
            actors = i['actors']
            actors = ','.join(actors)               ##這里的演員返回的是一個(gè)列表澈魄,因?yàn)槭嵌鄠€(gè)演員,所以用join的函數(shù)仲翎,用法就是:連接符.join.列表啥的痹扇,就是用連接符把列表里邊的元素連接
            ##按格式輸出嘍
            print('第%s個(gè):\n封面:%s\n電影名:%s\n演員:%s\n%s-%s-%s\n星星:%s\n分?jǐn)?shù):%s\n評價(jià)人數(shù):%s\n詳情頁面:%s'%(rank,cover_url,title,actors,release_date,regions,types,xing,fenshu,vote_count,url))
            ##分解線
            print('\n','-'*200,'\n')
            time.sleep(1)                           ##爬蟲宗旨:有禮貌,慢慢爬



##########################################################################操作########################################################################

douban = spring()
douban.select()
  • 終于要進(jìn)入抓包解析動(dòng)態(tài)頁面的腳步了溯香,和靜態(tài)頁面感覺很奇妙鲫构。

  • 這會(huì)我也不太熟,就不多說啥了玫坛,怕誤人子弟结笨。

  • 就到這里吧,砸門下次見面湿镀。

  • 怎么可能炕吸,效果圖還沒放就再見,我沒放文檔里面勉痴,啊哈哈哈赫模。


    搜狗截圖20180710095534.png
  • 好了,現(xiàn)在蒸矛,砸門下次再見吧瀑罗。
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末胸嘴,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子斩祭,更是在濱河造成了極大的恐慌劣像,老刑警劉巖,帶你破解...
    沈念sama閱讀 212,332評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件摧玫,死亡現(xiàn)場離奇詭異耳奕,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)诬像,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,508評論 3 385
  • 文/潘曉璐 我一進(jìn)店門吮铭,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人颅停,你說我怎么就攤上這事÷尤” “怎么了癞揉?”我有些...
    開封第一講書人閱讀 157,812評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長溺欧。 經(jīng)常有香客問我喊熟,道長,這世上最難降的妖魔是什么姐刁? 我笑而不...
    開封第一講書人閱讀 56,607評論 1 284
  • 正文 為了忘掉前任芥牌,我火速辦了婚禮,結(jié)果婚禮上聂使,老公的妹妹穿的比我還像新娘壁拉。我一直安慰自己,他們只是感情好柏靶,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,728評論 6 386
  • 文/花漫 我一把揭開白布弃理。 她就那樣靜靜地躺著,像睡著了一般屎蜓。 火紅的嫁衣襯著肌膚如雪痘昌。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,919評論 1 290
  • 那天炬转,我揣著相機(jī)與錄音辆苔,去河邊找鬼。 笑死扼劈,一個(gè)胖子當(dāng)著我的面吹牛驻啤,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播测僵,決...
    沈念sama閱讀 39,071評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼街佑,長吁一口氣:“原來是場噩夢啊……” “哼谢翎!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起沐旨,我...
    開封第一講書人閱讀 37,802評論 0 268
  • 序言:老撾萬榮一對情侶失蹤森逮,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后磁携,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體褒侧,經(jīng)...
    沈念sama閱讀 44,256評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,576評論 2 327
  • 正文 我和宋清朗相戀三年谊迄,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了闷供。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,712評論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡统诺,死狀恐怖歪脏,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情粮呢,我是刑警寧澤婿失,帶...
    沈念sama閱讀 34,389評論 4 332
  • 正文 年R本政府宣布,位于F島的核電站啄寡,受9級特大地震影響豪硅,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜挺物,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,032評論 3 316
  • 文/蒙蒙 一懒浮、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧识藤,春花似錦砚著、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,798評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至剪个,卻和暖如春秧骑,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背扣囊。 一陣腳步聲響...
    開封第一講書人閱讀 32,026評論 1 266
  • 我被黑心中介騙來泰國打工乎折, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人侵歇。 一個(gè)月前我還...
    沈念sama閱讀 46,473評論 2 360
  • 正文 我出身青樓骂澄,卻偏偏與公主長得像,于是被迫代替她去往敵國和親惕虑。 傳聞我的和親對象是個(gè)殘疾皇子坟冲,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,606評論 2 350

推薦閱讀更多精彩內(nèi)容

  • 啊哈健提,又見面了琳猫,我把學(xué)校的項(xiàng)目做完了,然后趁自己還沒生爬蟲私痹,就做了這個(gè) 老樣子脐嫂,還是看的知乎大神 然后這個(gè)做的是運(yùn)...
    loser_ren閱讀 402評論 0 1
  • 哈羅又見面了账千,我就是那個(gè)菜鳥。 這次我看著知乎大佬爬嗅事百科的案例暗膜,自己爬了下挖段子網(wǎng)匀奏,來分享一下。 代碼敲累了学搜?...
    loser_ren閱讀 359評論 0 0
  • 淡淡的百合香攒射,悠悠地繞過一個(gè)個(gè)深紅的“糖葫蘆”,一點(diǎn)點(diǎn)墨香滯留在門前的春聯(lián)恒水。交雜的味道,盞盞紅的熒光和空落落的街...
    月歆瑩閱讀 421評論 0 1
  • 心心念念的26歲生日御雕,昨晚終于圓滿落幕。 謝謝滥搭,這一年來酸纲,你們大家的陪伴。 嘻嘻瑟匆,大家都發(fā)生了好多變化(⊙o⊙)哦...
    愛嬌閱讀 694評論 0 0
  • 也許此刻有那么多的人闽坡,想要極力的否認(rèn)我的所有付出,但是沒關(guān)系…我依然相信愁溜,公道自在人心疾嗅!
    陳敏如閱讀 150評論 0 0