python學(xué)習(xí)第四天

作業(yè)

內(nèi)容

  • 導(dǎo)入包
import requests #請(qǐng)求
from lxml import html#解析
from matplotlib import pyplot as plt#繪圖
#繪圖漢字編碼
plt.rcParams["font.sans-serif"] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

-導(dǎo)入域名

url ='http://movie.douban.com/cinema/later/chongqing/'#豆瓣重慶影訊

-將爬取到的電影信息按"想看人數(shù)的由多到少"排序輸出

info_list=[]#存電影信息
headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.142 Safari/537.36"}
resp = requests.get(url, headers=headers)
html_data = resp.text

with open('douban.html','w',encoding='utf-8') as f:
    f.write(html_data)

# print(resp.text)


selector = html.fromstring(html_data)
movie_list = selector.xpath('//div[@id="showing-soon"]/div')
print(movie_list)

name_list = selector.xpath('//div[@id="showing-soon"]/div/div/h3/a/text()')
# print(name_list)
cishu=0
for i in movie_list:
    # 電影名稱
    name=i.xpath('//div[@id="showing-soon"]/div/div/h3/a/text()')[cishu]
    # print(name)
    # 上映日期
    date=i.xpath('//div[@id="showing-soon"]/div/div/ul/li[1]/text()')[cishu]
    # 類型
    type=i.xpath('//div[@id="showing-soon"]/div/div/ul/li[2]/text()')[cishu]
    # 上映國(guó)家
    country=i.xpath('//div[@id="showing-soon"]/div/div/ul/li[3]/text()')[cishu]
    # 想看人數(shù)

    people=i.xpath('//div[@id="showing-soon"]/div/div/ul/li[4]/span/text()')[cishu]
    # cishu+=1
    people=int(people.replace('人想看','   '))
    info_list.append({
        'name':name,
        'date':date,
        'type':type,
        'country':country,
        'people':people
    })
    # print(info_list)
    cishu += 1
info_list.sort(key=lambda x:x['people'], reverse=True)
for m in info_list:
    print(m)

-繪制上映電影國(guó)家占比圖

#上映國(guó)家
country_list=[]
for i in info_list:
    country_list.append(i['country'])
cou = {}#將國(guó)家與次數(shù)弄成一個(gè)鍵值對(duì)
for word in country_list:
    cou[word]=cou.get(word, 0)+1
print(len(cou))
times = list(cou.items())
coun=[]#國(guó)家放在一個(gè)列表
cons=[] #次數(shù)放在一個(gè)列表
for i in range(len(cou)):
    guojia,ci=times[i]
    guojia=str(guojia)
    ci=int(ci)
    coun.append(guojia)
    cons.append(ci)

print(coun)#輸出國(guó)家
print(cons)#輸出次數(shù)
#繪制占比圖
# 距離圓心點(diǎn)距離
explode = [0.1, 0, 0, 0]
colors = ['red', 'purple', 'blue', 'yellow']
plt.pie(cons, explode=explode, shadow=True, labels=coun, autopct='%1.1f%%', colors=colors)
plt.legend(loc=2)
plt.axis('equal')
plt.show()

-占比圖:


上映電影國(guó)家占比圖

-繪制top5最想看電影
上面已經(jīng)給電影信息排過名了

top5_movie = [info_list[i] for i in range(5)]
print(top5_movie)
x=[x['name'] for x in top5_movie]

y=[x['people'] for x in top5_movie]

plt.barh(x,y)
plt.show()
  • Top5最想看電影圖:


    Top5最想看電影圖
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末肋坚,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子秆乳,更是在濱河造成了極大的恐慌般妙,老刑警劉巖纪铺,帶你破解...
    沈念sama閱讀 217,734評(píng)論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異碟渺,居然都是意外死亡鲜锚,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,931評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門苫拍,熙熙樓的掌柜王于貴愁眉苦臉地迎上來芜繁,“玉大人,你說我怎么就攤上這事绒极】チ睿” “怎么了?”我有些...
    開封第一講書人閱讀 164,133評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵垄提,是天一觀的道長(zhǎng)榔袋。 經(jīng)常有香客問我,道長(zhǎng)铡俐,這世上最難降的妖魔是什么凰兑? 我笑而不...
    開封第一講書人閱讀 58,532評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮审丘,結(jié)果婚禮上吏够,老公的妹妹穿的比我還像新娘。我一直安慰自己滩报,他們只是感情好锅知,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,585評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著露泊,像睡著了一般喉镰。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上惭笑,一...
    開封第一講書人閱讀 51,462評(píng)論 1 302
  • 那天侣姆,我揣著相機(jī)與錄音,去河邊找鬼沉噩。 笑死捺宗,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的川蒙。 我是一名探鬼主播蚜厉,決...
    沈念sama閱讀 40,262評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼畜眨!你這毒婦竟也來了昼牛?” 一聲冷哼從身側(cè)響起术瓮,我...
    開封第一講書人閱讀 39,153評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎贰健,沒想到半個(gè)月后胞四,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,587評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡伶椿,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,792評(píng)論 3 336
  • 正文 我和宋清朗相戀三年辜伟,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片脊另。...
    茶點(diǎn)故事閱讀 39,919評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡导狡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出偎痛,到底是詐尸還是另有隱情旱捧,我是刑警寧澤,帶...
    沈念sama閱讀 35,635評(píng)論 5 345
  • 正文 年R本政府宣布看彼,位于F島的核電站廊佩,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏靖榕。R本人自食惡果不足惜标锄,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,237評(píng)論 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望茁计。 院中可真熱鬧料皇,春花似錦、人聲如沸星压。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,855評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽娜膘。三九已至逊脯,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間竣贪,已是汗流浹背军洼。 一陣腳步聲響...
    開封第一講書人閱讀 32,983評(píng)論 1 269
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留演怎,地道東北人匕争。 一個(gè)月前我還...
    沈念sama閱讀 48,048評(píng)論 3 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像爷耀,于是被迫代替她去往敵國(guó)和親甘桑。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,864評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容

  • 爬蟲----大數(shù)據(jù) XPath語法和lxml模塊 一、 提取本地html中的數(shù)據(jù) 新建html文件 讀取 使用x...
    余生只有一個(gè)容EuniceTo閱讀 408評(píng)論 0 0
  • python爬蟲 爬蟲:一段自動(dòng)抓取互聯(lián)網(wǎng)信息的程序跑杭,從互聯(lián)網(wǎng)上抓取對(duì)于我們有價(jià)值的信息铆帽。 提取網(wǎng)頁數(shù)據(jù) 字典定義...
    deiend閱讀 225評(píng)論 0 0
  • 1.爬蟲 大數(shù)據(jù) , 提取本地hmtl中的數(shù)據(jù) 步驟①新建html文件②讀取③使用lxml中的xpath語法進(jìn)行提...
    梅若吖閱讀 216評(píng)論 0 0
  • 練習(xí)爬蟲爬取網(wǎng)頁電影信息 -首先艘蹋,導(dǎo)入包 -設(shè)置域名 -設(shè)置爬取信息時(shí)的訪問用戶信息 之前列表字典的區(qū)別有些沒分清...
    幻的風(fēng)閱讀 178評(píng)論 0 0
  • 今天主要是讓自己完成一個(gè)項(xiàng)目锄贼,自己動(dòng)手去爬取貓眼電影top100具體實(shí)現(xiàn)如下,僅供參考 貓眼電影top100 圖片...
    苦難_69e0閱讀 207評(píng)論 1 1