搜狗·疫情數(shù)據(jù)爬缺涓簟(Python)

上周已經(jīng)分享過搜狗·疫情數(shù)據(jù)爬缺癜濉(R語言),這次分享一下搜狗·疫情數(shù)據(jù)爬韧ā(Python)

不說廢話蛾茉,直接上代碼垦江。有什么問題嗓化,可以在留言區(qū)討論棠涮。

from urllib import request
from lxml import etree
import re
import pandas as pd
import json

url="http://sa.sogou.com/new-weball/page/sgs/epidemic?type_page=WEB"
response = request.urlopen(url)      #請求

html = response.read()#獲取
html = html.decode("utf-8")#解碼

xml = etree.HTML(html)
datas = xml.xpath('//html/body/script[1]/text()')

datas=re.sub('window.type_page = \"WEB\"\n      window.__INITIAL_STATE__ = ',"",datas[0])

area=json_data["data"]["area"]

citytempdate = []
provincetempdate = []
for i in area:
    provinceShortName = i["provinceShortName"]
    confirmedCount = i["confirmedCount"]
    curedCount = i["curedCount"]
    deadCount = i["deadCount"]
    provincetempdate.append([provinceShortName,confirmedCount,curedCount,deadCount])
    for j in i["cities"]:
        cityName = j["cityName"]
        confirmedCount=j["confirmedCount"]
        curedCount=j["curedCount"]
        deadCount=j["deadCount"]
        citytempdate.append([provinceShortName,cityName,confirmedCount,curedCount,deadCount])
  
dt_city = pd.DataFrame(citytempdate,columns=["PROVINCESHORTNAME","CITYNAME","CONFIRMEDCOUNT","CUREDCOUNT","DEADCOUNT"])
dt_province = pd.DataFrame(provincetempdate,columns=["PROVINCESHORTNAME","CONFIRMEDCOUNT","CUREDCOUNT","DEADCOUNT"])


各城市(部分)數(shù)據(jù)如下:

PROVINCESHORTNAME CITYNAME CONFIRMEDCOUNT CUREDCOUNT DEADCOUNT
0 湖北 武漢 41152 3507 1309
1 湖北 孝感 3279 449 70
2 湖北 黃岡 2831 839 78
3 湖北 荊州 1501 305 37
4 湖北 鄂州 1274 244 35
5 湖北 隨州 1267 140 24
6 湖北 襄陽 1155 151 20

各省分總體(部分)數(shù)據(jù)如下:

PROVINCESHORTNAME CONFIRMEDCOUNT CUREDCOUNT DEADCOUNT
0 湖北 58182 6693 1696
1 廣東 1322 524 4
2 河南 1246 509 16
3 浙江 1171 507 0
4 湖南 1006 498 3
5 安徽 973 280 6
6 江西 930 275 1
7 江蘇 626 258 0
8 重慶 552 211 5
9 山東 541 191 2

轉(zhuǎn)載請注明:

微信公眾號:數(shù)據(jù)志

簡書:數(shù)據(jù)志

博客園:https://www.cnblogs.com/wheng/

CSDN:https://blog.csdn.net/wzgl__wh
GitHub(數(shù)據(jù)、代碼):https://github.com/hellowangheng/datazhi/tree/master/2019-nCoV

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末刺覆,一起剝皮案震驚了整個濱河市故爵,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌隅津,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,539評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件劲室,死亡現(xiàn)場離奇詭異伦仍,居然都是意外死亡,警方通過查閱死者的電腦和手機很洋,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,594評論 3 396
  • 文/潘曉璐 我一進店門充蓝,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事谓苟」倥В” “怎么了?”我有些...
    開封第一講書人閱讀 165,871評論 0 356
  • 文/不壞的土叔 我叫張陵涝焙,是天一觀的道長卑笨。 經(jīng)常有香客問我,道長仑撞,這世上最難降的妖魔是什么赤兴? 我笑而不...
    開封第一講書人閱讀 58,963評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮隧哮,結(jié)果婚禮上桶良,老公的妹妹穿的比我還像新娘。我一直安慰自己沮翔,他們只是感情好陨帆,可當我...
    茶點故事閱讀 67,984評論 6 393
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著采蚀,像睡著了一般疲牵。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上搏存,一...
    開封第一講書人閱讀 51,763評論 1 307
  • 那天瑰步,我揣著相機與錄音,去河邊找鬼璧眠。 笑死缩焦,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的责静。 我是一名探鬼主播袁滥,決...
    沈念sama閱讀 40,468評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼灾螃!你這毒婦竟也來了题翻?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,357評論 0 276
  • 序言:老撾萬榮一對情侶失蹤腰鬼,失蹤者是張志新(化名)和其女友劉穎嵌赠,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體熄赡,經(jīng)...
    沈念sama閱讀 45,850評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡姜挺,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,002評論 3 338
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了彼硫。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片炊豪。...
    茶點故事閱讀 40,144評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡凌箕,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出词渤,到底是詐尸還是另有隱情牵舱,我是刑警寧澤,帶...
    沈念sama閱讀 35,823評論 5 346
  • 正文 年R本政府宣布缺虐,位于F島的核電站芜壁,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏志笼。R本人自食惡果不足惜沿盅,卻給世界環(huán)境...
    茶點故事閱讀 41,483評論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望纫溃。 院中可真熱鬧腰涧,春花似錦、人聲如沸紊浩。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,026評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽坊谁。三九已至费彼,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間口芍,已是汗流浹背箍铲。 一陣腳步聲響...
    開封第一講書人閱讀 33,150評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留鬓椭,地道東北人颠猴。 一個月前我還...
    沈念sama閱讀 48,415評論 3 373
  • 正文 我出身青樓,卻偏偏與公主長得像小染,于是被迫代替她去往敵國和親翘瓮。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,092評論 2 355

推薦閱讀更多精彩內(nèi)容