python數(shù)據(jù)分析實(shí)戰(zhàn)——COVID-19

一足丢、數(shù)據(jù)下載和查看

使用python中urllib.request模塊中的urlretrieve函數(shù)下載此文件

from urllib.request import urlretrieve
urlretrieve('https://hub.jovian.ml/wp-content/uploads/2020/09/italy-covid-daywise.csv', 
            'italy-covid-daywise.csv')
import pandas as pd
covid_df = pd.read_csv('italy-covid-daywise.csv')

#covid_df.info() 基本信息  covid_df.describe() 基本統(tǒng)計(jì)信息描述  
#covid_df.columns表頭信息  covid_df.shape 行數(shù)和列數(shù)

##獲取表中的date和new_cases列
cases_df = covid_df[['date', 'new_cases']]  
##covid_df.loc[243] 獲取第243行  covid_df.loc[108:113] 獲取108到113行

二菱父、分析數(shù)據(jù)

問(wèn):在意大利尘奏,與Covid-19相關(guān)的報(bào)告病例和死亡總數(shù)是多少惜姐?死亡率是多少把曼?
total_cases = covid_df.new_cases.sum()
total_deaths = covid_df.new_deaths.sum()
print('報(bào)告病例是 {} 和死亡人數(shù)是 {}.'.format(int(total_cases), int(total_deaths)))
#死亡率是報(bào)告的死亡人數(shù)與報(bào)告的病例數(shù)之比
death_rate = covid_df.new_deaths.sum() / covid_df.new_cases.sum()
print("死亡率是 {:.2f} %.".format(death_rate*100))
問(wèn):哪些天病例超過(guò)了1000?
high_cases_df = covid_df[covid_df.new_cases > 1000]
問(wèn):排序找出案例數(shù)和死亡人數(shù)最多的日子摄乒?
covid_df.sort_values('new_cases', ascending=False).head(10)
covid_df.sort_values('new_deaths', ascending=False).head(10)

看起來(lái)三月的最后兩個(gè)星期的每日病例數(shù)最多悠反,而在新病例中,似乎每日死亡人數(shù)在高峰后約一周就達(dá)到高峰缺狠。

問(wèn):數(shù)據(jù)中是否有異常數(shù)據(jù)问慎?如何處理萍摊?
covid_df.sort_values('new_cases').head(10)

微信截圖_20210301134701.png

通過(guò)排序我們發(fā)現(xiàn)第172行數(shù)據(jù)有異常挤茄,新案例數(shù)為負(fù)數(shù),我們可以通過(guò)這幾種方法處理異常數(shù)據(jù):1.替換為0冰木;2.將其替換為整個(gè)列的平均值穷劈;3.將其替換為上一個(gè)和下一個(gè)日期的平均值;4.完全舍棄該行踊沸。
這里采用第三種方法歇终,替換為上下列的平均值。

covid_df.at[172, 'new_cases'] = (covid_df.at[171, 'new_cases'] + covid_df.at[173, 'new_cases'])/2

三逼龟、處理日期

通過(guò)covid_df.date看出date的數(shù)據(jù)類型是object,pandas不好分析评凝,使用pd.to_datetime方法將其轉(zhuǎn)化數(shù)據(jù)類型datetime64。增加年月日周末這四列腺律。

covid_df['date'] = pd.to_datetime(covid_df.date)
covid_df['year'] = pd.DatetimeIndex(covid_df.date).year
covid_df['month'] = pd.DatetimeIndex(covid_df.date).month
covid_df['day'] = pd.DatetimeIndex(covid_df.date).day
covid_df['weekday'] = pd.DatetimeIndex(covid_df.date).weekday

看下5月份的總體指標(biāo)奕短。然后使用該sum方法匯總每個(gè)選定列的值。

covid_df[covid_df.month == 5][['new_cases', 'new_deaths', 'new_tests']].sum()

一個(gè)簡(jiǎn)單的例子:
看下周日?qǐng)?bào)告的病例數(shù)是否高于每天報(bào)告的平均病例數(shù)匀钧。

covid_df.new_cases.mean()
#1096.6149193548388
covid_df[covid_df.weekday == 6].new_cases.mean()
#1247.2571428571428

與其他日子相比翎碑,星期天似乎有更多的病例報(bào)告。

四之斯、分組和匯總

我們按月創(chuàng)建一個(gè)組,用sum日杈,mean進(jìn)行匯總他們。

covid_month_df = covid_df.groupby('month')[['new_cases', 'new_deaths', 'new_tests']].sum()

covid_month_mean_df = covid_df.groupby('month')[['new_cases', 'new_deaths', 'new_tests']].mean()
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末佑刷,一起剝皮案震驚了整個(gè)濱河市莉擒,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌瘫絮,老刑警劉巖涨冀,帶你破解...
    沈念sama閱讀 219,110評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異檀何,居然都是意外死亡蝇裤,警方通過(guò)查閱死者的電腦和手機(jī)廷支,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,443評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)栓辜,“玉大人恋拍,你說(shuō)我怎么就攤上這事∨核Γ” “怎么了施敢?”我有些...
    開(kāi)封第一講書(shū)人閱讀 165,474評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)狭莱。 經(jīng)常有香客問(wèn)我僵娃,道長(zhǎng),這世上最難降的妖魔是什么腋妙? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,881評(píng)論 1 295
  • 正文 為了忘掉前任默怨,我火速辦了婚禮,結(jié)果婚禮上骤素,老公的妹妹穿的比我還像新娘匙睹。我一直安慰自己,他們只是感情好济竹,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,902評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布痕檬。 她就那樣靜靜地躺著,像睡著了一般送浊。 火紅的嫁衣襯著肌膚如雪梦谜。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 51,698評(píng)論 1 305
  • 那天袭景,我揣著相機(jī)與錄音唁桩,去河邊找鬼。 笑死浴讯,一個(gè)胖子當(dāng)著我的面吹牛朵夏,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播榆纽,決...
    沈念sama閱讀 40,418評(píng)論 3 419
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼仰猖,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了奈籽?” 一聲冷哼從身側(cè)響起饥侵,我...
    開(kāi)封第一講書(shū)人閱讀 39,332評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎衣屏,沒(méi)想到半個(gè)月后躏升,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,796評(píng)論 1 316
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡狼忱,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,968評(píng)論 3 337
  • 正文 我和宋清朗相戀三年膨疏,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了一睁。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,110評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡佃却,死狀恐怖者吁,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情饲帅,我是刑警寧澤复凳,帶...
    沈念sama閱讀 35,792評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站灶泵,受9級(jí)特大地震影響育八,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜赦邻,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,455評(píng)論 3 331
  • 文/蒙蒙 一髓棋、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧深纲,春花似錦仲锄、人聲如沸劲妙。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,003評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)镣奋。三九已至币呵,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間侨颈,已是汗流浹背余赢。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,130評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留哈垢,地道東北人妻柒。 一個(gè)月前我還...
    沈念sama閱讀 48,348評(píng)論 3 373
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像耘分,于是被迫代替她去往敵國(guó)和親举塔。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,047評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容