美國共享單車使用情況的案例分析

1.準(zhǔn)備工作

1.1首先隶糕,需要導(dǎo)入相關(guān)的包

?import numpy as np

?import pandas as pd

%matplotlib inline?


1.2使用python的pandas庫導(dǎo)入所要分析的文件办桨,在導(dǎo)入時可能出現(xiàn)紅色的警告斗这,這是因為數(shù)據(jù)類型不是很統(tǒng)一(mixed types)
data=pd.read_csv('/Users/clark/Downloads/Python數(shù)據(jù)分析入門與實戰(zhàn)-數(shù)據(jù)集/bike.csv')

然后查看數(shù)據(jù)后添,可以得到以下的表格享郊。

2.開始分析骄蝇,處理數(shù)據(jù)

#由于在分析時狼忱,隔天的數(shù)據(jù)不好分析羡玛,所以我們選取在當(dāng)天結(jié)束騎行的别智。

data=data[data['StartDay']==data['EndDay']]

#由于變量太多不利于分析,分析出來效果不好稼稿,我們在這里只選取成員類型薄榛,騎行時間,開始日期让歼,開始時間敞恋,開始地點,及結(jié)束地點谋右。

data=data[['MemberType','TripDurationSec','StartDay','StartTime','StartDate','StartStationName','EndStationName']]

由于硬猫,在表格中出現(xiàn)很多的空值,所以我們要處理空值改执。

#處理空值

data=data.dropna(how='all')

#對月份進行提取

data['StartDate']=data.StartDate.map(lambda x:x.split('/')[0])

#使用數(shù)據(jù)透視表啸蜜,改變表格的形狀,選取自己所需要的那幾個變量重新組成一個表格

#接下來分析一周當(dāng)中各個類型成員的累計平均騎行時間的情況

table=data.pivot_table(values='TripDurationSec',index='StartDay',columns='MemberType',aggfunc=np.mean)

查看使用數(shù)據(jù)透視表組成的表格辈挂。

#由于表格并不是很直觀可以看出來他們之間的區(qū)別衬横,我們這時候?qū)⑵滢D(zhuǎn)換成柱狀圖,并讓其堆積一起终蒂,方便對比

#可以看出周日的時候消費者的騎行時間是最長的蜂林。

table.plot.bar(stacked=True)


為了更加直觀的看出不同客戶的騎行時間的多少,所以拇泣,我們將其時間除于總的時間噪叙,可以算出不同類型客戶所占比例的不同

table_norm=table.div(table.sum(1),axis=0)


#接下來,我們進一步分析在一天24小時中不同類型客戶累計騎行時間霉翔,可以看出晚上8點騎行時間最長睁蕾,其次是凌晨4點

data.pivot_table(values='TripDurationSec',index='StartTime',columns='MemberType',aggfunc=np.mean).plot.barh(figsize=(10,12))


#之后,我們在分析一下車輛的使用情況早龟,我們運用車輛在開始地點的總數(shù)減去車輛在目的地的總數(shù)惫霸,就可以得出不同地方車輛的供應(yīng)是否充足

#比如200 River這個車站猫缭,它出發(fā)的車遠(yuǎn)少于到達(dá)的車,說明這個車站可以相應(yīng)減少一些共享單車的供應(yīng)

#100 Walnut St這個車站壹店,它出發(fā)的車遠(yuǎn)大于到達(dá)的車猜丹,說明這個車站需要相應(yīng)增加一些共享單車的供應(yīng)

Num=data.StartStationName.value_counts()-data.EndStationName.value_counts()

Num.sort_values()


#我們還可以使用層次化索引來分析,在每周當(dāng)中硅卢,每個車站的不同客戶的 累計騎行情況

table=data.pivot_table('TripDurationSec',index='StartStationName',columns=['MemberType','StartDay'],aggfunc=np.size,margins=True,fill_value=0)


#customer用戶在一周當(dāng)中從不同車站出發(fā)的累計騎行情況

table['Customer']


?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末射窒,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子将塑,更是在濱河造成了極大的恐慌脉顿,老刑警劉巖,帶你破解...
    沈念sama閱讀 207,113評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件点寥,死亡現(xiàn)場離奇詭異艾疟,居然都是意外死亡,警方通過查閱死者的電腦和手機敢辩,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,644評論 2 381
  • 文/潘曉璐 我一進店門蔽莱,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人戚长,你說我怎么就攤上這事盗冷。” “怎么了同廉?”我有些...
    開封第一講書人閱讀 153,340評論 0 344
  • 文/不壞的土叔 我叫張陵仪糖,是天一觀的道長。 經(jīng)常有香客問我迫肖,道長锅劝,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,449評論 1 279
  • 正文 為了忘掉前任咒程,我火速辦了婚禮详民,結(jié)果婚禮上切距,老公的妹妹穿的比我還像新娘。我一直安慰自己悯恍,他們只是感情好奶段,可當(dāng)我...
    茶點故事閱讀 64,445評論 5 374
  • 文/花漫 我一把揭開白布饥瓷。 她就那樣靜靜地躺著,像睡著了一般痹籍。 火紅的嫁衣襯著肌膚如雪呢铆。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,166評論 1 284
  • 那天蹲缠,我揣著相機與錄音棺克,去河邊找鬼悠垛。 笑死,一個胖子當(dāng)著我的面吹牛娜谊,可吹牛的內(nèi)容都是我干的确买。 我是一名探鬼主播,決...
    沈念sama閱讀 38,442評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼纱皆,長吁一口氣:“原來是場噩夢啊……” “哼湾趾!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起派草,我...
    開封第一講書人閱讀 37,105評論 0 261
  • 序言:老撾萬榮一對情侶失蹤搀缠,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后近迁,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體艺普,經(jīng)...
    沈念sama閱讀 43,601評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,066評論 2 325
  • 正文 我和宋清朗相戀三年鉴竭,在試婚紗的時候發(fā)現(xiàn)自己被綠了歧譬。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,161評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡拓瞪,死狀恐怖缴罗,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情祭埂,我是刑警寧澤面氓,帶...
    沈念sama閱讀 33,792評論 4 323
  • 正文 年R本政府宣布,位于F島的核電站蛆橡,受9級特大地震影響舌界,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜泰演,卻給世界環(huán)境...
    茶點故事閱讀 39,351評論 3 307
  • 文/蒙蒙 一呻拌、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧睦焕,春花似錦藐握、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,352評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至本谜,卻和暖如春初家,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,584評論 1 261
  • 我被黑心中介騙來泰國打工溜在, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留陌知,地道東北人。 一個月前我還...
    沈念sama閱讀 45,618評論 2 355
  • 正文 我出身青樓掖肋,卻偏偏與公主長得像仆葡,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子培遵,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,916評論 2 344

推薦閱讀更多精彩內(nèi)容