項(xiàng)目概述:
利用 Python 探索三大美國(guó)城市的自行車共享系統(tǒng)相關(guān)的數(shù)據(jù):芝加哥、紐約和華盛頓特區(qū)邻吭。此項(xiàng)目將使用?Motivate?提供的數(shù)據(jù)探索自行車共享使用模式餐弱,編寫代碼導(dǎo)入數(shù)據(jù),并通過計(jì)算描述性統(tǒng)計(jì)數(shù)據(jù)回答有趣的問題镜盯。還將寫一個(gè)腳本岸裙,該腳本會(huì)接受原始輸入并在終端中創(chuàng)建交互式體驗(yàn),以展現(xiàn)這些統(tǒng)計(jì)信息速缆。部分?jǐn)?shù)據(jù)如下:
報(bào)告內(nèi)容:
數(shù)據(jù)分析過程主要分5個(gè)過程:
(1)預(yù)覽數(shù)據(jù)降允,提出問題
(2)整理清洗數(shù)據(jù)
(3)分析數(shù)據(jù)
(4)得出結(jié)論
(5)傳達(dá)結(jié)果
分析過程:
1.提出問題,通過此項(xiàng)目希望以下部分問題能得到回答:
1)起始時(shí)間(Start Time 列)中哪個(gè)月份最常見艺糜?
2)起始時(shí)間中剧董,一周的哪一天(比如 Monday, Tuesday)最常見?
3)起始時(shí)間中破停,一天當(dāng)中哪個(gè)小時(shí)最常見翅楼?
4)總騎行時(shí)長(zhǎng)(Trip Duration)是多久,平均騎行時(shí)長(zhǎng)是多久真慢?
5)哪個(gè)起始車站(Start Station)最熱門毅臊,哪個(gè)結(jié)束車站(End Station)最熱門?
6)哪一趟行程最熱門(即黑界,哪一個(gè)起始站點(diǎn)與結(jié)束站點(diǎn)的組合最熱門)管嬉?
7)每種用戶類型有多少人皂林?
8)每種性別有多少人?
9)出生年份最早的是哪一年蚯撩、最晚的是哪一年础倍,最常見的是哪一年?
2.查看數(shù)據(jù)胎挎,整理數(shù)據(jù)(此處省略)
3.分析數(shù)據(jù)沟启,創(chuàng)建python腳本,實(shí)現(xiàn)交互式體驗(yàn)犹菇,并能逐步實(shí)現(xiàn)以上問題的輸出:
在工作區(qū)左側(cè)可看到三個(gè)城市的數(shù)據(jù)集德迹,及創(chuàng)建的腳本bikeshare.py
而在腳本中需要定義以下幾個(gè)函數(shù),
get_filters():請(qǐng)用戶指定要分析的城市项栏、月份和日期
load_data(city, month, day):為指定的城市浦辨,按月和天加載適用的數(shù)據(jù),相當(dāng)于把輸入的數(shù)據(jù)過濾為python中數(shù)據(jù)可接受的形式沼沈。
time_stats( ):顯示旅行最頻繁次數(shù)的統(tǒng)計(jì)數(shù)據(jù),包括最受歡迎的月分币厕,一周中的天數(shù)列另,小時(shí)等
station_stats( ):顯示最受歡迎的車站和旅行的統(tǒng)計(jì)數(shù)據(jù)。
trip_duration_stats():顯示總行程和平均行程持續(xù)時(shí)間的統(tǒng)計(jì)數(shù)據(jù)旦装。
user_stats():顯示關(guān)于自行車用戶的統(tǒng)計(jì)信息页衙。
main():給出是否需要重新進(jìn)行的程序。
4.運(yùn)行腳本阴绢,以下為運(yùn)行python腳本后店乐,自動(dòng)彈出需要輸入的信息
輸入相應(yīng)的信息后,得到相應(yīng)的描述性統(tǒng)計(jì)信息呻袭,比如最頻繁的車站眨八,月份,時(shí)段(小時(shí))左电,用戶信息等
5.得出結(jié)論
對(duì)于芝加哥廉侧,
需求時(shí)間信息:
使用共享自行車最頻繁的月份6月,一周中周二使用率最高篓足,一天中下午17:00對(duì)共享自行車的需求最大段誊;
需求地點(diǎn)信息:
需求最大的開始車站為:Streeter Dr & Grand Ave,最終車站為:Streeter Dr
& Grand Ave栈拖,最頻繁的車程是:Streeter Dr & Grand Ave->Lake Shore Dr & Monroe St连舍;
用戶信息:
已注冊(cè)的用戶是非注冊(cè)用戶的4倍,已注冊(cè)用戶的使用率更高涩哟,
男性比女性的使用率更高索赏,男性差不多是女性的3倍
最常用的用戶出生在1989年