原文地址:36大數(shù)據(jù) ? Python數(shù)據(jù)分析學(xué)習(xí)路徑圖(120天Get新技能)
Python是一種面向?qū)ο笸臁⒅弊g式計(jì)算機(jī)程序設(shè)計(jì)語(yǔ)言,由Guido van Rossum于1989年底發(fā)明挽封。由于簡(jiǎn)單墨林、易學(xué)巍沙、免費(fèi)開(kāi)源饥伊、可移植性象浑、可擴(kuò)展性等特點(diǎn),Python又被稱(chēng)之為膠水語(yǔ)言琅豆。下圖為主要程序語(yǔ)言近年來(lái)的流行趨勢(shì)愉豺,Python受歡迎程度扶搖直上。
由于Python擁有非常豐富的庫(kù)茫因,使其在數(shù)據(jù)分析領(lǐng)域也有廣泛的應(yīng)用粒氧。由于Python本身有十分廣泛的應(yīng)用,本期Python數(shù)據(jù)分析路線圖主要從數(shù)據(jù)分析從業(yè)人員的角度講述Python數(shù)據(jù)分析路線圖。整個(gè)路線圖計(jì)劃分成16周外盯,120天左右。主要學(xué)習(xí)內(nèi)容包括四大部分:
- Python工作環(huán)境及基礎(chǔ)語(yǔ)法知識(shí)了解(包括正則表達(dá)式相關(guān)知識(shí)學(xué)習(xí))翼雀;
- 數(shù)據(jù)采集相關(guān)知識(shí)(python爬蟲(chóng)相關(guān)知識(shí))饱苟;
- 數(shù)據(jù)分析學(xué)習(xí);
- 數(shù)據(jù)可視化學(xué)習(xí)狼渊。
Python工作環(huán)境及基礎(chǔ)語(yǔ)法知識(shí)了解
對(duì)于Python基礎(chǔ)語(yǔ)法學(xué)習(xí)部分箱熬,學(xué)習(xí)周期大概為4周,需要的相關(guān)資源在網(wǎng)絡(luò)上都能找到免費(fèi)的資源狈邑,而且質(zhì)量都不錯(cuò)城须。相關(guān)中文資源如下:
1.python工作集成環(huán)境包
Python(x,y) - Downloads:http://python-xy.github.io/downloads.html
2.python數(shù)據(jù)分析相關(guān)庫(kù)(Pandas/ Numpy/ Scipy/ Matplotlib)
如果安裝了上面集成工作包,則下面的包不需要重新安裝了米苹。關(guān)于包的安裝方法在學(xué)習(xí)資源圖書(shū)中都有介紹糕伐。通常安裝庫(kù),采用pip方法蘸嘶,也可以用pip list
查詢(xún)系統(tǒng)安裝了哪些庫(kù)良瞧。
3.學(xué)習(xí)資源
圖書(shū):
- Python基礎(chǔ)教程(第2版)
- 深入淺出Head First python(中文版)
在線教程:
視頻教程:
數(shù)據(jù)采集學(xué)習(xí)
對(duì)于數(shù)據(jù)采集部分的學(xué)習(xí),主要是通過(guò)python爬蟲(chóng)的學(xué)習(xí)了解基本的外部數(shù)據(jù)采集情況训唱。當(dāng)然褥蚯,也可以借助別人寫(xiě)好的規(guī)則庫(kù),直接完成某些數(shù)據(jù)的采集况增。這部分內(nèi)容的學(xué)習(xí)周期大概也為四周赞庶,需要的相關(guān)資源在網(wǎng)絡(luò)上都能找到免費(fèi)的資源,而且質(zhì)量都不錯(cuò)澳骤。
相關(guān)中文資源如下:
爬蟲(chóng)學(xué)習(xí)在線教程:
- Python爬蟲(chóng)入門(mén)一之綜述
- Python爬蟲(chóng)入門(mén)二之爬蟲(chóng)基礎(chǔ)了解
- Python爬蟲(chóng)入門(mén)三之Urllib庫(kù)的基本使用
- Python爬蟲(chóng)入門(mén)四之Urllib庫(kù)的高級(jí)用法
- Python爬蟲(chóng)入門(mén)五之URLError異常處理
- Python爬蟲(chóng)入門(mén)六之Cookie的使用
- Python爬蟲(chóng)入門(mén)七之正則表達(dá)式
- Python爬蟲(chóng)實(shí)戰(zhàn)一之爬取糗事百科段子
- Python爬蟲(chóng)實(shí)戰(zhàn)二之爬取百度貼吧帖子
- Python爬蟲(chóng)實(shí)戰(zhàn)三之計(jì)算大學(xué)本學(xué)期績(jī)點(diǎn)
- Python爬蟲(chóng)實(shí)戰(zhàn)四之抓取淘寶MM照片
- Python爬蟲(chóng)進(jìn)階一之爬蟲(chóng)框架Scrapy安裝配置
視頻教程:
數(shù)據(jù)分析
Python數(shù)據(jù)分析的學(xué)習(xí)主要是對(duì)相關(guān)庫(kù)的使用歧强,比如數(shù)據(jù)整理需要用到numpy
和pandas
庫(kù),數(shù)據(jù)描述與分析分析則主要用到pandas
庫(kù)宴凉,從某種程度上講誊锭,利用python進(jìn)行數(shù)據(jù)分析的學(xué)習(xí)過(guò)程就是對(duì)庫(kù)的學(xué)習(xí)過(guò)程。由于有了前面2部分內(nèi)容的學(xué)習(xí)基礎(chǔ)弥锄,本部分內(nèi)容的建議學(xué)習(xí)練習(xí)時(shí)間也為4周丧靡,相關(guān)免費(fèi)學(xué)習(xí)資源如下:
圖書(shū):
視頻:
- 用python玩轉(zhuǎn)數(shù)據(jù) (視頻為cousera認(rèn)證課程,全程中文)
數(shù)據(jù)可視化
Python數(shù)據(jù)可視化學(xué)習(xí)的過(guò)程籽暇,就是學(xué)習(xí)matplotlib
庫(kù)的過(guò)程温治,matplotlib
庫(kù)包含有豐富的數(shù)據(jù)可視化資源——地圖、3D等等都有涉及戒悠。如果有前面3部分的學(xué)習(xí)經(jīng)驗(yàn)的話熬荆,這部分內(nèi)容在4周內(nèi)也能解決。相關(guān)中文學(xué)習(xí)資源如下:
圖書(shū):
至此绸狐,Python數(shù)據(jù)分析相關(guān)學(xué)習(xí)內(nèi)容介紹完了卤恳,上面介紹的多種資源累盗,每個(gè)階段只需選擇其中的一種進(jìn)行深入即可,更多更深的內(nèi)容則需要自己去實(shí)踐摸索突琳。