文章發(fā)布于公號(hào)【數(shù)智物語】?(ID:decision_engine)疲吸,關(guān)注公號(hào)不錯(cuò)過每一篇干貨座每。
來源 | 量子位(id:QbitAI)
發(fā)自 |?凹非寺
厭倦了現(xiàn)在的工作,想轉(zhuǎn)行做數(shù)據(jù)科學(xué)摘悴,但是卻沒有計(jì)算機(jī)專業(yè)的相關(guān)學(xué)歷峭梳,應(yīng)該怎樣才能入門?
這類的教程已經(jīng)有很多蹂喻。最近一位22歲的數(shù)據(jù)科學(xué)家Dario葱椭,以自學(xué)經(jīng)歷中用到的資源告訴你,如何從零開始學(xué)習(xí)數(shù)據(jù)科學(xué)口四。
所謂從零開始自學(xué)孵运,是針對(duì)那些可以自主學(xué)習(xí)在線課程和閱讀書籍,卻沒有上班之余接受課堂教育的人士窃祝。
在學(xué)習(xí)之前掐松,如果你對(duì)線性代數(shù)、微積分粪小、概率論與統(tǒng)計(jì)學(xué)大磺、程序設(shè)計(jì)都不太熟悉,Dario建議先去學(xué)習(xí)一下這幾門數(shù)學(xué)課程探膊,然后再學(xué)習(xí)Python杠愧。
在學(xué)完以上內(nèi)容后可以進(jìn)入下面的學(xué)習(xí)。
01
看書還是看視頻
如果想進(jìn)入數(shù)據(jù)科學(xué)領(lǐng)域逞壁,每天一兩個(gè)小時(shí)的學(xué)習(xí)是必不可少的流济,是看書還是選擇看視頻锐锣?
很多人都不想在每天工作8小時(shí)后還看書,因此視頻教程是個(gè)不錯(cuò)的選擇绳瘟,而且可以在通勤路上觀看雕憔。
Dario首先推薦的是Udemy的《數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)Python訓(xùn)練營》,這是他第一次接觸數(shù)據(jù)科學(xué)的時(shí)候?qū)W習(xí)的課程糖声。
課程中用Pandas和Numpy進(jìn)行數(shù)據(jù)分析斤彼,并用Matplotlib和Seaborn進(jìn)行一些數(shù)據(jù)可視化。雖然內(nèi)容不多也不深入蘸泻,但已經(jīng)足夠入門數(shù)據(jù)科學(xué)了琉苇。
Dario還推薦了Coursera上由吳恩達(dá)主講的《機(jī)器學(xué)習(xí)》課程,學(xué)習(xí)時(shí)長大概十多個(gè)星期悦施。課程以英文講述并扇,但是提供中文字幕。
這門課程的質(zhì)量絕對(duì)有保障抡诞,大約12萬名用戶平均評(píng)分為4.9(滿分5)血巍,人氣也超高捌锭,共有260多萬用戶注冊(cè)躁垛。
02
三本優(yōu)秀的入門必看書
如果你更喜歡讀書川梅,Dario還推薦了3本入門數(shù)據(jù)科學(xué)的優(yōu)秀教材。
第一本是《Python數(shù)據(jù)科學(xué)手冊(cè)》乔遮,這本書從Jupyter Notebook入手扮超,內(nèi)容涵蓋了Numpy蹋肮、Pandas,、Matplotlib和Scikit-Learn等數(shù)據(jù)科學(xué)中最重要的部分坯辩。
該書的中文版去年已經(jīng)出版,網(wǎng)上評(píng)分9.3漆魔,網(wǎng)友都說這是本優(yōu)秀的入門級(jí)教材坷檩,非常適合非計(jì)算機(jī)專業(yè)的學(xué)生。
第二本是《統(tǒng)計(jì)學(xué)習(xí)導(dǎo)論》矢炼,它的內(nèi)容會(huì)有點(diǎn)數(shù)學(xué)阿纤,但是也很容易閱讀句灌。
對(duì)于機(jī)器學(xué)習(xí)這樣一個(gè)廣泛的領(lǐng)域,這本書能將篇幅控制在400頁左右很不容易。唯一的缺點(diǎn)是代碼是用 R語言而不是Python編寫的胰锌。
這本書的英文版提供免費(fèi)下載(地址見文末)骗绕,評(píng)分為9.5分资昧,中文版8.3分。
第三本是《Scikit-Learn與TensorFlow機(jī)器學(xué)習(xí)實(shí)用指南》格带,這本書能幫助你深入了解機(jī)器學(xué)習(xí)的概念和算法。目前践惑,該書的英文影印版和中文版都已經(jīng)出版嘶卧。
03
下一步
學(xué)完所有課程后,Dario建議初學(xué)者建立一個(gè)GitHub存檔芥吟,并尋找5個(gè)數(shù)據(jù)集來練手,在這個(gè)過程中寫出自己的結(jié)論和思考過程钉稍。
對(duì)于你未來要投遞的公司來說棺耍,讓他們看到你的工作很重要。因?yàn)槟銢]有相關(guān)學(xué)位蒙袍,因此需要以某種方式展示自己在數(shù)據(jù)科學(xué)中的工作,而GitHub是一個(gè)不錯(cuò)的選擇消恍。
星標(biāo)我以现,每天多一點(diǎn)智慧