作為自學(xué)數(shù)據(jù)科學(xué)的數(shù)據(jù)科學(xué)工作者鸡典,在學(xué)習(xí)的過(guò)程中確實(shí)遇到了不少困難和麻煩,理論枪芒,技術(shù)彻况,算法,軟件病苗,編程語(yǔ)言……而第一個(gè)困難就是找些合適的“教科書(shū)”疗垛,來(lái)指導(dǎo)自己的學(xué)習(xí)和實(shí)踐。作為一個(gè)過(guò)來(lái)人硫朦,把自己在學(xué)習(xí)過(guò)程中積累的經(jīng)典材料分享出來(lái)贷腕,希望能夠幫助感興趣的數(shù)據(jù)科學(xué)愛(ài)好者們!
注:信息不能少,但也絕不要泛濫泽裳,以下是我精簡(jiǎn)出來(lái)的資源瞒斩,如有需要可以私信給我,在不影響版權(quán)的情況下做分享涮总。
書(shū)籍:經(jīng)典的教材永遠(yuǎn)應(yīng)該是一個(gè)數(shù)據(jù)科學(xué)工作者的字典
工具:
《Python for Data Analysis》McKinney
這本書(shū)是用Python做數(shù)據(jù)分析的絕佳參考胸囱,包括Numpy,Pandas瀑梗,Matplotlib這些最實(shí)用的python數(shù)據(jù)處理和初步分析的工具烹笔,可以在工作中隨查隨看。
《Web Scraping with Python》 Mitchell
比較稀缺的爬蟲(chóng)參考書(shū)抛丽,工具稍有過(guò)時(shí)谤职,但是仍然能夠?yàn)榕老x(chóng)的學(xué)習(xí)提供很好的理論和初步的工具使用方法。
機(jī)器學(xué)習(xí):
《Python for Machine Learning》 Sebastian Raschka
最喜歡的一本ML書(shū)籍亿鲜,Sebastian完美地結(jié)合了理論和案例允蜈,從易到難的順序?qū)L的所有模型做出了解釋?zhuān)緯?shū)使用sklearn作為工具,當(dāng)然需要神經(jīng)網(wǎng)絡(luò)時(shí)我們就需要另外的書(shū)籍了蒿柳。
深度學(xué)習(xí):
《Artificial Intelligence A Modern Approach 3rd》Stuart Russell, Peter Norvig
經(jīng)典的AI書(shū)籍饶套,或者說(shuō)這個(gè)一本完整的AI數(shù)學(xué)和理論基礎(chǔ)書(shū)籍,理論的闡述相當(dāng)完備和詳細(xì)垒探。比較適合時(shí)間比較多妓蛮,想扎實(shí)學(xué)習(xí)的朋友。
應(yīng)用類(lèi):
《Python for Finance》Yves Hilpisch
機(jī)器學(xué)習(xí)在投資領(lǐng)域的應(yīng)用叛复,F(xiàn)intech伙伴必備仔引。
網(wǎng)站:網(wǎng)站的內(nèi)容更新速度較比快,能夠得到最新的行業(yè)發(fā)展的動(dòng)向的新技術(shù)的信息
DSC是一群數(shù)據(jù)數(shù)據(jù)科學(xué)家的社區(qū)褐奥,需要申請(qǐng)才能夠加入咖耘,所有的內(nèi)容都是各個(gè)用戶(hù)分享的原創(chuàng)信息,訂閱DSC的郵件推送撬码,可以定期地接收到高質(zhì)量的文章推薦儿倒。
Medium是一個(gè)綜合的輕博客平臺(tái),內(nèi)容質(zhì)量和閱讀體驗(yàn)是我經(jīng)歷過(guò)最好的呜笑,也能能follow很多原創(chuàng)大牛的文章夫否。
KDN是最早的一批數(shù)據(jù)科學(xué)網(wǎng)站,雖然網(wǎng)站設(shè)計(jì)從來(lái)都很爛(無(wú)力吐槽)叫胁,但還是不乏一些高質(zhì)量的內(nèi)容(數(shù)據(jù)源凰慈,數(shù)據(jù)競(jìng)賽信息和文章)
讀萬(wàn)卷書(shū),行萬(wàn)里路驼鹅,多用Kaggle磨練磨練自己的知識(shí)微谓。
博客:追隨大牛的博客森篷,看看大牛對(duì)技術(shù)和行業(yè)的理解
Google 研究團(tuán)隊(duì)的最新研究成果,包括了機(jī)器學(xué)習(xí)豺型,深度學(xué)習(xí)和人工智能的多種應(yīng)用案例仲智,是學(xué)習(xí)最新研究方向的很好材料。
MOOC:便宜(甚至免費(fèi))又實(shí)惠的課程姻氨,很好的溫故知新的工具
學(xué)習(xí)機(jī)器學(xué)習(xí)的必點(diǎn)課程钓辆,Andrew的講授從理論出發(fā),對(duì)多種算法模型和優(yōu)化方法做了詳細(xì)的介紹肴焊。
Jeremy的教學(xué)方法和Andrew則完全相反前联,Jeremy作為Kaggle發(fā)掘出的大神,一直相信Learning by doing抖韩,他從一個(gè)個(gè)實(shí)際的例子出發(fā)蛀恩,先讓學(xué)生解決實(shí)際問(wèn)題,再講授其中的理論和算法茂浮,動(dòng)手能力強(qiáng)的朋友可以從Jeremy這里入手。
比較全面的基礎(chǔ)課程壳咕,完全是大學(xué)的教學(xué)方式席揽,理論 + 作業(yè) + 項(xiàng)目 + 合作,來(lái)自哈佛谓厘,質(zhì)量不用說(shuō)幌羞。
公眾號(hào):一些國(guó)內(nèi)外的數(shù)據(jù)科學(xué)社交公眾號(hào)
Twitter:
@ylecun:CNN創(chuàng)造者,F(xiàn)acebook AI Director
@Andrej Karpathy:Tesla AI Director
@drfeifei:李飛飛竟稳,Google Cloud 首席科學(xué)家属桦,Stanford 教授
@AndrewYNg:吳恩達(dá),不多介紹了
@mrogati:數(shù)據(jù)科學(xué)家他爸,數(shù)據(jù)科學(xué)投資人
微信:
機(jī)器之心
算是比較權(quán)威的機(jī)器學(xué)習(xí)公眾號(hào)了聂宾,新聞都是一手的,和國(guó)外接軌诊笤,推薦系谐!
UniDeep數(shù)據(jù)科學(xué)家
創(chuàng)業(yè)團(tuán)隊(duì)的公眾號(hào),都是數(shù)據(jù)科學(xué)家精挑細(xì)選的干貨讨跟!