文章來源國外的analystics vidhya
原網(wǎng)址推薦書目氢架,需要亞馬遜購買傻咖。我已經(jīng)補全,望各位共同學(xué)習(xí)進(jìn)步岖研!
前沿
谷歌數(shù)據(jù)科學(xué)家的篩選過程對統(tǒng)計學(xué)和數(shù)學(xué)背景強的候選人給予了更高的優(yōu)先考慮卿操。不僅Google,世界上其他頂尖公司(亞馬遜缎玫,Airbnb硬纤,Uber等)也傾向于擁有強大的基礎(chǔ)知識,而不僅僅是數(shù)據(jù)科學(xué)的專業(yè)知識赃磨。
如果您也希望日后為這些頂級公司工作筝家,那么您必須開發(fā)數(shù)據(jù)科學(xué)的數(shù)學(xué)理解。數(shù)據(jù)科學(xué)只是統(tǒng)計和數(shù)學(xué)的演進(jìn)版本邻辉,結(jié)合編程和業(yè)務(wù)邏輯溪王。我遇到過許多數(shù)據(jù)科學(xué)家腮鞍,他們很難在統(tǒng)計學(xué)上解釋預(yù)測模型。
不僅僅是獲得準(zhǔn)確性莹菱,理解和解釋每個度量移国,這個準(zhǔn)確度后面的計算是重要的。記住道伟,每一個“變量”都有一個故事要講述迹缀。所以,如果沒有別的蜜徽,盡量成為一個偉大的故事探險家祝懂!
在這篇文章中,我編輯了一本必讀的統(tǒng)計和數(shù)學(xué)書籍拘鞋。我明白數(shù)學(xué)沒有極限砚蓬。因此,我只挑選那些可以幫助您更好地與數(shù)據(jù)科學(xué)聯(lián)系的書籍盆色。
統(tǒng)計
統(tǒng)計學(xué)習(xí)簡介
這是一個非常推薦的書灰蛙,用于實踐數(shù)據(jù)科學(xué)家。這本書的重點在于連接統(tǒng)計概念和機器學(xué)習(xí)隔躲。因此摩梧,您將了解所有流行的監(jiān)督和無監(jiān)督機器學(xué)習(xí)算法。R用戶將獲得一定好處宣旱,因為算法方面已經(jīng)使用R進(jìn)行了演示障本。除了理論,本書還著重于在現(xiàn)實生活中使用ML算法响鹃。
鏈接:http://www-bcf.usc.edu/~gareth/ISL/?
統(tǒng)計學(xué)習(xí)要素
這本書是先前書籍的先進(jìn)水平。這是由斯坦福大學(xué)教授Trevor Hastie和Rob Tibshirani撰寫的案训。他們的第一本書“統(tǒng)計學(xué)習(xí)導(dǎo)論”揭示了統(tǒng)計學(xué)和機器學(xué)習(xí)的基礎(chǔ)知識买置。本書將向您介紹諸如神經(jīng)網(wǎng)絡(luò),Bagging&Boosting强霎,Kernel方法等更高級別的算法忿项。該算法已在R程序中實現(xiàn)。
鏈接:http://statweb.stanford.edu/~tibs/ElemStatLearn/
認(rèn)識統(tǒng)計
這本書的作者是Alien B Downey城舞。它基于Python中的實際統(tǒng)計分析轩触。因此,在購買此書之前家夺,請確保您已經(jīng)掌握了Python的一些基本知識脱柱。它完全側(cè)重于通過流行案例研究了解統(tǒng)計的現(xiàn)實生活影響。既然拉馋,統(tǒng)計數(shù)學(xué)和數(shù)學(xué)關(guān)系密切榨为,它也有專門的章節(jié)惨好,如貝葉斯估計。
鏈接:https://pan.baidu.com/s/1pKNDIOj
From Algorithms to Z Scores
你知道統(tǒng)計在編程中的關(guān)鍵作用嗎随闺?這本書的作者是加州大學(xué)教授Norm Matloff日川。本書解釋了在R中使用概率概念和統(tǒng)計測量。再次矩乐,R用戶的良好做法來源龄句。它教授處理概率模型的藝術(shù),并選擇最佳的模型進(jìn)行最終評估散罕。這是一本非常推薦的書(特別是R用戶)分歇。
鏈接:http://heather.cs.ucdavis.edu/probstatbook (進(jìn)去以后有書的手稿)。
使用R發(fā)現(xiàn)統(tǒng)計
這本書是由安迪·田野笨使,杰里米·邁爾斯和佐伊菲爾德寫的卿樱。我會強烈推薦這本書給數(shù)據(jù)科學(xué)的新手。從統(tǒng)計數(shù)據(jù)開始硫椰,本書有一個很好的內(nèi)容繁调,詳細(xì)介紹了其主題。與此同時靶草,統(tǒng)計概念與R一起進(jìn)行了說明蹄胰,這使得它更有用。它提供了一個一步一步的理解奕翔,同時支持有趣的練習(xí)示例裕寨。
鏈接:https://pan.baidu.com/s/1ge2puxl
數(shù)學(xué)
線性代數(shù)簡介
這是推薦的線性代數(shù)書之一。這本書的作者是麻省理工學(xué)院教授Gilbert Strang派继。吉爾伯特提供知識的獨特方式將讓您在每一章之后向前推進(jìn)直覺和興奮宾袜。本書將幫助您為機器學(xué)習(xí)建立強大的數(shù)學(xué)基礎(chǔ)。它廣泛地征集了所有必要的章節(jié)驾窟,如矢量庆猫,線性方程,決定因素绅络,特征值月培,矩陣分解等.
鏈接:http://pan.baidu.com/share/link?shareid=2193713855&uk=1247605138
矩陣計算
矩陣和數(shù)據(jù)框架是機器學(xué)習(xí)的重要組成部分。這本書的作者是Gene H Golub和Charles F Van Loan恩急。本書為學(xué)生提供了矩陣計算概念的良好開端杉畜。作者介紹了高斯消除,矩陣因式分解衷恭,lancoz方法此叠,誤差分析等重要課題。每一章都由直觀的實踐問題支持匾荆。偽代碼在Matlab中可用拌蜘。
鏈接 http://math.ecnu.edu.cn/~jypan/Teaching/books/2013%20Matrix%20Computations%204th.pdf
模式識別的概率理論
這是一個學(xué)習(xí)數(shù)學(xué)應(yīng)用的完整資源杆烁。這是機器學(xué)習(xí)中級和高級從業(yè)人員必讀的書。這本書由Luc Devroye简卧,Laszlo Gyorfi和Gabor Lugosi編寫兔魂。它涉及范圍廣泛的主題,從貝葉斯誤差举娩,線性辨別到ε熵和神經(jīng)網(wǎng)絡(luò)析校。它提供了一個令人信服的解釋與復(fù)雜的定理與分段練習(xí)問題。
鏈接:http://www.szit.bme.hu/~gyorfi/pbook.pdf
神經(jīng)網(wǎng)絡(luò)數(shù)學(xué)介紹
如果你對學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)有天生的興趣铜涉,這應(yīng)該是你開始的地方智玻。這本書的作者是Jeff Heaton。作者精心簡化了神經(jīng)網(wǎng)絡(luò)的難點芙代。本書向您介紹神經(jīng)網(wǎng)絡(luò)中基礎(chǔ)數(shù)學(xué)的基礎(chǔ)知識吊奢。它假定讀者具有代數(shù),微積分和編程的先前知識纹烹。它演示了可應(yīng)用于神經(jīng)網(wǎng)絡(luò)的各種數(shù)學(xué)工具页滚。
鏈接:https://pan.baidu.com/s/1eS3n6lO
高級工程數(shù)學(xué)
這可能是機器學(xué)習(xí)用戶數(shù)學(xué)中最全面的書籍。這本書的作者是Erwin Kreyszig铺呵。事實上裹驰,這本書強烈推薦給大學(xué)生。如果你現(xiàn)在還沒有擅長數(shù)學(xué)片挂,那么請務(wù)必遵循這本書幻林,你一定會看到你的數(shù)學(xué)理解有重大改進(jìn)。除了推導(dǎo)和實踐的例子音念,本書還有專門的演算沪饺,代數(shù),概率等等闷愤。絕對必須閱讀數(shù)據(jù)科學(xué)各級執(zhí)業(yè)者的書随闽。
鏈接:http://www-elec.inaoep.mx/~jmram/Kreyzig-ECS-DIF1.pdf
概率與統(tǒng)計學(xué)手冊
這本食譜必須在你的數(shù)字書架上。這不完全是你會發(fā)現(xiàn)的教科書肝谭,而是數(shù)學(xué)方程式的快速數(shù)字指南。這本書的作者是Matthias Vallentin蛾扇。完成數(shù)學(xué)必修之后攘烛,本書將幫助您快速連接各種定理和算法及其公式。很難立即推導(dǎo)出方程镀首,本書將幫助您快速導(dǎo)航到您想要的問題并解決坟漱。
鏈接:http://pages.cs.wisc.edu/~tdw/files/cookbook-en.pdf
視頻分享:
MIT線性代數(shù)課程:https://ocw.mit.edu/courses/mathematics/18-06-linear-algebra-spring-2010/video-lectures/
MIT多變量微積分課程:https://ocw.mit.edu/courses/mathematics/18-02-multivariable-calculus-fall-2007/video-lectures/lecture-1-dot-product/
斯坦福統(tǒng)計課程:https://lagunita.stanford.edu/courses/HumanitiesScience/StatLearning/Winter2014/about
可汗大學(xué)數(shù)學(xué)課程:https://www.khanacademy.org/math
統(tǒng)計的海報:http://static1.squarespace.com/static/54bf3241e4b0f0d81bf7ff36/t/55e9494fe4b011aed10e48e5/1441352015658/probability_cheatsheet.pdf
大家有什么好的這方面的國外材料可以相互補充,相互學(xué)習(xí)更哄,共同進(jìn)步芋齿,為了你們的數(shù)學(xué)科學(xué)家的夢想而努力腥寇。
資料來源:analystics vidhya