機器學(xué)習(xí)用狱,可謂是當(dāng)今的熱詞译仗,向往算法工程師高薪和逼格的學(xué)生,老師略号,程序員在學(xué)習(xí)機器學(xué)習(xí)知識轉(zhuǎn)職刑峡,在互聯(lián)網(wǎng)等信息產(chǎn)業(yè)工作的各類職工由于工作需要也在關(guān)注和學(xué)習(xí)機器學(xué)習(xí)相關(guān)知識洋闽,以輔助自己更好的工作和避免被淘汰突梦。
在介紹書單前诫舅,先簡單介紹下如何創(chuàng)造學(xué)習(xí)環(huán)境避免從入門到放棄,以及mapping學(xué)習(xí)路線宫患。
1. 創(chuàng)造好的學(xué)習(xí)環(huán)境
古語云刊懈,近朱者赤近墨者黑,塑造“學(xué)習(xí)機器學(xué)習(xí)”的環(huán)境是成功的保證娃闲。太多學(xué)習(xí)者打算學(xué)習(xí)一門技能都是3分鐘熱度虚汛,往往是從入門到放棄,然后怪罪自己的自制力:這種想法高估了人類的自制力皇帮,低估了環(huán)境的力量卷哩。那么如何創(chuàng)造好的學(xué)習(xí)環(huán)境呢?拿玩游戲做比方属拾,我們玩得時間很長的游戲将谊,或者被稱為產(chǎn)生黏性的游戲,我們往往會樹立目標(打敗敵人渐白,升級)尊浓,查詢資料(qq/微信群,論壇)礼预,交流溝通(線上/線下圈子)眠砾。
機器學(xué)習(xí)也是一種game,也需要樹立目標(知識點托酸,解決/評價問題)褒颈,查詢資料(網(wǎng)絡(luò)、書籍)励堡,交流溝通(線上/線下圈子)谷丸。
以筆者為例,從事互聯(lián)網(wǎng)產(chǎn)品經(jīng)理職業(yè)3.5年应结,有眾多圈內(nèi)做機器學(xué)習(xí)刨疼,學(xué)習(xí)機器學(xué)習(xí)的朋友和伙伴,最近3個月買了50本書籍(20本機器學(xué)習(xí)相關(guān)鹅龄,30本其他專業(yè)或雞湯書)揩慕,一臺順手的筆電。
可以看出筆者資源并不優(yōu)秀扮休,但是也打造了自己的機器學(xué)習(xí)環(huán)境(偷笑)迎卤。下文會重點介紹筆者使用的書籍。
2. 學(xué)習(xí)路線
以下摘錄自《機器學(xué)習(xí)實戰(zhàn)——基于scikit-learn和tensorflow》:
2.1 機器學(xué)習(xí)是什么玷坠?它要解決什么問題蜗搔?機器學(xué)習(xí)系統(tǒng)中劲藐,主要的分類和基礎(chǔ)概念有哪些?
2.2 一個典型的機器學(xué)習(xí)項目由哪些步驟構(gòu)成樟凄?
2.3 擬合數(shù)據(jù)進行學(xué)習(xí)
2.4 優(yōu)化成本函數(shù)(也稱為損失函數(shù)聘芜,cost function)
tips:機器學(xué)習(xí)是有數(shù)據(jù)理論和編程方法支撐,兩個體系中有大量概念缝龄,英文較好的學(xué)者在學(xué)習(xí)中最好記住英文概念汰现,因為有些英文概念的中文翻譯會導(dǎo)致誤讀有礙學(xué)習(xí)。
2.5 處理二拐、清洗和準備數(shù)據(jù)
2.6 特征選擇和特征工程
tips:做一個機器學(xué)習(xí)項目拿炒菜類比服鹅,準備數(shù)據(jù)凳兵,特征選擇和特征工程是準備食材百新,吃素菜還是肉菜;下文中選擇模型則是選擇炒菜的方式庐扫,炒菜還是燉菜饭望。
2.7 選擇模型,并用交叉驗證來調(diào)整超參數(shù)
2.8 機器學(xué)習(xí)的主要挑戰(zhàn)是擬合不足和過度擬合形庭。(偏差/方差權(quán)衡)
tips:這時候已經(jīng)用了不同的食材铅辞,不同的炒菜方式,炒了好幾道菜萨醒,評價這些菜用偏差和方差兩個指數(shù)斟珊。為什么要用兩個指數(shù)呢?因為提高偏差往往要犧牲方差富纸,提升方差要犧牲偏差囤踩,所以這里要有個權(quán)衡,而權(quán)衡的方式?jīng)]有死標準晓褪。權(quán)衡后堵漱,便確定了食材和炒菜方式,你就可以炒這道菜來去給丈母娘(婆婆)品嘗了(你的最大努力了)涣仿。
2.9 降低訓(xùn)練數(shù)據(jù)的維度以對抗維度災(zāi)難
tips:做這道菜要用月亮上的玉兔做食材勤庐,30萬一斤,恐怕你父母好港,配偶愉镰,配偶家長都不同意,還不如買車呢钧汹,吃一道菜不值當(dāng)丈探。即用合理的計算資源(性價比)去設(shè)計機器學(xué)習(xí)系統(tǒng)。
總結(jié):上面引用的內(nèi)容崭孤,可能對小白學(xué)者不太友好类嗤,其實沒必要畏難糊肠,有了筆者以下推薦的書籍,幫助你去mapping你的學(xué)習(xí)路線遗锣,將知識拆解為一個個單元知識货裹,學(xué)起來難度就會很小,有些知識需要很深的數(shù)據(jù)驗算精偿,你要相信大部分從業(yè)者也不會做弧圆,你和他們一樣記住結(jié)論即可。但是為了方便以后對知識的靈活應(yīng)用笔咽,還是一點一滴學(xué)穩(wěn)比較好搔预,因為拆解后的知識較為簡單,建立知識間的聯(lián)系則需要重復(fù)練習(xí)叶组,慢慢你就會成為大廚拯田。
3. 推薦書籍
以下都是必買的入門書,相當(dāng)于少林藏金閣中正規(guī)武林秘籍(炒菜大全)甩十,買不了吃虧船庇,學(xué)不了上當(dāng):
3.1?統(tǒng)計學(xué)習(xí)方法?李航著:這是鳩摩智的小無相功,是機器學(xué)習(xí)算法的數(shù)學(xué)基礎(chǔ)侣监,推導(dǎo)優(yōu)美鸭轮,不懂的地方網(wǎng)上可以搜到,國內(nèi)機器學(xué)習(xí)者以極大的熱情注解了本書講的不夠詳細的地方橄霉,可以看出本書的歡迎度窃爷。但是缺點也很明顯,小無相功是法姓蜂,不是器按厘,雖然各類功能都能模仿打出,但是由于不包含機器學(xué)習(xí)系統(tǒng)工程覆糟,打多了容易筋脈錯亂刻剥,這就需要下面這本書。
算法的數(shù)學(xué)理論基礎(chǔ)(涉及統(tǒng)計學(xué)滩字,信息學(xué)造虏,微積分)
3.2 機器學(xué)習(xí)實戰(zhàn)——基于scikit-learn和tensorflow? geron(歪果仁)著:作者是編程屆骨灰級玩家,有大量實戰(zhàn)麦箍,和工程經(jīng)驗漓藕,完全有資格coach你做一道菜,相當(dāng)于黃藥師挟裂,教你嚴謹?shù)闹R結(jié)構(gòu)享钞,也秀了很多實用技巧,非常之嘚瑟诀蓉。缺點是基礎(chǔ)不牢時栗竖,會被他的神展開嚇到暑脆,藥性剛猛,需要其他藥劑調(diào)和下狐肢,不然會被秀飛到棄學(xué)添吗。
有豐富的代碼,可以照敲份名。
3.3 機器學(xué)習(xí)實戰(zhàn) Peter Harrington 著:這位歪果仁就比較老實碟联,不太愛展開知識;缺點也是優(yōu)點僵腺,視角單純就事論事鲤孵。是一劑調(diào)和藥,必買辰如,必買普监,切記。相當(dāng)于武林中的華佗丧没,療傷用(機器學(xué)習(xí)真吉爾簡單鹰椒,哈哈哈锡移,大誤呕童,,淆珊,)夺饲。
有豐富的代碼,可以照敲施符。
3.4 機器學(xué)習(xí) 周志華著:這是國內(nèi)另一個學(xué)術(shù)大神往声,可以說天賦異稟,大學(xué)老師出身戳吝,機器學(xué)習(xí)屆的邁克爾喬丹浩销,他的推導(dǎo)你能理解,但是你模仿不來听哭,各種操作秀得你頭皮發(fā)麻慢洋。宗師級人物教學(xué),必看陆盘,有些知識寫得詳細真摯普筹,有些知識寫得囫圇吞棗,也許要天才眼里隘马,有些環(huán)節(jié)就是一步到位的太防。還是買了吧,這是本毀譽參半的教材酸员,如果不買相當(dāng)于你打籃球而不知道邁克爾喬丹蜒车,科比讳嘱,哈登,庫里酿愧,榜樣的力量的強大的呢燥,榜樣的技巧也是可以學(xué)習(xí)的。
數(shù)學(xué)知識寓娩,推導(dǎo)相當(dāng)秀叛氨,獨秀,陳(周)獨秀棘伴。(下面是這本書的調(diào)劑藥)
3.5 深度學(xué)習(xí)入門——基于python的理論和實現(xiàn)? 齋藤康毅著寞埠。作者日本人,有著日本學(xué)者或工程人員嚴謹?shù)木窈缚洹#ìF(xiàn)代科學(xué)是建立在西方科學(xué)體系上的仁连,日本人則發(fā)揚魯迅的拿來主義,把西方科學(xué)體系在日本這個國土上重新種植了一遍阱穗。)可讀性最好的著作饭冬,中國人學(xué)習(xí)深度學(xué)習(xí)入門的不二之選,寫得極為細膩簡潔揪阶,還符合東方思維昌抠,并不拘泥于西方科學(xué)形式主義。必買鲁僚,必看炊苫。
有少量數(shù)學(xué)知識,適量的代碼冰沙,主要講的理解侨艾,思路非常適合東方人學(xué)習(xí)。
轉(zhuǎn)載請注明出處拓挥。