我作為小白挖過(guò)的坑
我并不懶惰解愤,我入門時(shí)調(diào)查了很多有關(guān)機(jī)器學(xué)習(xí)的網(wǎng)站,公式携丁,公式琢歇,公式,怎么都是公式梦鉴,看不懂!怎么辦揭保!柳暗花明突然發(fā)現(xiàn)scikit-learn肥橙,抱著實(shí)用主義的方式,不看公式直接開始使用秸侣,問題很快就出來(lái)了存筏,這些函數(shù)的參數(shù)是干什么的,為什么要這樣設(shè)置味榛,參數(shù)的范圍值和什么有關(guān)椭坚,一個(gè)接一個(gè)的問題無(wú)法解決,放棄搏色。
緊接著善茎,又柳暗花明一次,我發(fā)現(xiàn)了TensorFlow---- 還是深度學(xué)習(xí)频轿,厲害按寡摹烁焙!然后又開始新的路程,發(fā)現(xiàn)完全不知道官方的文檔說(shuō)的是什么耕赘,找網(wǎng)站查查骄蝇,完蛋了,情況好不到哪里操骡,完全不知道大家講了什么九火。
總結(jié):沒有任何概念,沒有任何基礎(chǔ)册招,沒有任何參考吃既,進(jìn)行此類學(xué)習(xí),基本是不可能完成跨细。
羅列問題都來(lái)自哪里
1 我為什么看不懂?dāng)?shù)學(xué)公式鹦倚,我總結(jié)原因:根本沒有主線,直接搜索數(shù)學(xué)相關(guān)知識(shí)冀惭,又是課本教學(xué)震叙,毫無(wú)意義。
2 我為什么根本不明白scikit-learn散休,TensorFlow媒楼,總結(jié)原因:本來(lái)就沒有概念,數(shù)學(xué)基礎(chǔ)又弱戚丸。
尋找問題的解決的方向
在“羅列問題都來(lái)自哪里”划址,我發(fā)現(xiàn)有三個(gè)急需解決的名詞,它們分別是: 機(jī)器學(xué)習(xí)算法限府,神經(jīng)網(wǎng)絡(luò)算法夺颤,深度學(xué)習(xí)算法。為了方便大家胁勺,讓大家不要再糾結(jié)世澜,我以最直白的話講給大家聽:
上面三個(gè)名詞解決的問題,無(wú)外乎解決“分類”和“回歸”這2件事情署穗。分類大家都應(yīng)該明白寥裂,不做解釋“钙#回歸封恰,拿浙江《非誠(chéng)勿擾》欄目舉例,女嘉賓為啥對(duì)個(gè)個(gè)男嘉賓褐啡,有時(shí)滅燈有時(shí)亮燈诺舔,她們是怎么想的?說(shuō)明這些女嘉賓心里都有一把尺子在進(jìn)行度量,度量什么呢混萝?有房能得幾分遗遵;房子在哪個(gè)城市能得幾分;房子在城市的哪個(gè)位置逸嘀,能得幾分车要,接下來(lái)還有許許多多的類似的度量,例如崭倘,車翼岁,存款,理想司光,樣子琅坡,身高,胖瘦残家,家庭觀等等榆俺。一旦掌握了某個(gè)女嘉賓的度量標(biāo)準(zhǔn),那么下一位男嘉賓坞淮,一出來(lái)自報(bào)家門茴晋,你都能立刻知道他是否被她滅燈。那么研究這個(gè)度量標(biāo)準(zhǔn)回窘,就是回歸诺擅。
話題拉回來(lái),看下面:
機(jī)器學(xué)習(xí)算法: 通過(guò)數(shù)學(xué)導(dǎo)出公式啡直,然后用代碼進(jìn)行公式實(shí)現(xiàn)烁涌。
神經(jīng)網(wǎng)絡(luò)算法: 就是機(jī)器學(xué)習(xí)算法一種,也有數(shù)學(xué)公式酒觅,只不過(guò)用迭代的方式撮执,一次一次接近真實(shí)值虫给。
深度學(xué)習(xí)算法: 就是把神經(jīng)網(wǎng)絡(luò)多弄幾層,所以有些地方你能看到“深度神經(jīng)網(wǎng)絡(luò)”
問題已經(jīng)解決80%
為什么現(xiàn)在很多人兔跌,直接就搞深度學(xué)習(xí)呢擎析? 上面不是說(shuō)明白了,機(jī)器學(xué)習(xí)才是基礎(chǔ)嗎事示。沒錯(cuò),有了機(jī)器學(xué)習(xí)算法 這基礎(chǔ),你基本上可以看懂80%的數(shù)學(xué)名詞装获,也基本上可以看懂很多數(shù)學(xué)公式,包括一些論文了厉颤。
之所以搞深度學(xué)習(xí)穴豫,是因?yàn)椋?/p>
1)有名氣,圍棋大師都輸給機(jī)器人啦.
2)確實(shí)在某些領(lǐng)域有強(qiáng)有力的突破。
假如硬要從深度學(xué)習(xí)開始入手可以嗎
可以精肃,但是有2個(gè)條件你必須具備:
1)你所在的公司招聘了 厲害的人 秤涩,并且愿意帶著你做項(xiàng)目。
2)你準(zhǔn)備個(gè)3-5萬(wàn)元培訓(xùn)費(fèi)司抱,這個(gè)我就不多說(shuō)了(注意:那些價(jià)格標(biāo)注“500元以下”的深度學(xué)習(xí)培訓(xùn)包括視頻筐眷,都是耍流氓)。
除此外习柠,你還要明白我下面要講的話(這個(gè)是重點(diǎn)匀谣,同學(xué)們注意畫圈,考試必考):
1)除非你有3-5年的工作經(jīng)驗(yàn)资溃,否則在進(jìn)行公司面試時(shí)機(jī)器學(xué)習(xí)算法武翎,如svm,邏輯回歸等溶锭,你根本不可能繞過(guò)去宝恶,也就是說(shuō),你完全沒有機(jī)會(huì)進(jìn)入任何一家公司趴捅。
2)深度學(xué)習(xí)訓(xùn)練垫毙,得到最終訓(xùn)練結(jié)果少則3個(gè)月,多則1年驻售。機(jī)器學(xué)習(xí)算法露久,一般情況有1-7天足夠。你認(rèn)為什么樣的公司會(huì)讓你什么也不產(chǎn)出欺栗,就干耗著時(shí)間拿工資毫痕?所有多數(shù)公司目前仍然是機(jī)器學(xué)習(xí)算法,或者是機(jī)器學(xué)習(xí)算法+深度學(xué)習(xí)迟几。
3)深度學(xué)習(xí)訓(xùn)練需要大量的數(shù)據(jù)消请,即數(shù)據(jù)是其燃料,在實(shí)際的問題中类腮,我們可能并不會(huì)有海量級(jí)別的數(shù)據(jù)臊泰,所以公司一般還是用機(jī)器學(xué)習(xí)算法。(完蛋了3-5萬(wàn)培訓(xùn)費(fèi)白搞事情了蚜枢,搞得扎心吧)
是真的嗎缸逃,此話當(dāng)真?
還有迷糊的,我再舉例厂抽,附帶推薦需频,讓大家別跳坑:
從南大周志華老師的暢銷書《機(jī)器學(xué)習(xí)》的目錄來(lái)看(這本書很多企業(yè)團(tuán)隊(duì)購(gòu)買過(guò),想省錢的筷凤,自我感覺不錯(cuò)的昭殉,推薦購(gòu)買):
第四章:決策樹?
第五章:神經(jīng)網(wǎng)絡(luò)?
第六章:支持向量機(jī)?
第七章:貝葉斯分類器?
第八章:集成學(xué)習(xí)?
第九章:聚類?
第十章:降維與度量學(xué)習(xí)?
第十一章:特征選擇與稀疏學(xué)習(xí)?
第十二章:計(jì)算學(xué)習(xí)理論?
第十三章:半監(jiān)督學(xué)習(xí)?
第十四章:概率圖模型?
第十五章:規(guī)則學(xué)習(xí)?
第十六章:強(qiáng)化學(xué)習(xí)
深度學(xué)習(xí)屬于神經(jīng)網(wǎng)絡(luò)那一章,只占機(jī)器學(xué)習(xí)領(lǐng)域很小的一塊。
從北大章老師視頻培訓(xùn)視頻《機(jī)器學(xué)習(xí)》的目錄來(lái)看(我是比較推薦的挪丢,普通話的斯坦福教學(xué)蹂风,手寫推導(dǎo)+python實(shí)戰(zhàn),數(shù)學(xué)都能學(xué)會(huì)):
第七章 支持向量機(jī)(SVM)
第八章 AdaBoost算法
第九章 PCA降維算法
第十章 感知器算法
第十一章 BP神經(jīng)網(wǎng)絡(luò)算法
第十二章 卷積神經(jīng)網(wǎng)絡(luò)
深度學(xué)習(xí)也僅限于卷積神經(jīng)網(wǎng)絡(luò)
總結(jié)一下吧
深度學(xué)習(xí)是 data driven 的乾蓬,需要大量的數(shù)據(jù)和時(shí)間消耗惠啄,而傳統(tǒng)的機(jī)器學(xué)習(xí)算法通常不需要;
深度學(xué)習(xí)本質(zhì)上可以看作一個(gè)特征學(xué)習(xí)器巢块,在無(wú)需另構(gòu)特征情況下礁阁,傳統(tǒng)的機(jī)器學(xué)習(xí)算法已經(jīng)能夠勝任日常的任務(wù);
如無(wú)必要族奢,勿增實(shí)體姥闭。能夠簡(jiǎn)單的模型解決的,不必要上深度學(xué)習(xí)算法越走,殺雞焉用牛刀棚品?
不懂行的、入門的廊敌,不要铜跑,不要,不要骡澈,(說(shuō)三遍)不要搞深度學(xué)習(xí)锅纺,從機(jī)器學(xué)習(xí)開始,否則你會(huì)哭肋殴。