說到Machine Learning(ML)大家肯定不會陌生,近幾年好像處在持續(xù)火熱之中呜呐,很多人也開始對這方面的內(nèi)容進行學(xué)習(xí)研究疮方。
我是在上學(xué)期也就是研一的時候開始學(xué)習(xí)的,但一直是停留在理論階段唁毒,中途也完成過相應(yīng)的作業(yè)蒜茴,但還未正式地將其與實際應(yīng)用相結(jié)合,沒有用來解決實際性的問題浆西。所以記錄這個版塊的主要原因是保存下基本的理論框架知識粉私,對自己是一種檢測,同時也為后續(xù)的應(yīng)用夯實基礎(chǔ)近零。另外也希望能和更多的伙伴進行交流學(xué)習(xí)~
在這兒我主要以框架的方式梳理一下知識網(wǎng)絡(luò)诺核,具體的細節(jié)部分,在以后隨著更深入的理解再提供補充~~
What:
ML:讓機器自身學(xué)習(xí)久信,針對一類問題的不同輸入均可得到相應(yīng)的輸出窖杀,而非針對一個具體的輸入寫出一個完備的算法。由此可見裙士,相比于傳統(tǒng)的算法設(shè)計邏輯入客,其更靈活。
How:
那它的整個流程框架是怎樣的呢?既然機器學(xué)習(xí)的結(jié)果能夠?qū)Σ煌妮斎刖a(chǎn)生作用痊项,那么這個算法在形成的過程中就得給它“喂”進多量且多樣化的食物锅风,得先讓它盡可能地嘗遍各種美食,既要有山珍海味鞍泉,也得有粗茶淡飯皱埠,這樣才能讓它的胃有更好的適應(yīng)性,不至于在來了一種新食物時出現(xiàn)腸胃不適紊亂的現(xiàn)象~~養(yǎng)好胃之后咖驮,當再給它“喂”入新鮮的食物后边器,它便能立刻反應(yīng)出這是何種食物。這也從另一個角度說明耕耘和收獲是成正比的托修,既然我們希望這種算法能解決更多不同輸入的問題忘巧,那么在一開始,我們就得多給它更多的投入啦:)
上面這段是我自己總結(jié)的形象化理解睦刃,下面還是用規(guī)范化的詞語說明其具體的含義吧~
【算法】——Model砚嘴,也就是我們最終希望得到的模型,當有了這個模型之后涩拙,輸入一個之前沒有的??? 數(shù)?據(jù)也能得到對應(yīng)合理的輸出
【食物】——dataset际长,為得到理想模型而必不可缺的數(shù)據(jù)集,只有有了數(shù)據(jù)之后兴泥,才能利用數(shù)據(jù)來訓(xùn)練模型工育,最終得到理想的模型。沒有數(shù)據(jù)搓彻,也就沒有營養(yǎng)來源如绸,一切都只是空談了~~
【山珍海味/粗茶淡飯】——這指的是數(shù)據(jù)集中不同的數(shù)據(jù)屬性,也就是為了能讓模型有更好地適應(yīng)能力旭贬,不能只讓它接觸到一種類型的數(shù)據(jù)怔接,而應(yīng)該讓它根據(jù)實際地應(yīng)用情境(如二分類或多分類問題),讓它接觸到多種屬性的數(shù)據(jù)稀轨。
【紊亂】——大的誤差蜕提,也就是模型在處理一批新的輸入數(shù)據(jù)時,其效果不佳靶端。這分為兩種情況:a、模型本身對訓(xùn)練的數(shù)據(jù)就有比較大的誤差(高偏差)凛膏,b杨名、模型能很好地適應(yīng)進行訓(xùn)練的數(shù)據(jù),但針對一批新輸入的數(shù)據(jù)產(chǎn)生較大的誤差(高方差)猖毫。這兩個問題是在模型設(shè)計過程中時常產(chǎn)生台谍,盡量減小,不可避免的吁断,畢竟趁蕊,人間美食那么多坞生,怎么可能讓一個有限容量的胃去嘗盡呢:(
【反應(yīng)】——評估,也就是拿訓(xùn)練好的模型來處理一個新的數(shù)據(jù)掷伙,并得到對應(yīng)的結(jié)果是己,也就是整個機器學(xué)習(xí)最終的目的。
Why:
上面所說的便是機器學(xué)習(xí)的一個流程任柜,理解上似乎并不困難卒废,但是如何得到所需數(shù)據(jù)?怎么利用已有數(shù)據(jù)訓(xùn)練得到想要的模型宙地?怎樣才能得到一個更好的模型摔认?如何去評估一個模型的好壞?……可能一開始還會有更多的問題宅粥,不過参袱,不要著急,學(xué)習(xí)是循序漸進的過程秽梅,在后續(xù)的筆記中我就逐步的把握學(xué)到的知識點概括總結(jié)出來抹蚀,希望能對你從大體上的理解有所幫助,當然這種理解可能是比較片面的风纠,要是你能獻策那就更好啦~
Framework:so……有了上面的介紹况鸣,下面給出整體的一個思路框架以形成比較形象化地理解,如圖1竹观,畢竟看圖有時比看文字更直觀镐捧,印象更深~~
注:在這兒推薦一下AndrewNg的公開課Machine Learning的入門級課程,這也是我已開始接觸學(xué)習(xí)的內(nèi)容臭增,感覺不錯~由于文件比較大懂酱,可以直接到網(wǎng)上找資源:)也可以私信qq:1195104546