這片學(xué)習(xí)筆記來自于google一個課程《Machine Learning 101》常空,整個課程并沒有很深入的講機器學(xué)習(xí)的具體算法實現(xiàn)沽一,而是從更宏觀的視角介紹了什么是機器學(xué)習(xí),它工作的基本原理是什么漓糙,它有哪些訓(xùn)練方式铣缠,它的輸出類型又有哪些,還有這些常見應(yīng)用在機器學(xué)習(xí)中的算法類型有什么?我對課程中的一些關(guān)鍵要點進行了記錄蝗蛙,希望能夠幫助好奇的讀者能夠從宏觀視野來理解機器學(xué)習(xí)蝇庭,也能夠站在門口窺探一下機器學(xué)習(xí)的內(nèi)部構(gòu)造
什么是ML, ML有什么類型
- Artificial Intelligence現(xiàn)在主要領(lǐng)域是Narrow AI,在特定的領(lǐng)域做的比人類好(比如識別物體捡硅,聲音哮内,NLP,創(chuàng)意壮韭,預(yù)測北发,翻譯,轉(zhuǎn)換)
- Machine Learning是根據(jù)數(shù)據(jù)找出模式喷屋,通過教機器識別模式琳拨,而不是通過編程定義的特殊規(guī)則。
-
Deep Learning是一個實現(xiàn)machine learning的技術(shù)屯曹,deep neural network(DNN)是一種DL技術(shù)
image
如何選擇數(shù)據(jù)來訓(xùn)練
- 第一步是確定被識別對象的屬性狱庇,features/attributes,找出具有差異性的屬性恶耽。注意太多維度數(shù)據(jù)會導(dǎo)致過度擬合密任,所以需要分別屬性的分辨度
- 第二步是獲取足夠多的數(shù)據(jù)來進行訓(xùn)練,下面ML的7步
- 獲取數(shù)據(jù)偷俭,Gathering Data
- 準備數(shù)據(jù)批什,Preparing that Data
- 選擇模型,choosing a model
- 進行訓(xùn)練社搅,Training
- 評估結(jié)果驻债,Evaluation
- 參數(shù)調(diào)優(yōu),Parameter Tuning
- 進行預(yù)測形葬,Prediction
下面這個視頻是介紹上面七步的完整視頻合呐,
https://www.youtube.com/playlist?list=PLIivdWyY5sqJxnwJhe3etaK7utrBiPBQ2
下面這個網(wǎng)站可以掩飾機器學(xué)習(xí)是如何進行的
http://playground.tensorflow.org/
機器學(xué)習(xí)有哪些訓(xùn)練方式
- Supervised Learning,你需要告訴機器如何對數(shù)據(jù)分類笙以,需要人來給出數(shù)據(jù)的標簽
- Unsupervised Learning淌实,機器可以自己對數(shù)據(jù)進行分類,從一個非標簽化的數(shù)據(jù)集中學(xué)習(xí)
- Reinforcement Learning猖腕,在訓(xùn)練中加入獎勵和懲罰拆祈,每次訓(xùn)練都是一次嘗試
這些訓(xùn)練方式是如何工作的
- 使用回歸模型來擬合離散點
- 使用一條線來劃分兩個群體
- 使用k-nearest neighbour來區(qū)分
- 神經(jīng)網(wǎng)絡(luò),模擬大腦建模倘感。
-
每個神經(jīng)節(jié)點有加權(quán)的輸入信息
image -
很多神經(jīng)節(jié)點構(gòu)成了多層神經(jīng)網(wǎng)絡(luò)
image
-
下面這個視頻可以幫助更形象的理解Deep Neural Network
https://www.youtube.com/watch?v=aircAruvnKk
ML的輸出類型
-
回歸:預(yù)測數(shù)值
image -
分類:對象分類
image 集群:相似的放在一起
序列預(yù)測:預(yù)測一句話的下一個詞
概率估計
ML的算法類型
1.Regression
找出最貼近離散點的回歸函數(shù)
2.Instance-Based
根據(jù)離散點的距離來分類