在此就不介紹機(jī)器學(xué)習(xí)的概念了,請自行g(shù)oogle滞详,在此直接看Learning Map。
Learning Map(學(xué)習(xí)導(dǎo)圖)
VIDEO |
---|
先來看一張李大大的總圖↓
鑒于看起來不是很直觀紊馏,我“照虎畫貓”做了一個思維導(dǎo)圖如下:
理論上Supervised Learning分支下的內(nèi)容都可以放在其他Learning Map大類下料饥。
1. Supervised Learning
所謂監(jiān)督學(xué)習(xí),就是我們告訴機(jī)器說朱监,當(dāng)這個function看到某種input則輸出a岸啡,看到另一種input輸出b,看到……
Supervised Learning-> Regression
Regresion: The output of the target founction f is ‘scalar’. 如果我們在機(jī)器學(xué)習(xí)中要找的function輸出是數(shù)值赫编,
舉個例子:
預(yù)測PM2.5進(jìn)行天氣預(yù)報(bào)巡蘸。
核心思想就是:連續(xù)函數(shù)下進(jìn)行預(yù)測奋隶。
Supervised Learning-> Classification
分類問題有兩種可能,Binary Classification 輸出是或否悦荒,Multi-class Classification輸出多個類型唯欣。
舉個例子:
Binary Classification: Spam filtering(垃圾郵件過濾),判斷是垃圾郵件逾冬,不是垃圾郵件黍聂。
Multi-classification: Document Classification(文件分類),將文件分為政治身腻、經(jīng)濟(jì)产还、體育等多個大類。
Classification-> Linear Model 與 Non-Linear Model
Linear Model : 能做的事有限嘀趟,一些簡單的模型可以用它來做脐区,但遇到復(fù)雜問題就力不從心了。
Non-linear Model : For example她按,現(xiàn)在的深度學(xué)習(xí)就是一個Non-linear Model牛隅,能完成一些很復(fù)雜的工作,比如圖像分類等酌泰。
-
Classification-Image Recognition:輸入一個圖片媒佣,通過一個很復(fù)雜的卷積神經(jīng)網(wǎng)絡(luò)(CNN)的Function判斷是貓是狗還是猴子,每個可能的物種是class陵刹。
這里寫圖片描述 Classification-Playing Go:輸入棋盤上的局勢默伍,判斷下一個落子的位置,每一個可能的落子位置就是一個class衰琐。
Structuerd Learning
在實(shí)際運(yùn)用中也糊,常常會遇到Beyond Classification的情況,比如語音識別羡宙,人臉識別狸剃,語言翻譯等,是結(jié)構(gòu)化輸出狗热。此類問題常配合Reinforcement Learning 解決钞馁。
2. Semi-supervised Learning
example:要建立一個辨識貓與狗的系統(tǒng),手上有一部分Labelled data(已經(jīng)標(biāo)記好的貓狗圖片)匿刮,和一部分Unlabeled data(未做過標(biāo)記的貓狗圖片)指攒,那么Semi-supervised Learning做的就是利用Unlabeled data優(yōu)化function,也常用于數(shù)據(jù)不足時進(jìn)行學(xué)習(xí)僻焚。
3. Transfer Learning
example:還是建立辨識貓與狗的系統(tǒng)允悦,手上有一部分Labelled data(已經(jīng)標(biāo)記好的貓狗圖片),和另一部分與貓狗沒有關(guān)系的圖片(比如獅子老虎,標(biāo)未標(biāo)記都可)隙弛,那么Transfer Learning就是利用這些data優(yōu)化function架馋。
4. Unsupervised Learning
example1: 要讓機(jī)器學(xué)會閱讀,希望機(jī)器自己在網(wǎng)絡(luò)上爬去很多文章全闷,自己理解其中的意思叉寂,進(jìn)而取得人類的一些理解,掌握閱讀的技巧总珠,這就是非監(jiān)督學(xué)習(xí)要做的屏鳍。
我們知道,做machine Learning就是要找一個function局服。比如在學(xué)會閱讀這個系統(tǒng)里钓瞭,我們給系統(tǒng)input一個“apple”詞匯,然后讓機(jī)器看懂淫奔。在Unsupervised Learning 中沒有人告訴機(jī)器每個詞匯表示什么意思山涡,只有大量text喂給機(jī)器。
example2:要讓機(jī)器學(xué)會自主繪畫唆迁,我們只給機(jī)器呈現(xiàn)顯示世界中的景象并不做標(biāo)識鸭丛,機(jī)器要從中提煉繪畫風(fēng)格與內(nèi)容,學(xué)會通過作畫表達(dá)自己唐责。
4. Reinforcement Learning
在實(shí)際運(yùn)用中鳞溉,以上方法并不能解決全部問題,常常會遇到Beyond Classification的情況鼠哥,比如語音識別熟菲,人臉識別,語言翻譯等肴盏,那么就要通過增強(qiáng)學(xué)習(xí)來解決問題科盛。
增強(qiáng)學(xué)習(xí)的一個非常知名的應(yīng)用就是 google 阿法狗帽衙。
Reinforcement Learning VS Supervised
增強(qiáng)學(xué)習(xí)與監(jiān)督學(xué)習(xí)有什么區(qū)別呢菜皂?
example1:用一個語音識別的例子來解釋:
Supervised 就像給了機(jī)器一個點(diǎn)讀機(jī),他聽到一句話時可以看到其含義厉萝,每一句話都有標(biāo)簽恍飘,就像有一個手把手教他的老師。
而Reinforcement Learning 就像跟女朋友對話谴垫,反復(fù)講來回講很多句話章母,直到女朋友覺得你無言以對憤然離去,機(jī)器唯一可以知道的就是他做的好還是不好翩剪,除此之外沒有任何information乳怎。而這更像人類現(xiàn)實(shí)生活中的學(xué)習(xí)過程,必須自己像哪里做得好做得不夠好前弯,怎么修正蚪缀。
另一個例子秫逝,下圍棋。
example2:
supervised: 給機(jī)器一堆棋譜询枚,告訴機(jī)器违帆,情況a則落子在“5-5”處,情況b則落子在......
Reinforcement Learning: 讓機(jī)器自己下棋金蜀,下過幾百手之后刷后,機(jī)器只知道自己贏了還是輸了,下的好還是不好渊抄,機(jī)器必須自己想辦法做提高尝胆。
Alpha Go is supervised learning + reinforcement learning.
學(xué)習(xí)導(dǎo)圖總結(jié)
有一個非常重要的信息是每一個框的顏色。
- 藍(lán)色部分代表scenario抒线,意思是你現(xiàn)在有什么類型的 training data班巩。
machine learning | scenario |
---|---|
Supervised Learning | 有標(biāo)簽data |
Semi-supervised Learning | 部分有標(biāo)簽data |
Unsupervised Learning | 無標(biāo)簽data |
Transfer Learning | 一堆不相干data |
Reinforcement Learning | 只有來自外界的評價 |
-
紅色部分代表task,意思是現(xiàn)在function的output是什么嘶炭,只體現(xiàn)在supervised中抱慌,但其實(shí)可以插在以上五種Learning的每一種內(nèi)。
| machine learning | task(output) |
| ------------- |-------------|
| Regression | scalar |
| Classification | class1眨猎、class2...之一 |
| Structured Learning | 有結(jié)構(gòu)的內(nèi)容 |
- 綠色部分代表Method方法模型抑进,比如在Classification中有Linear模型 or Non-linear模型,我們可以將綠色部分插入任何紅色部分中睡陪。