Lec 3:Types of Learning
上一節(jié)主要介紹了PLA纲辽,PLA是binary classification灾挨,二元分類問題是機(jī)器學(xué)習(xí)中非常核心基本的問題药薯。
這節(jié)主要介紹機(jī)器學(xué)習(xí)的各種types~相信每一個(gè)知道機(jī)器學(xué)習(xí)的人都有所了解薄料,所以寫的較簡(jiǎn)略~^_^~
1获诈,根據(jù)“輸出空間”Output space分類
1)classification分類:binary 二元仍源;Multiclass多元,輸出是類別
2)regression回歸:輸出是“數(shù)值”
3)Structured Learning結(jié)構(gòu)學(xué)習(xí):例如句子結(jié)構(gòu)舔涎、蛋白質(zhì)立體結(jié)構(gòu)
and more笼踩!
2,根據(jù)“數(shù)據(jù)標(biāo)記”Data label情況分類
Supervised監(jiān)督學(xué)習(xí):每個(gè)xn都對(duì)應(yīng)一個(gè)yn亡嫌。是最核心的一種學(xué)習(xí)嚎于,也是本門課的重點(diǎn)掘而。
unsupervised非監(jiān)督學(xué)習(xí):只有xn,沒有yn于购,如:clustering聚類袍睡,可應(yīng)用在文章按主題分群、異常檢測(cè)
semi-supervised半監(jiān)督學(xué)習(xí):部分xn有對(duì)應(yīng)的yn价涝,如人臉識(shí)別女蜈、藥效預(yù)測(cè)。特點(diǎn)是獲得yn的成本高或困難
reinforcement增強(qiáng)學(xué)習(xí):nature way to learn色瘩,如教給狗sit down,如果發(fā)出sit down指令逸寓,狗沒有坐下就懲罰它居兆,做的good(不一定是對(duì)的那個(gè)yn,是你滿意的就可以)就獎(jiǎng)勵(lì)它竹伸。如訓(xùn)練一個(gè)廣告系統(tǒng)泥栖、棋牌類游戲
and more!
3勋篓,根據(jù)Protocol分類
batch learning:成批喂data給machine吧享,填鴨式學(xué)習(xí)。最核心常用的譬嚣,也是本門課著重點(diǎn)钢颂。
online learning:一筆一筆的喂data,如PLA拜银,增強(qiáng)學(xué)習(xí)殊鞭。希望隨著xn一筆一筆的到來,每一輪都修正g尼桶,g越來越好
batch和online從機(jī)器的角度看都是被動(dòng)的passive操灿,還有一種新興的學(xué)習(xí)方式:
active:機(jī)器主動(dòng)問問題,有了xn泵督,詢問yn是什么趾盐?如文本識(shí)別。通常用在取得yn貴或難的情況
4小腊,根據(jù)“輸入空間”Input space分類
concrete features:具體的data救鲤,通常帶有人類的domain knowledge。如數(shù)字識(shí)別溢豆,把是否對(duì)稱以及密度作為x=(symmetry蜒简,density)。
raw features:數(shù)字識(shí)別中像素點(diǎn)可以叫做raw features漩仙,經(jīng)常需要機(jī)器或人將其轉(zhuǎn)化為concrete features搓茬,如機(jī)器學(xué)習(xí)技法課中的deep learning可以extract features
abstract features:抽象的data犹赖,如x只包含用戶的編號(hào),y是這個(gè)用戶對(duì)某個(gè)歌曲的評(píng)分卷仑,這時(shí)需要機(jī)器自己學(xué)到features峻村。越抽象機(jī)器需要花費(fèi)越多的力氣學(xué)習(xí)。