簡介
在機(jī)器學(xué)習(xí)(Machine learning)領(lǐng)域,主要有三類不同的學(xué)習(xí)方法:
- 監(jiān)督學(xué)習(xí)(Supervised Learning): 通過已有的一部分輸入數(shù)據(jù)與輸出數(shù)據(jù)之間的關(guān)系伶跷,生成一個(gè)函數(shù)掰读,將輸入映射到合適的輸出,例如分類
- 非監(jiān)督學(xué)習(xí) (Unsupervised Learning ):直接對(duì)輸入數(shù)據(jù)進(jìn)行建模叭莫,例如聚類
- 半監(jiān)督學(xué)習(xí) (Semi-supervised Learning):綜合利用有類標(biāo)的數(shù)據(jù)和沒有類標(biāo)的數(shù)據(jù)蹈集,來生成合適的分類函數(shù)
監(jiān)督學(xué)習(xí)
- 由訓(xùn)練資料建立一個(gè)模式,并依此推測新的實(shí)例雇初。訓(xùn)練資料是由輸入物件(通常是向量)和預(yù)期輸出組成拢肆,函數(shù)的輸出可以是一個(gè)連續(xù)的值(回歸分析),或者是一個(gè)標(biāo)簽(分類)
- 一個(gè)監(jiān)督學(xué)習(xí)者的任務(wù)是在觀察完一些訓(xùn)練案例之后抵皱,去預(yù)測這個(gè)函數(shù)任何可能出現(xiàn)的值的輸出善榛,為了達(dá)到這一個(gè)目的,學(xué)習(xí)者必須以合理的方式從現(xiàn)有的資料預(yù)測到非觀察到的情況呻畸,我們稱之為概念學(xué)習(xí)
著名的分類器: 人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)悼院、最近鄰居法伤为、高斯混合模型、樸素貝葉斯方法据途、決策樹和徑向基函數(shù)分類
無監(jiān)督學(xué)習(xí)
- 無監(jiān)督式學(xué)習(xí)(Unsupervised Learning )是人工智能網(wǎng)絡(luò)的一種算法(algorithm)绞愚,其目的是去對(duì)原始資料進(jìn)行分類,以便了解資料內(nèi)部結(jié)構(gòu)颖医。有別于監(jiān)督式學(xué)習(xí)網(wǎng)絡(luò)位衩,無監(jiān)督式學(xué)習(xí)網(wǎng)絡(luò)在學(xué)習(xí)時(shí)并不知道其分類結(jié)果是否正確,亦即沒有受到監(jiān)督式增強(qiáng)(告訴它何種學(xué)習(xí)是正確的)熔萧。其特點(diǎn)是僅對(duì)此種網(wǎng)絡(luò)提供輸入范例糖驴,而它會(huì)自動(dòng)從這些范例中找出其潛在類別規(guī)則。當(dāng)學(xué)習(xí)完畢并經(jīng)測試后佛致,也可以將之應(yīng)用到新的案例上贮缕。
- 無監(jiān)督學(xué)習(xí)里典型的例子就是聚類了。聚類的目的在于把相似的東西聚在一起俺榆,而我們并不關(guān)心這一類是什么感昼。因此,一個(gè)聚類算法通常只需要知道如何計(jì)算相似度就可以開始工作了罐脊。
k-means聚類:具體細(xì)節(jié)
半監(jiān)督學(xué)習(xí)
其基本思想是利用數(shù)據(jù)分布上的模型假設(shè)定嗓,建立學(xué)習(xí)器對(duì)未標(biāo)簽樣本進(jìn)行標(biāo)簽蜕琴。半監(jiān)督學(xué)習(xí)就是在樣本集S 上尋找最優(yōu)的學(xué)習(xí)器。如何綜合利用已標(biāo)簽樣例和未標(biāo)簽樣例,是半監(jiān)督學(xué)習(xí)需要解決的問題宵溅。
半監(jiān)督學(xué)習(xí)問題從樣本的角度而言是利用少量標(biāo)注樣本和大量未標(biāo)注樣本進(jìn)行機(jī)器學(xué)習(xí)凌简,從概率學(xué)習(xí)角度可理解為研究如何利用訓(xùn)練樣本的輸入邊緣概率 P( x )和條件輸出概率P ( y | x )的聯(lián)系設(shè)計(jì)具有良好性能的分類器。這種聯(lián)系的存在是建立在某些假設(shè)的基礎(chǔ)上的层玲,即聚類假設(shè)(cluster assumption)和流形假設(shè)(maniford assumption)号醉。