監(jiān)督學(xué)習(xí)(supervised learning)
1 回歸分析(regression analysis)
回歸分析虏冻,其數(shù)據(jù)集是給定一個(gè)函數(shù)和它的一些坐標(biāo)點(diǎn)殷勘,然后通過(guò)回歸分析的算法舷礼,來(lái)估計(jì)原函數(shù)的模型姨伤,求出一個(gè)最符合這些已知數(shù)據(jù)集的函數(shù)解析式上真。然后它就可以用來(lái)預(yù)估其它未知輸出的數(shù)據(jù)了劳秋,你輸入一個(gè)自變量它就會(huì)根據(jù)這個(gè)模型解析式輸出一個(gè)因變量悦穿,這些自變量就是特征向量攻礼,因變量就是標(biāo)簽。 而且標(biāo)簽的值是建立在連續(xù)范圍的栗柒。
2 分類(classification)
其數(shù)據(jù)集礁扮,由特征向量和它們的標(biāo)簽組成,當(dāng)你學(xué)習(xí)了這些數(shù)據(jù)之后瞬沦,給你一個(gè)只知道特征向量不知道標(biāo)簽的數(shù)據(jù)太伊,讓你求它的標(biāo)簽是哪一個(gè)?其和回歸的主要區(qū)別就是輸出結(jié)果是離散的還是連續(xù)的逛钻。
半監(jiān)督學(xué)習(xí)(semi-supervised learning)
半監(jiān)督聚類(semi-supervised clustering)
無(wú)監(jiān)督學(xué)習(xí)(un-supervised learning)
“Because we don't give it the answer, it's unsupervised learning”僚焦。
問(wèn)題化地解釋無(wú)監(jiān)督學(xué)習(xí):我們有一些問(wèn)題,但是不知道答案曙痘,我們要做的無(wú)監(jiān)督學(xué)習(xí)就是按照他們的性質(zhì)把他們自動(dòng)地分成很多組芳悲,每組的問(wèn)題是具有類似性質(zhì)的(比如數(shù)學(xué)問(wèn)題會(huì)聚集在一組立肘,英語(yǔ)問(wèn)題會(huì)聚集在一組,物理........)名扛。
所有數(shù)據(jù)只有特征向量沒(méi)有標(biāo)簽谅年,但是可以發(fā)現(xiàn)這些數(shù)據(jù)呈現(xiàn)出聚群的結(jié)構(gòu),本質(zhì)是一個(gè)相似的類型的會(huì)聚集在一起肮韧。把這些沒(méi)有標(biāo)簽的數(shù)據(jù)分成一個(gè)一個(gè)組合融蹂,就是聚類(Clustering)。比如Google新聞弄企,每天會(huì)搜集大量的新聞超燃,然后把它們?nèi)烤垲悾蜁?huì)自動(dòng)分成幾十個(gè)不同的組(比如娛樂(lè)拘领,科技淋纲,政治......),每個(gè)組內(nèi)新聞都具有相似的內(nèi)容和結(jié)構(gòu)院究。
無(wú)監(jiān)督學(xué)習(xí)還有一個(gè)典型的例子就是雞尾酒會(huì)問(wèn)題(聲音的分離),在這個(gè)酒會(huì)上有兩種聲音本涕,被兩個(gè)不同的麥克風(fēng)在不同的地方接收到业汰,而可以利用無(wú)監(jiān)督學(xué)習(xí)來(lái)分離這兩種不同的聲音。注意到這里是無(wú)監(jiān)督學(xué)習(xí)的原因是菩颖,事先并不知道這些聲音中有哪些種類(這里的種類就是標(biāo)簽的意思)样漆。
而且雞尾酒問(wèn)題的代碼實(shí)現(xiàn)只要一行,如下: