常見機(jī)器學(xué)習(xí)算法：監(jiān)督學(xué)習(xí)万伤、無監(jiān)督學(xué)習(xí)窒悔、半監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)

學(xué)習(xí)算法的作用

??首先正如西瓜書中所說：

《機(jī)器學(xué)習(xí)》P1：機(jī)器學(xué)習(xí)所研究的主要內(nèi)容壕翩，是關(guān)于在計(jì)算機(jī)上從數(shù)據(jù)中產(chǎn)生“模型”（model）的算法蛉迹，即“學(xué)習(xí)算法”（learning algorithm）

??這句話可以理解為，學(xué)習(xí)算法基于喂入的經(jīng)驗(yàn)數(shù)據(jù)（訓(xùn)練集）建立數(shù)學(xué)模型放妈，若檢驗(yàn)（測(cè)試集）模型誤差在容許范圍內(nèi)，則該模型可以基于喂入的輸入數(shù)據(jù)幫助我們對(duì)具體的應(yīng)用場(chǎng)景做出判斷荐操。

《機(jī)器學(xué)習(xí)》P1：機(jī)器學(xué)習(xí)是研究關(guān)于“學(xué)習(xí)算法”的學(xué)問

“數(shù)據(jù)集”：對(duì)樣本空間的采樣

??“數(shù)據(jù)集”（data set）中的每條記錄是一個(gè)“示例”（instance）或樣本（sample）芜抒，數(shù)據(jù)集會(huì)將所描述的物體分為一種或多種“屬性”（attribute）或“特征”（feature），其取值為“屬性值”（attribute value）托启，多個(gè)屬性可以張成“屬性空間”（attribute space）宅倒，其中每個(gè)示例對(duì)應(yīng)一個(gè)“特征向量”（feature vector）。

??建立一個(gè)用于預(yù)測(cè)的模型屯耸，僅有示例數(shù)據(jù)是不夠的拐迁，我們還需要與訓(xùn)練數(shù)據(jù)一一對(duì)應(yīng)的結(jié)果信息，即“示例”的結(jié)果疗绣，稱為“標(biāo)記”（label)线召，也稱作“教學(xué)值”，這類擁有標(biāo)記信息的示例稱為“樣例”（example）

數(shù)據(jù)集結(jié)構(gòu).jpg

訓(xùn)練與測(cè)試

??基于某種學(xué)習(xí)算法多矮，從經(jīng)驗(yàn)數(shù)據(jù)中學(xué)習(xí)模型的過程稱為“訓(xùn)練”缓淹，所使用的經(jīng)驗(yàn)數(shù)據(jù)集稱為“訓(xùn)練集”。

??學(xué)習(xí)到的模型對(duì)應(yīng)數(shù)據(jù)集所屬樣本空間的潛在規(guī)律塔逃，因此將習(xí)得的模型稱為“假設(shè)”讯壶，而潛在規(guī)律本身則是“真相”。

??基于學(xué)習(xí)算法的訓(xùn)練過程就是使得“假設(shè)”盡可能接近“真相”湾盗，驗(yàn)證“假設(shè)”合理性的過程稱為“測(cè)試”伏蚊，即測(cè)試訓(xùn)練過程所建模型的準(zhǔn)確性，此時(shí)用到的測(cè)試樣本集稱為“測(cè)試集”（testing sample）格粪。

監(jiān)督學(xué)習(xí)：回歸與分類

??對(duì)于有標(biāo)記的訓(xùn)練數(shù)據(jù)躏吊，針對(duì)標(biāo)記信息的“離散”或“連續(xù)性”肺孵，將學(xué)習(xí)過程分為“分類”和“回歸”兩類。

《機(jī)器學(xué)習(xí)》P3：若欲預(yù)測(cè)的是離散值颜阐，例如“好瓜” “壞瓜”平窘，此類學(xué)習(xí)任務(wù)稱為“分類”（classification），若欲預(yù)測(cè)連續(xù)值凳怨，例如西瓜成熟度0.95瑰艘、0.37，此類學(xué)習(xí)任務(wù)稱為“回歸”（regression）肤舞。

無監(jiān)督學(xué)習(xí)：聚類

??若對(duì)樣本的預(yù)測(cè)結(jié)果沒有預(yù)期紫新，借助于算法使訓(xùn)練集自動(dòng)分類為若干組，每組稱為一個(gè)“簇”李剖，這個(gè)過程稱為聚類（clustering）芒率。

《機(jī)器學(xué)習(xí)》P3：
??這些自動(dòng)形成的“簇”可能對(duì)應(yīng)一些潛在的概念劃分，例如“淺色瓜” “深色瓜”篙顺，甚至“本地瓜” “外地瓜”偶芍。
??這樣的學(xué)習(xí)過程有助于我們了解數(shù)據(jù)內(nèi)在的規(guī)律，能為更深入地分析數(shù)據(jù)建立基礎(chǔ)德玫。

《機(jī)器學(xué)習(xí)》P3：需要說明的是匪蟀，在聚類學(xué)習(xí)中，“淺色瓜” “本地瓜”這樣的概念我們事先是不知道的宰僧，而且學(xué)習(xí)過程中使用的訓(xùn)練樣本通常不具有標(biāo)記信息材彪。

半監(jiān)督學(xué)習(xí)

參考：目前，利用未標(biāo)記示例的主流學(xué)習(xí)技術(shù)主要有三大類琴儿，即半監(jiān)督學(xué)習(xí)（semi-supervised learning）段化、直推學(xué)習(xí)（transductive learning）和主動(dòng)學(xué)習(xí)(active learning)。

圖片來源

主動(dòng)學(xué)習(xí)造成、半監(jiān)督學(xué)習(xí)显熏、直推學(xué)習(xí)

??首先需要說明的是，利用無標(biāo)記數(shù)據(jù)集的算法有多種谜疤，本文主要關(guān)注半監(jiān)督學(xué)習(xí)佃延。

??事實(shí)上對(duì)數(shù)據(jù)進(jìn)行標(biāo)記的代價(jià)較大，標(biāo)記數(shù)據(jù)需要付出大量的人力物力夷磕，具有標(biāo)記的數(shù)據(jù)集較難獲取履肃，但是隨著數(shù)據(jù)收集與存儲(chǔ)技術(shù)的發(fā)展，未經(jīng)標(biāo)記的數(shù)據(jù)卻較容易獲得坐桩。舉個(gè)具體的例子尺棋，

??在計(jì)算機(jī)輔助醫(yī)學(xué)圖像分析中，我們可以從醫(yī)院獲得大量的醫(yī)學(xué)圖像作為訓(xùn)練集用于數(shù)據(jù)分析，但是若要求大夫標(biāo)注出每張圖片上的病灶位置膘螟，這就需要大量的人力成福、物力、時(shí)間荆残。

??針對(duì)上述實(shí)際問題奴艾，出現(xiàn)了半監(jiān)督學(xué)習(xí)的概念。半監(jiān)督學(xué)習(xí)的特點(diǎn)是將未標(biāo)記數(shù)據(jù)與少量標(biāo)記數(shù)據(jù)結(jié)合使用内斯，能夠同時(shí)利用監(jiān)督學(xué)習(xí)的低歧義性與無監(jiān)督學(xué)習(xí)對(duì)數(shù)據(jù)結(jié)構(gòu)性特征的捕捉能力蕴潦。

??首先，為何可以利用無標(biāo)記數(shù)據(jù)集改善學(xué)習(xí)性能俘闯？

參考：
在介紹具體的半監(jiān)督學(xué)習(xí)技術(shù)之前,有必要先探討一下為什么可以利用未標(biāo)記示例來改善學(xué)習(xí)性能潭苞。關(guān)于這個(gè)問題,有不少研究者給出了解釋。例如,D.J. Miller 和 H.S. Uyar [MillerU97] 從數(shù)據(jù)分布估計(jì)的角度給出了一個(gè)直觀的分析真朗。他們假設(shè)所有數(shù)據(jù)服從于某個(gè)由 L 個(gè)高斯分布混合而成的分布,即

公式1

其中

為混合系數(shù),

為參數(shù)此疹。
這樣,標(biāo)記就可視為一個(gè)由選定的混合成分m_i和特征向量x_i以概率P(c_i | x_i, m_i) 決定的隨機(jī)變量。于是,根據(jù)最大后驗(yàn)概率假設(shè),最優(yōu)分類由式 2 給出:

其中：

這樣,學(xué)習(xí)目標(biāo)就變成了利用訓(xùn)練例來估計(jì)P(c_i = k | m_j = j, x_i)和P(mi = j | x)遮婶。這兩項(xiàng)中的第一項(xiàng)與類別標(biāo)記有關(guān),而第二項(xiàng)并不依賴于示例的標(biāo)記,因此,如果有大量的未標(biāo)記示例可用,則意味著能夠用于估計(jì)第二項(xiàng)的示例數(shù)顯著增多,這會(huì)使得第二項(xiàng)的估計(jì)變得更加準(zhǔn)確,從而導(dǎo)致式 2 更加準(zhǔn)確,也就是說,分類器的泛化能力得以提高蝗碎。此后,T. Zhang和F. J. Oles [ZhangO00] 進(jìn)一步分析了未標(biāo)記示例在半監(jiān)督學(xué)習(xí)中的價(jià)值,并指出如果一個(gè)參數(shù)化模型如果能夠分解成P(x, y | θ) = P(y| x, θ) P(x | θ) 的形式,那么未標(biāo)記示例的價(jià)值就體現(xiàn)在它們能夠幫助更好地估計(jì)模型參數(shù)從而導(dǎo)致模型性能的提高。

強(qiáng)化學(xué)習(xí)

??強(qiáng)化學(xué)習(xí)的思路類似于績(jī)效獎(jiǎng)勵(lì)的過程蹭睡，它對(duì)取得好結(jié)果的策
略加強(qiáng)訓(xùn)練以繼續(xù)取得較好的結(jié)果衍菱。

??區(qū)別于前三種學(xué)習(xí)方式，強(qiáng)化學(xué)習(xí)不需要喂入大量的數(shù)據(jù)肩豁，而是通過自己不停地嘗試學(xué)會(huì)某種技能。

??強(qiáng)化學(xué)習(xí)作為一種還不成熟的學(xué)習(xí)算法辫呻，目前最主要的應(yīng)用場(chǎng)景是游戲清钥、機(jī)器人等。

強(qiáng)化學(xué)習(xí)的過程

2016年：AlphaGo Master 擊敗李世石放闺，使用強(qiáng)化學(xué)習(xí)的 AlphaGo Zero 僅花了40天時(shí)間祟昭，就擊敗了自己的前輩 AlphaGo Master。
《被科學(xué)家譽(yù)為「世界壯舉」的AlphaGo Zero, 對(duì)普通人意味著什么怖侦？》
2019年1月25日：AlphaStar 在《星際爭(zhēng)霸2》中以 10：1 擊敗了人類頂級(jí)職業(yè)玩家篡悟。
《星際爭(zhēng)霸2人類1:10輸給AI！DeepMind “AlphaStar”進(jìn)化神速》
2019年4月13日：OpenAI 在《Dota2》的比賽中戰(zhàn)勝了人類世界冠軍匾寝。
《2:0搬葬！Dota2世界冠軍OG，被OpenAI按在地上摩擦》

總結(jié)

監(jiān)督學(xué)習(xí) 與無監(jiān)督學(xué)習(xí)

《機(jī)器學(xué)習(xí)》P3：根據(jù)訓(xùn)練數(shù)據(jù)是否擁有標(biāo)記信息艳悔，學(xué)習(xí)任務(wù)可大致劃分為兩大類：“監(jiān)督學(xué)習(xí)”（supervised learning）和“無監(jiān)督學(xué)習(xí)”（unsupervised learning）急凰，分類和回歸是前者的代表，而聚類則是后者的代表猜年。

??進(jìn)一步理解這段話：

??監(jiān)督學(xué)習(xí)對(duì)模型的輸出有既定的預(yù)期（訓(xùn)練集有l(wèi)abel抡锈，即教學(xué)值）疾忍，而無監(jiān)督學(xué)習(xí)對(duì)輸出沒有預(yù)期（無教學(xué)值），輸入數(shù)據(jù)依賴基于算法建立的模型自動(dòng)分類床三。

??“監(jiān)督學(xué)習(xí)”利用教學(xué)值（label一罩，期望輸出）與模型實(shí)際輸出值（訓(xùn)練集的輸出）間的誤差（合適的LOSS函數(shù)），借助反向傳播算法（BP）修正權(quán)重撇簿，從而使得實(shí)際輸出與理想輸出間的誤差盡可能小聂渊。

??結(jié)合西瓜分類的例子，監(jiān)督學(xué)習(xí)在訓(xùn)練前便已知輸出會(huì)有“好瓜” “壞瓜”的區(qū)分补疑，而無監(jiān)督學(xué)習(xí)會(huì)將西瓜聚類成幾種完全沒有提前定義的種類歧沪，這是在輸出產(chǎn)生后才做出的種類劃分。

??無監(jiān)督學(xué)習(xí)主要是用于發(fā)現(xiàn)數(shù)據(jù)集中的結(jié)構(gòu)性特點(diǎn)莲组，無監(jiān)督的過程具有可解釋性诊胞，無監(jiān)督算法可以告訴我們聚類的依據(jù)，每類有多少一致性锹杈，為何要如此分類撵孤。而監(jiān)督學(xué)習(xí)的過程不具備解釋性，依據(jù)反向傳播算法降低LOSS只是單純的計(jì)算過程竭望，無法對(duì)參數(shù)的取值做出解釋邪码，它只是在降低LOSS。

半監(jiān)督學(xué)習(xí)

??半監(jiān)督學(xué)習(xí)是大量無標(biāo)記數(shù)據(jù)與少量標(biāo)記數(shù)據(jù)的結(jié)合咬清，與監(jiān)督學(xué)習(xí)相比闭专，半監(jiān)督學(xué)習(xí)準(zhǔn)確率更高、訓(xùn)練成本更低旧烧。

強(qiáng)化學(xué)習(xí)

??所謂強(qiáng)化學(xué)習(xí)就是智能系統(tǒng)從環(huán)境到行為映射的學(xué)習(xí)影钉，以使獎(jiǎng)勵(lì)信號(hào)（強(qiáng)化信號(hào)）函數(shù)值最大，由于外部給出的信息很少掘剪，強(qiáng)化學(xué)習(xí)系統(tǒng)必須依靠自身的經(jīng)歷進(jìn)行自我學(xué)習(xí)平委。通過這種學(xué)習(xí)獲取知識(shí)，改進(jìn)行動(dòng)方案以適應(yīng)環(huán)境夺谁。

最后編輯于：2019.11.14 15:32:57

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末廉赔，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子匾鸥，更是在濱河造成了極大的恐慌蜡塌，老刑警劉巖，帶你破解...
沈念sama閱讀 206,968評(píng)論 6贊 482
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件扫腺，死亡現(xiàn)場(chǎng)離奇詭異岗照，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,601評(píng)論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門攒至，熙熙樓的掌柜王于貴愁眉苦臉地迎上來厚者，“玉大人，你說我怎么就攤上這事迫吐】夥疲” “怎么了？”我有些...
開封第一講書人閱讀 153,220評(píng)論 0贊 344
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵志膀，是天一觀的道長(zhǎng)熙宇。經(jīng)常有香客問我，道長(zhǎng)溉浙，這世上最難降的妖魔是什么烫止？我笑而不...
開封第一講書人閱讀 55,416評(píng)論 1贊 279
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮戳稽，結(jié)果婚禮上馆蠕，老公的妹妹穿的比我還像新娘。我一直安慰自己惊奇，他們只是感情好互躬，可當(dāng)我...
茶點(diǎn)故事閱讀 64,425評(píng)論 5贊 374
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著颂郎，像睡著了一般吼渡。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上乓序，一...
開封第一講書人閱讀 49,144評(píng)論 1贊 285
城市分裂傳說
那天寺酪，我揣著相機(jī)與錄音，去河邊找鬼替劈。笑死房维，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的抬纸。我是一名探鬼主播，決...
沈念sama閱讀 38,432評(píng)論 3贊 401
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼耿戚，長(zhǎng)吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼湿故！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起膜蛔，我...
開封第一講書人閱讀 37,088評(píng)論 0贊 261
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤坛猪，失蹤者是張志新（化名）和其女友劉穎，沒想到半個(gè)月后皂股，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體墅茉，經(jīng)...
沈念sama閱讀 43,586評(píng)論 1贊 300
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 36,028評(píng)論 2贊 325
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了就斤。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片悍募。...
茶點(diǎn)故事閱讀 38,137評(píng)論 1贊 334
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖洋机，靈堂內(nèi)的尸體忽然破棺而出坠宴，到底是詐尸還是另有隱情，我是刑警寧澤绷旗，帶...
沈念sama閱讀 33,783評(píng)論 4贊 324
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布喜鼓，位于F島的核電站，受9級(jí)特大地震影響衔肢，放射性物質(zhì)發(fā)生泄漏庄岖。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,343評(píng)論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一角骤、第九天我趴在偏房一處隱蔽的房頂上張望隅忿。院中可真熱鬧，春花似錦启搂、人聲如沸硼控。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,333評(píng)論 0贊 19
一樁弒父案胳赌，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽牢撼。三九已至，卻和暖如春疑苫，著一層夾襖步出監(jiān)牢的瞬間熏版，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 31,559評(píng)論 1贊 262
情欲美人皮
我被黑心中介騙來泰國(guó)打工捍掺，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留撼短，地道東北人。一個(gè)月前我還...
沈念sama閱讀 45,595評(píng)論 2贊 355
代替公主和親
正文我出身青樓挺勿，卻偏偏與公主長(zhǎng)得像曲横，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子不瓶，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 42,901評(píng)論 2贊 345