【機器學(xué)習(xí)基礎(chǔ)】生成模型和判別模型

引入

監(jiān)督學(xué)習(xí)的任務(wù)就是學(xué)習(xí)一個模型（或者得到一個目標(biāo)函數(shù)）,應(yīng)用這一模型漫雷，對給定的輸入預(yù)測相應(yīng)的輸出瓜富。這一模型的一般形式為一個決策函數(shù)Y=f(X)，或者條件概率分布P(Y|X)降盹。
監(jiān)督學(xué)習(xí)方法又可以分為生成方法(generative approach)和判別方法(discriminative approach)与柑。所學(xué)到的模型分別為生成模型(generative model)和判別模型(discriminative model)。

決策函數(shù)和條件概率分布

決策函數(shù)Y=f(X)

決策函數(shù)Y=f(X)：你輸入一個X蓄坏，它就輸出一個Y价捧，這個Y與一個閾值比較，根據(jù)比較結(jié)果判定X屬于哪個類別涡戳。例如兩類（w1和w2）分類問題结蟋，如果Y大于閾值，X就屬于類w1渔彰，如果小于閾值就屬于類w2嵌屎。這樣就得到了該X對應(yīng)的類別了推正。

條件概率分布P(Y|X)

你輸入一個X，它通過比較它屬于所有類的概率宝惰，然后輸出概率最大的那個作為該X對應(yīng)的類別舔稀。例如：如果P(w1|X)大于P(w2|X)，那么我們就認(rèn)為X是屬于w1類的掌测。

小結(jié)

兩個模型都可以實現(xiàn)對給定的輸入X預(yù)測相應(yīng)的輸出Y的功能。實際上通過條件概率分布P(Y|X)進(jìn)行預(yù)測也是隱含著表達(dá)成決策函數(shù)Y=f(X)的形式的产园。
而同樣汞斧，很神奇的一件事是，實際上決策函數(shù)Y=f(X)也是隱含著使用P(Y|X)的什燕。因為一般決策函數(shù)Y=f(X)是通過學(xué)習(xí)算法使你的預(yù)測和訓(xùn)練數(shù)據(jù)之間的誤差平方最小化粘勒，而貝葉斯告訴我們，雖然它沒有顯式的運用貝葉斯或者以某種形式計算概率屎即，但它實際上也是在隱含的輸出極大似然假設(shè)（MAP假設(shè)）庙睡。也就是說學(xué)習(xí)器的任務(wù)是在所有假設(shè)模型有相等的先驗概率條件下，輸出極大似然假設(shè)技俐。

生成方法和生成模型

生成模型：無窮樣本==》概率密度模型 = 產(chǎn)生模型==》預(yù)測

生成方法由數(shù)據(jù)學(xué)習(xí)聯(lián)合概率分布P(X,Y)乘陪，然后求出條件概率分布P(Y|X)=P(X,Y)/P(X)作為預(yù)測的模型。這樣的方法之所以成為生成方法雕擂，是因為模型表示了給定輸入X產(chǎn)生輸出Y的生成關(guān)系啡邑。用于隨機生成的觀察值建模，特別是在給定某些隱藏參數(shù)情況下井赌。典型的生成模型有：樸素貝葉斯法谤逼、馬爾科夫模型、高斯混合模型仇穗。這種方法一般建立在統(tǒng)計學(xué)和Bayes理論的基礎(chǔ)之上流部。

生成方法的特點

從統(tǒng)計的角度表示數(shù)據(jù)的分布情況，能夠反映同類數(shù)據(jù)本身的相似度;

生成方法還原出聯(lián)合概率分布纹坐，而判別方法不能枝冀；

生成方法的學(xué)習(xí)收斂速度更快、即當(dāng)樣本容量增加的時候恰画，學(xué)到的模型可以更快地收斂于真實模型宾茂；

當(dāng)存在隱變量時，扔可以用生成方法學(xué)習(xí)拴还，此時判別方法不能用

判別方法和判別模型

判別模型：有限樣本==》判別函數(shù) = 預(yù)測模型==》預(yù)測

判別方法由數(shù)據(jù)直接學(xué)習(xí)決策函數(shù)f(X)或者條件概率分布P(Y|X)作為預(yù)測的模型跨晴，即判別模型。判別方法關(guān)心的是對給定的輸入X片林，應(yīng)該預(yù)測什么樣的輸出Y端盆。典型的判別模型包括：k近鄰法怀骤、感知機、決策樹焕妙、邏輯斯蒂回歸模型蒋伦、最大熵模型、支持向量機焚鹊、boosting方法和條件隨機場等痕届。判別模型利用正負(fù)例和分類標(biāo)簽，關(guān)注在判別模型的邊緣分布末患。

判別方法的特點

判別方法尋找不同類別之間的最優(yōu)分類面研叫，反映的是異類數(shù)據(jù)之間的差異;

判別方法利用了訓(xùn)練數(shù)據(jù)的類別標(biāo)識信息，直接學(xué)習(xí)的是條件概率P(Y|X)或者決策函數(shù)f(X)璧针，直接面對預(yù)測嚷炉，往往學(xué)習(xí)的準(zhǔn)確率更高；

由于直接學(xué)習(xí)條件概率P(Y|X)或者決策函數(shù)f(X)探橱，可以對數(shù)據(jù)進(jìn)行各種程度上的抽象申屹、定義特征并使用特征，因此可以簡化學(xué)習(xí)問題隧膏。

缺點是不能反映訓(xùn)練數(shù)據(jù)本身的特性

判別模型和生成模型對比

（1）訓(xùn)練時哗讥，二者優(yōu)化準(zhǔn)則不同
生成模型優(yōu)化訓(xùn)練數(shù)據(jù)的聯(lián)合分布概率；
判別模型優(yōu)化訓(xùn)練數(shù)據(jù)的條件分布概率私植，判別模型與序列標(biāo)記問題有較好的對應(yīng)性忌栅。
（2）對于觀察序列的處理不同
生成模型中，觀察序列作為模型的一部分曲稼；
判別模型中索绪，觀察序列只作為條件，因此可以針對觀察序列設(shè)計靈活的特征贫悄。
（3）訓(xùn)練復(fù)雜度不同
判別模型訓(xùn)練復(fù)雜度較高瑞驱。
（4）是否支持無指導(dǎo)訓(xùn)練
生成模型支持無指導(dǎo)訓(xùn)練。
（5）本質(zhì)區(qū)別
discriminative model 估計的是條件概率分布(conditional distribution)p(class|context)
generative model 估計的是聯(lián)合概率分布（joint probability distribution）p()

另外窄坦，由生成模型可以得到判別模型唤反，但由判別模型得不到生成模型。

對于跟蹤算法

由于之前用Camshift方法做人臉的跟蹤鸭津，這里看到了有關(guān)跟蹤算法的說明彤侍，特此陳述一下。

跟蹤算法一般來說可以分為兩類：基于外觀模型的生成模型或者基于外觀模型的判別模型逆趋。
生成模型：一般是學(xué)習(xí)一個代表目標(biāo)的模型盏阶，然后通過它去搜索圖像區(qū)域，然后最小化重構(gòu)誤差闻书。類似于生成模型描述一個目標(biāo)名斟，然后就是模式匹配了脑慧，在圖像中找到和這個模型最匹配的區(qū)域，就是目標(biāo)了砰盐。
判別模型：將跟蹤問題看成一個二分類問題闷袒，然后找到目標(biāo)和背景的決策邊界。它不管目標(biāo)是怎么描述的岩梳，那只要知道目標(biāo)和背景的差別在哪囊骤，然后你給一個圖像，它看它處于邊界的那一邊冀值，就歸為哪一類淘捡。

參考資料

統(tǒng)計學(xué)習(xí)方法李航著，清華大學(xué)出版社
CSDN博客生成模型與判別模型

轉(zhuǎn)載請注明作者Jason Ding及其出處
Github主頁(http://jasonding1354.github.io/)
CSDN博客(http://blog.csdn.net/jasonding1354)
簡書主頁(http://www.reibang.com/users/2bd9b48f6ea8/latest_articles)

最后編輯于：2017.11.27 00:12:11

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末池摧，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子激况，更是在濱河造成了極大的恐慌作彤，老刑警劉巖，帶你破解...
沈念sama閱讀 206,126評論 6贊 481
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件乌逐，死亡現(xiàn)場離奇詭異竭讳，居然都是意外死亡，警方通過查閱死者的電腦和手機浙踢，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,254評論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門绢慢，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人洛波，你說我怎么就攤上這事胰舆。” “怎么了蹬挤？”我有些...
開封第一講書人閱讀 152,445評論 0贊 341
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵缚窿，是天一觀的道長。經(jīng)常有香客問我焰扳，道長倦零，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 55,185評論 1贊 278
?港島之戀（遺憾婚禮）
正文為了忘掉前任吨悍，我火速辦了婚禮扫茅，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘育瓜。我一直安慰自己葫隙，他們只是感情好，可當(dāng)我...
茶點故事閱讀 64,178評論 5贊 371
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布爆雹。她就那樣靜靜地躺著停蕉，像睡著了一般愕鼓。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上慧起，一...
開封第一講書人閱讀 48,970評論 1贊 284
城市分裂傳說
那天菇晃，我揣著相機與錄音，去河邊找鬼蚓挤。笑死磺送，一個胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的灿意。我是一名探鬼主播估灿，決...
沈念sama閱讀 38,276評論 3贊 399
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼缤剧！你這毒婦竟也來了馅袁？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 36,927評論 0贊 259
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤荒辕，失蹤者是張志新（化名）和其女友劉穎汗销，沒想到半個月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體抵窒，經(jīng)...
沈念sama閱讀 43,400評論 1贊 300
?護(hù)林員之死
正文獨居荒郊野嶺守林人離奇死亡弛针，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 35,883評論 2贊 323
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了李皇。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片削茁。...
茶點故事閱讀 37,997評論 1贊 333
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖掉房，靈堂內(nèi)的尸體忽然破棺而出茧跋，到底是詐尸還是另有隱情，我是刑警寧澤卓囚，帶...
沈念sama閱讀 33,646評論 4贊 322
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布厌衔，位于F島的核電站，受9級特大地震影響捍岳，放射性物質(zhì)發(fā)生泄漏富寿。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 39,213評論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一锣夹、第九天我趴在偏房一處隱蔽的房頂上張望页徐。院中可真熱鬧，春花似錦银萍、人聲如沸变勇。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,204評論 0贊 19
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽搀绣。三九已至飞袋，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間链患，已是汗流浹背巧鸭。一陣腳步聲響...
開封第一講書人閱讀 31,423評論 1贊 260
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留麻捻，地道東北人纲仍。一個月前我還...
沈念sama閱讀 45,423評論 2贊 352
代替公主和親
正文我出身青樓，卻偏偏與公主長得像贸毕，于是被迫代替她去往敵國和親郑叠。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 42,722評論 2贊 345