機(jī)器學(xué)習(xí)筆記2-生成模型和判別模型

介紹

監(jiān)督學(xué)習(xí)的任務(wù)就是學(xué)習(xí)一個(gè)模型(或者得到一個(gè)目標(biāo)函數(shù))克懊,應(yīng)用這一模型,對給定的輸入預(yù)測相應(yīng)的輸出七蜘。這一模型的一般形式為一個(gè)決策函數(shù)Y=f(X)谭溉,或者條件概率分布P(Y|X)。

監(jiān)督學(xué)習(xí)方法又可以分為生成方法(generative approach)和判別方法(discriminative approach)橡卤。所學(xué)到的模型分別為生成模型(generative model)和判別模型(discriminative model)扮念。


生成方法和生成模型

生成模型:無窮樣本 -> 概率密度模型 -> 產(chǎn)生模型 -> 預(yù)測

生成方法由數(shù)據(jù)學(xué)習(xí)聯(lián)合概率分布P(X,Y),然后求出條件概率分布P(Y|X)=P(X,Y)/P(X)作為預(yù)測的模型碧库。這樣的方法之所以成為生成方法柜与,是因?yàn)?b>模型表示了給定輸入X產(chǎn)生輸出Y的生成關(guān)系。用于隨機(jī)生成的觀察值建模嵌灰,特別是在給定某些隱藏參數(shù)情況下旅挤。典型的生成模型有:樸素貝葉斯法、馬爾科夫模型伞鲫、高斯混合模型。這種方法一般建立在統(tǒng)計(jì)學(xué)和Bayes理論的基礎(chǔ)之上签舞。

生成方法的特點(diǎn)

從統(tǒng)計(jì)的角度表示數(shù)據(jù)的分布情況秕脓,能夠反映同類數(shù)據(jù)本身的相似度;

生成方法還原出聯(lián)合概率分布,而判別方法不能儒搭;

生成方法的學(xué)習(xí)收斂速度更快吠架、即當(dāng)樣本容量增加的時(shí)候,學(xué)到的模型可以更快地收斂于真實(shí)模型搂鲫;

當(dāng)存在隱變量時(shí)傍药,扔可以用生成方法學(xué)習(xí),此時(shí)判別方法不能用


判別方法和判別模型

判別模型:有限樣本 -> 判別函數(shù) -> 預(yù)測模型 -> 預(yù)測

判別方法由數(shù)據(jù)直接學(xué)習(xí)決策函數(shù)f(X)或者條件概率分布P(Y|X)作為預(yù)測的模型魂仍,即判別模型拐辽。判別方法關(guān)心的是對給定的輸入X,應(yīng)該預(yù)測什么樣的輸出Y擦酌。典型的判別模型包括:k近鄰法俱诸、感知機(jī)、決策樹赊舶、邏輯斯蒂回歸模型睁搭、最大熵模型赶诊、支持向量機(jī)、boosting方法和條件隨機(jī)場等园骆。判別模型利用正負(fù)例和分類標(biāo)簽舔痪,關(guān)注在判別模型的邊緣分布。

判別方法的特點(diǎn)

判別方法尋找不同類別之間的最優(yōu)分類面锌唾,反映的是異類數(shù)據(jù)之間的差異;

判別方法利用了訓(xùn)練數(shù)據(jù)的類別標(biāo)識(shí)信息锄码,直接學(xué)習(xí)的是條件概率P(Y|X)或者決策函數(shù)f(X),直接面對預(yù)測鸠珠,往往學(xué)習(xí)的準(zhǔn)確率更高巍耗;

由于直接學(xué)習(xí)條件概率P(Y|X)或者決策函數(shù)f(X),可以對數(shù)據(jù)進(jìn)行各種程度上的抽象渐排、定義特征并使用特征炬太,因此可以簡化學(xué)習(xí)問題。

缺點(diǎn)是不能反映訓(xùn)練數(shù)據(jù)本身的特性


判別模型和生成模型對比

(1)訓(xùn)練時(shí)驯耻,二者優(yōu)化準(zhǔn)則不同

????????生成模型優(yōu)化訓(xùn)練數(shù)據(jù)的聯(lián)合分布概率亲族;

????????判別模型優(yōu)化訓(xùn)練數(shù)據(jù)的條件分布概率,判別模型與序列標(biāo)記問題有較好的對應(yīng)性可缚。

(2)對于觀察序列的處理不同

????????生成模型中霎迫,觀察序列作為模型的一部分;

????????判別模型中帘靡,觀察序列只作為條件知给,因此可以針對觀察序列設(shè)計(jì)靈活的特征。

(3)訓(xùn)練復(fù)雜度不同

????????判別模型訓(xùn)練復(fù)雜度較高描姚。

(4)是否支持無指導(dǎo)訓(xùn)練

????????生成模型支持無指導(dǎo)訓(xùn)練涩赢。

(5)本質(zhì)區(qū)別

????????discriminative model 估計(jì)的是條件概率分布(conditional distribution)p(class|context)

????????generative model 估計(jì)的是聯(lián)合概率分布(joint probability distribution)p()

????????另外,由生成模型可以得到判別模型轩勘,但由判別模型得不到生成模型筒扒。


參考

https://www.cnblogs.com/sddai/p/9588349.html

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市绊寻,隨后出現(xiàn)的幾起案子花墩,更是在濱河造成了極大的恐慌,老刑警劉巖澄步,帶你破解...
    沈念sama閱讀 206,013評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件冰蘑,死亡現(xiàn)場離奇詭異,居然都是意外死亡村缸,警方通過查閱死者的電腦和手機(jī)懂缕,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來王凑,“玉大人搪柑,你說我怎么就攤上這事聋丝。” “怎么了工碾?”我有些...
    開封第一講書人閱讀 152,370評論 0 342
  • 文/不壞的土叔 我叫張陵弱睦,是天一觀的道長。 經(jīng)常有香客問我渊额,道長况木,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,168評論 1 278
  • 正文 為了忘掉前任旬迹,我火速辦了婚禮火惊,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘奔垦。我一直安慰自己屹耐,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,153評論 5 371
  • 文/花漫 我一把揭開白布椿猎。 她就那樣靜靜地躺著惶岭,像睡著了一般。 火紅的嫁衣襯著肌膚如雪犯眠。 梳的紋絲不亂的頭發(fā)上按灶,一...
    開封第一講書人閱讀 48,954評論 1 283
  • 那天,我揣著相機(jī)與錄音筐咧,去河邊找鬼鸯旁。 笑死,一個(gè)胖子當(dāng)著我的面吹牛量蕊,可吹牛的內(nèi)容都是我干的羡亩。 我是一名探鬼主播,決...
    沈念sama閱讀 38,271評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼危融,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了雷袋?” 一聲冷哼從身側(cè)響起吉殃,我...
    開封第一講書人閱讀 36,916評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎楷怒,沒想到半個(gè)月后蛋勺,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,382評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡鸠删,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,877評論 2 323
  • 正文 我和宋清朗相戀三年抱完,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片刃泡。...
    茶點(diǎn)故事閱讀 37,989評論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡巧娱,死狀恐怖碉怔,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情禁添,我是刑警寧澤撮胧,帶...
    沈念sama閱讀 33,624評論 4 322
  • 正文 年R本政府宣布,位于F島的核電站老翘,受9級(jí)特大地震影響芹啥,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜铺峭,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,209評論 3 307
  • 文/蒙蒙 一墓怀、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧卫键,春花似錦傀履、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,199評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至呢袱,卻和暖如春官扣,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背羞福。 一陣腳步聲響...
    開封第一講書人閱讀 31,418評論 1 260
  • 我被黑心中介騙來泰國打工惕蹄, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人治专。 一個(gè)月前我還...
    沈念sama閱讀 45,401評論 2 352
  • 正文 我出身青樓卖陵,卻偏偏與公主長得像,于是被迫代替她去往敵國和親张峰。 傳聞我的和親對象是個(gè)殘疾皇子泪蔫,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,700評論 2 345

推薦閱讀更多精彩內(nèi)容

  • 引入 監(jiān)督學(xué)習(xí)的任務(wù)就是學(xué)習(xí)一個(gè)模型(或者得到一個(gè)目標(biāo)函數(shù)),應(yīng)用這一模型间唉,對給定的輸入預(yù)測相應(yīng)的輸出介评。這一模型的...
    JasonDing閱讀 12,947評論 0 18
  • 原文鏈接 先上結(jié)論公式上看生成模型: 學(xué)習(xí)時(shí)先得到 P(x,y)P(x,y),繼而得到 P(y|x)P(y|x)哪审。...
    半大人閱讀 1,268評論 0 0
  • 機(jī)器學(xué)習(xí)的基礎(chǔ)知識(shí) 相關(guān)概念 人類學(xué)習(xí)知識(shí)機(jī)制:從大量現(xiàn)象中提取反復(fù)出現(xiàn)的規(guī)律與模式饶深。 機(jī)器學(xué)習(xí)是計(jì)算機(jī)基于數(shù)據(jù)構(gòu)...
    wenju_song閱讀 689評論 0 0
  • 首先從監(jiān)督學(xué)習(xí)來認(rèn)識(shí)1餐曹、監(jiān)督學(xué)習(xí)的主要任務(wù)就是學(xué)習(xí)一個(gè)模型,應(yīng)用這一模型敌厘,對給定的輸入預(yù)測相應(yīng)的輸出台猴。這一模型的一...
    一枚小黑閱讀 893評論 0 0
  • 直觀理解 判別模型之所以稱為“判別”模型,是因?yàn)槠涓鶕?jù)X“判別”Y; 生成模型之所以稱為“生成”模型饱狂,是因?yàn)槠漕A(yù)測...
    Trible6閱讀 334評論 0 0