判別模型 vs 生成模型

tags: 機(jī)器學(xué)習(xí)


監(jiān)督學(xué)習(xí)模型

監(jiān)督學(xué)習(xí)的任務(wù)是學(xué)習(xí)一個模型球昨,對給定的輸入預(yù)測相應(yīng)的輸出惹挟,這個模型的一般形式維一個決策函數(shù)或一個條件概率分布

  • 決策函數(shù):輸入 X 返回 Y;其中 Y 與一個閾值比較摇邦,然后根據(jù)比較結(jié)果判定 X 的類別 Y = f(X)

  • 條件概率分布:輸入 X 返回 X 屬于每個類別的概率召烂;將其中概率最大的作為 X 所屬的類別 P = (Y|X)

1. 判別模型

  • 代表:K 近鄰贡避、感知機(jī)(神經(jīng)網(wǎng)絡(luò))继准、決策樹、邏輯斯蒂回歸棘街、最大熵模型蟆盐、SVM、提升方法遭殉、條件隨機(jī)場
  • 思想: 由數(shù)據(jù)直接學(xué)習(xí)決策函數(shù) Y=f(X)條件概率分布 P(Y|X) 作為預(yù)測的模型石挂。
  • 理解: 直觀的說,判別模型學(xué)習(xí)的是類別之間的最優(yōu)分隔面险污,反映的是不同類數(shù)據(jù)之間的差異
  • 舉例:要確定一個羊是山羊還是綿羊痹愚,用判別模型的方法是從歷史數(shù)據(jù)中學(xué)習(xí)到模型,然后通過提取這只羊的特征來預(yù)測出這只羊是山羊的概率,是綿羊的概率拯腮。

2. 生成模型

  • 代表:樸素貝葉斯窖式、隱馬爾可夫模型、混合高斯模型疾瓮、貝葉斯網(wǎng)絡(luò)脖镀、馬爾可夫隨機(jī)場

  • 思想:由數(shù)據(jù)學(xué)習(xí)得到聯(lián)合概率密度分布 P(X,Y)飒箭, 然后求出條件概率分布 P(Y|X) 作為預(yù)測的模型: P(Y|X) = \frac{P(X,Y)}{P(X)}

  • 舉例:利用生成模型是根據(jù)山羊的特征首先學(xué)習(xí)出一個山羊的模型狼电,然后根據(jù)綿羊的特征學(xué)習(xí)出一個綿羊的模型,然后從這只羊中提取特征弦蹂,放到山羊模型中看概率多少肩碟,放到綿羊模型中看概率多少,哪個大就是哪個凸椿。

3. 判別模型 vs 生成模型

  • 由生成模型能夠得到判別模型削祈,但由判別模型得不到生成模型

  • 當(dāng)存在“隱變量”時(shí),只能使用生成模型

隱變量:當(dāng)我們找不到引起某一現(xiàn)象的原因時(shí)脑漫,就把這個在起作用髓抑,但無法確定的因素,叫“隱變量”

  • 判別方法的特點(diǎn):

    • 缺點(diǎn):不能反映訓(xùn)練數(shù)據(jù)本身的特性优幸。
    • 優(yōu)點(diǎn):它尋找不同類別之間的最優(yōu)分類面吨拍,反映的是異類數(shù)據(jù)之間的差異。
    • 優(yōu)點(diǎn):直接面對預(yù)測网杆,往往學(xué)習(xí)的準(zhǔn)確率更高羹饰。
    • 優(yōu)點(diǎn):由于直接學(xué)習(xí)P(Y|X)或P(X),可以對數(shù)據(jù)進(jìn)行各種程度上的抽象碳却、定義特征并使用特征队秩,因此可以簡化學(xué)習(xí)問題。
  • 生成方法的特點(diǎn):

    • 優(yōu)點(diǎn): 可以從統(tǒng)計(jì)的角度表示數(shù)據(jù)的分布情況昼浦,能夠反映同類數(shù)據(jù)本身的相似度**馍资。但它不關(guān)心到底劃分各類的那個分類邊界在哪。
    • 優(yōu)點(diǎn):生成方法的學(xué)習(xí)收斂速度更快关噪,即當(dāng)樣本容量增加的時(shí)候迷帜,學(xué)到的模型可以更快的收斂于真實(shí)模型。
    • 優(yōu)點(diǎn):當(dāng)存在隱變量時(shí)色洞,仍可以用生成方法學(xué)習(xí)戏锹。此時(shí)判別方法就不能用。
    • 缺點(diǎn):學(xué)習(xí)和計(jì)算過程比較復(fù)雜

QA

1. 生成模型和判別模型基本形式火诸,有哪些锦针?

  • 生成模型: 樸素貝葉斯、HMM、混合高斯模型奈搜、馬爾科夫隨機(jī)場
  • 判別模型: LR悉盆,SVM,神經(jīng)網(wǎng)絡(luò)馋吗,CRF焕盟,Boosting
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市宏粤,隨后出現(xiàn)的幾起案子脚翘,更是在濱河造成了極大的恐慌,老刑警劉巖绍哎,帶你破解...
    沈念sama閱讀 222,183評論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件来农,死亡現(xiàn)場離奇詭異,居然都是意外死亡崇堰,警方通過查閱死者的電腦和手機(jī)沃于,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,850評論 3 399
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來海诲,“玉大人繁莹,你說我怎么就攤上這事√蒯#” “怎么了咨演?”我有些...
    開封第一講書人閱讀 168,766評論 0 361
  • 文/不壞的土叔 我叫張陵,是天一觀的道長敬辣。 經(jīng)常有香客問我雪标,道長,這世上最難降的妖魔是什么溉跃? 我笑而不...
    開封第一講書人閱讀 59,854評論 1 299
  • 正文 為了忘掉前任村刨,我火速辦了婚禮,結(jié)果婚禮上撰茎,老公的妹妹穿的比我還像新娘嵌牺。我一直安慰自己,他們只是感情好龄糊,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,871評論 6 398
  • 文/花漫 我一把揭開白布逆粹。 她就那樣靜靜地躺著,像睡著了一般炫惩。 火紅的嫁衣襯著肌膚如雪僻弹。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,457評論 1 311
  • 那天他嚷,我揣著相機(jī)與錄音蹋绽,去河邊找鬼芭毙。 笑死,一個胖子當(dāng)著我的面吹牛卸耘,可吹牛的內(nèi)容都是我干的退敦。 我是一名探鬼主播,決...
    沈念sama閱讀 40,999評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼蚣抗,長吁一口氣:“原來是場噩夢啊……” “哼侈百!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起翰铡,我...
    開封第一講書人閱讀 39,914評論 0 277
  • 序言:老撾萬榮一對情侶失蹤钝域,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后两蟀,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體网梢,經(jīng)...
    沈念sama閱讀 46,465評論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡震缭,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,543評論 3 342
  • 正文 我和宋清朗相戀三年赂毯,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片拣宰。...
    茶點(diǎn)故事閱讀 40,675評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡党涕,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出巡社,到底是詐尸還是另有隱情膛堤,我是刑警寧澤,帶...
    沈念sama閱讀 36,354評論 5 351
  • 正文 年R本政府宣布晌该,位于F島的核電站肥荔,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏朝群。R本人自食惡果不足惜燕耿,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,029評論 3 335
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望姜胖。 院中可真熱鬧誉帅,春花似錦、人聲如沸右莱。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,514評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽慢蜓。三九已至亚再,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間晨抡,已是汗流浹背氛悬。 一陣腳步聲響...
    開封第一講書人閱讀 33,616評論 1 274
  • 我被黑心中介騙來泰國打工饲鄙, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人圆雁。 一個月前我還...
    沈念sama閱讀 49,091評論 3 378
  • 正文 我出身青樓忍级,卻偏偏與公主長得像,于是被迫代替她去往敵國和親伪朽。 傳聞我的和親對象是個殘疾皇子轴咱,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,685評論 2 360

推薦閱讀更多精彩內(nèi)容