貝葉斯

簡述:從樣本中統(tǒng)計(jì)每個(gè)特征對分類類別的概率,最后求將預(yù)測對象分為每個(gè)類別的概率,取最大為預(yù)測分類

優(yōu)點(diǎn):在數(shù)據(jù)較少的情況下仍然有效桥状,可以處理多分類問題

缺點(diǎn):對于輸入數(shù)據(jù)的準(zhǔn)備方式較為敏感

適用數(shù)據(jù)類型:標(biāo)稱型數(shù)據(jù) ? ? ? ?


概率論是許多機(jī)器學(xué)習(xí)算法的基礎(chǔ)雇初,核心思想:選擇具有最高概率的決策

條件概率:P(A|B) = P(A B)/P(B)

P(C|X) = P(X|C)*P(C)/P(X) 求條件互換概率

獨(dú)立性假設(shè)是指一個(gè)現(xiàn)象的發(fā)生不依賴于其他現(xiàn)象,如一個(gè)詞的出現(xiàn)不依賴于文檔中其他詞烛恤,這個(gè)假設(shè)過于簡單母怜,所以稱之為樸素貝葉斯


拉普拉斯修正:

若某個(gè)屬性值在訓(xùn)練集中沒有與某個(gè)類同時(shí)出現(xiàn)過,則直接基于概率進(jìn)行判別會(huì)出現(xiàn)問題缚柏,*0

將概率P(c) = |Dc|/|D| ?改為P(c) = |Dc+1|/|D|+N, N為類別個(gè)數(shù)


如果對預(yù)測速度要求高苹熏,則對給定訓(xùn)練集,可將所有概率事先計(jì)算存表

如果數(shù)據(jù)更新頻繁币喧,可采用懶惰學(xué)習(xí)轨域,待收到預(yù)測請求后進(jìn)行概率估算

如果數(shù)據(jù)不斷增加,可在現(xiàn)有估值基礎(chǔ)上杀餐,僅對新增樣本所涉及的概率估值進(jìn)行計(jì)算修正干发,實(shí)現(xiàn)增量學(xué)習(xí)


半樸素貝葉斯分類

適當(dāng)放松獨(dú)立性假設(shè)

獨(dú)依賴估計(jì):假設(shè)每個(gè)屬性在類別之外最多僅依賴于一個(gè)其他屬性

SPODE:通過交叉驗(yàn)證等選擇方法確定“超父”屬性,所以其他屬性依賴這個(gè)超父屬性

TAN:以屬性的條件互信息為權(quán)構(gòu)建最大生成樹

AODE:基于集成學(xué)習(xí)史翘,嘗試將每個(gè)屬性作為超父來構(gòu)建SPODE枉长,將SPODE集成起來作為最終結(jié)果


貝葉斯網(wǎng)

有向無環(huán)圖,以屬性為點(diǎn)琼讽,量化依賴關(guān)系為邊必峰,有效表達(dá)屬性間的條件獨(dú)立性

道德圖:找到所有V型結(jié)構(gòu),在兩個(gè)父節(jié)點(diǎn)上加上一條無向邊钻蹬,將所有有向邊改為無向邊吼蚁,

若X,Y能被變量集合Z切開,則X,Y存在基于Z的條件獨(dú)立關(guān)系

“評分搜索”是求解貝葉斯網(wǎng)的常見辦法问欠,詳見西瓜書P160

使用貝葉斯網(wǎng)可根據(jù)已有屬性值推斷其余屬性值:

精確推斷是NP難的肝匆,近似推斷常采用吉布斯采樣

吉布斯采樣:在E= e的基礎(chǔ)上采樣T次,計(jì)算其中Q=q的次數(shù)

實(shí)質(zhì)上實(shí)在貝葉斯網(wǎng)所有變量的聯(lián)合狀態(tài)空間與證據(jù)E=e一致的子空間中進(jìn)行隨機(jī)游走


EM算法

隱變量:未觀測到的變量

X:表示已觀測到的變量集顺献,Z:表示未觀測到的變量集旗国,欲對Θ做極大似然估計(jì),則應(yīng)最大化對數(shù)似然:

LL(Θ|X,Z)= lnP(X,Z|Θ)

Z未知注整,上式無法直接求解粗仓,需通過對Z計(jì)算期望嫁怀,來最大化已觀測數(shù)據(jù)的對數(shù)“邊際似然”

流程:

E步:基于Θt 推斷隱變量Z的期望,記為Zt(推斷Z的分布P(Z|X,Θt), 并計(jì)算對數(shù)似然LL((Θ|X,Z) 關(guān)于Z的期望)

M步:基于Zt和X對參數(shù)Θ做極大似然估計(jì)借浊,記為Θt+1(尋找參數(shù)最大化期望似然)

直到收斂

常用來學(xué)習(xí)高斯混合模型GMM的參數(shù)塘淑,K均值聚類就是典型的EM算法

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市蚂斤,隨后出現(xiàn)的幾起案子存捺,更是在濱河造成了極大的恐慌,老刑警劉巖曙蒸,帶你破解...
    沈念sama閱讀 219,110評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件捌治,死亡現(xiàn)場離奇詭異,居然都是意外死亡纽窟,警方通過查閱死者的電腦和手機(jī)肖油,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,443評論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來臂港,“玉大人森枪,你說我怎么就攤上這事∩竽酰” “怎么了县袱?”我有些...
    開封第一講書人閱讀 165,474評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長佑力。 經(jīng)常有香客問我式散,道長,這世上最難降的妖魔是什么打颤? 我笑而不...
    開封第一講書人閱讀 58,881評論 1 295
  • 正文 為了忘掉前任暴拄,我火速辦了婚禮,結(jié)果婚禮上编饺,老公的妹妹穿的比我還像新娘乖篷。我一直安慰自己,他們只是感情好反肋,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,902評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著踏施,像睡著了一般石蔗。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上畅形,一...
    開封第一講書人閱讀 51,698評論 1 305
  • 那天养距,我揣著相機(jī)與錄音,去河邊找鬼日熬。 笑死棍厌,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播耘纱,決...
    沈念sama閱讀 40,418評論 3 419
  • 文/蒼蘭香墨 我猛地睜開眼敬肚,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了束析?” 一聲冷哼從身側(cè)響起艳馒,我...
    開封第一講書人閱讀 39,332評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎员寇,沒想到半個(gè)月后弄慰,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,796評論 1 316
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡蝶锋,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,968評論 3 337
  • 正文 我和宋清朗相戀三年陆爽,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片扳缕。...
    茶點(diǎn)故事閱讀 40,110評論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡慌闭,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出第献,到底是詐尸還是另有隱情贡必,我是刑警寧澤,帶...
    沈念sama閱讀 35,792評論 5 346
  • 正文 年R本政府宣布庸毫,位于F島的核電站仔拟,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏飒赃。R本人自食惡果不足惜利花,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,455評論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望载佳。 院中可真熱鬧炒事,春花似錦、人聲如沸蔫慧。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,003評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽姑躲。三九已至睡扬,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間黍析,已是汗流浹背卖怜。 一陣腳步聲響...
    開封第一講書人閱讀 33,130評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留阐枣,地道東北人马靠。 一個(gè)月前我還...
    沈念sama閱讀 48,348評論 3 373
  • 正文 我出身青樓奄抽,卻偏偏與公主長得像,于是被迫代替她去往敵國和親甩鳄。 傳聞我的和親對象是個(gè)殘疾皇子逞度,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,047評論 2 355

推薦閱讀更多精彩內(nèi)容