EM算法

EM算法是含有隱變量的概率模型參數(shù)的極大似然估計(jì)法。

一爹橱、三硬幣模型

??假設(shè)有3枚硬幣,分別記作A,B,C窄做。這些硬幣正面出現(xiàn)的概率分別是\pi,p和q愧驱。進(jìn)行如下拋硬幣試驗(yàn):
??先擲硬幣A,根據(jù)其結(jié)果選出硬幣B或硬幣C浸策,正面選硬幣B冯键,反面選硬幣C;然后擲選出的硬幣庸汗,擲硬幣的結(jié)果惫确,出現(xiàn)正面記作1,出現(xiàn)反面記作0;獨(dú)立地重復(fù)n次試驗(yàn)(這里改化,n=10),觀測(cè)結(jié)果如下:
            1,1,0,1,0,0,1,0,1,1
??假設(shè)只能觀測(cè)到擲硬幣的結(jié)果掩蛤,不能觀測(cè)到擲硬幣的過(guò)程,問(wèn)如何估計(jì)三硬幣正面出現(xiàn)的概率陈肛,即三硬幣模型的參數(shù)揍鸟。

設(shè)y是觀測(cè)變量,表示觀測(cè)結(jié)果01句旱;Z是隱變量阳藻,表示未觀測(cè)到的擲硬幣A的結(jié)果;\theta=(\pi,p,q)是模型參數(shù)谈撒。

示意圖

y為可觀測(cè)變量腥泥,取值為{0,1},觀測(cè)結(jié)果取決于Z的取值啃匿,y,Z均服從0-1分布蛔外。
三硬幣模型可以寫(xiě)作:
P(y|\theta)=\sum_{z}P(y,z|\theta)=\sum_{z}P(z|\theta)P(y|z,\theta)

因此:
P(y=1|\theta)=\pi p+(1-\pi)q

P(y=0|\theta)=\pi (1-p)+(1-\pi)(1-q)

等價(jià)于
P(y|\theta)=\sum_{z}P(y,z|\theta)=\pi p^y(1-p)^{1-y}+(1-\pi)q^y(1-q)^{1-y}

將觀測(cè)數(shù)據(jù)表示為Y=(Y_1,Y_2...Y_n)^{T},未觀測(cè)數(shù)據(jù)表示為Z=(Z_1,Z_2...Z_n)^{T}溯乒,則觀測(cè)數(shù)據(jù)的似然函數(shù)為:
P(Y|\theta)=\prod_{i=1}^n[\pi p^{y_i}(1-p)^{1-y_i}+(1-\pi)q^{y_i}(1-q)^{1-y_i}]

求參數(shù)\theta=(\pi,p,q)的極大似然估計(jì):

\hat{\theta}=\mathop{argmax}\limits_{\theta}  logP(Y|\theta)

二夹厌、EM算法

E步:基于\Theta^t推斷隱變量Z的期望,記為Z^t
M步:基于已觀測(cè)變量XZ^t對(duì)參數(shù)\Theta做極大似然估計(jì)裆悄,記為\Theta^{t+1}

對(duì)于一個(gè)含有隱變量的概率模型矛纹,目標(biāo)是極大化觀測(cè)數(shù)據(jù)Y關(guān)于參數(shù)\theta的極大似然函數(shù)L(\theta)
L(\theta)=logP(Y|\theta)=logE_zP(Y,Z|\theta)=log\sum_zP(Z|\theta)P(Y|Z,\theta)

EM算法通過(guò)逐步迭代近似極大化L(\theta),假設(shè)第i次迭代后\theta的估計(jì)值是\theta^{(i)}灯帮,則有L(\theta)>L(\theta^{(i)})崖技。

由Jensen不等式:E[f(X)]>f[E(X)]

因此:

L(\theta)-L(\theta^{(i)})

=log[\sum_zP(Z|\theta)P(Y|Z,\theta)]-logP(Y|\theta^{(i)})

=log[\sum_zP(Y|Z,\theta^{(i)})\frac{P(Z|\theta)P(Y|Z,\theta)}{P(Y|Z,\theta^{(i)})}]-logP(Y|\theta^{(i)})

>=\sum_zP(Z|Y,\theta^{(i)})log\frac{P(Z|\theta)P(Y|Z,\theta)}{P(Z|Y,\theta^{(i)})}-logP(Y|\theta^{(i)})

=\sum_zP(Z|Y,\theta^{(i)})log\frac{P(Z|\theta)P(Y|Z,\theta)}{P(Z|Y,\theta^{(i)})P(Y|\theta^{(i)})}

EM算法是不斷求解下界的極大化逼近求解對(duì)數(shù)似然函數(shù)極大化。
因此:

Q函數(shù):
Q(\theta,\theta^{(i)})=E_z[logP(Y,Z|\theta)|Y,\theta^{(i)}]

EM算法:
  • 選取參數(shù)初值:\theta^{(0)}
  • E步:計(jì)算Q(\theta,\theta^{(i)})
  • M步:求使 Q(\theta,\theta^{(i)})極大化的\theta钟哥,確定第i+1次參數(shù)迭代的估計(jì)值\theta^{(i+1)}
           \theta^{(i+1)}=\mathop{argmax}\limits_{\theta}Q(\theta,\theta^{(i)})
    重復(fù)E步和M步直到收斂迎献。
  • 停止條件:

||\theta^{(i+1)}-\theta^{(i)}||<\varepsilon_1||Q(\theta,\theta^{(i+1)})-Q(\theta,\theta^{(i)})||<\varepsilon_2

三、EM求解三硬幣模型

E步:

\mu_j^{(i+1)}= P(Z=1|Y,\theta^{(i)})=\frac{P(Y,Z|\theta^{(i)})}{P(Y|\theta^{(i)})}=\frac{P(Y|Z,\theta^{(i)})P(Z))}{P(Y|\theta^{(i)})}
       =\frac{\pi^{(i)} (p^{(i)})^{y_j}(1-p^{(i)})^{1-y_j}}{\pi^{(i)} (p^{(i)})^{y_j}(1-p^{(i)})^{1-y_j}+(1-\pi^{(i)})(q^{(i)})^{y_j}(1-q^{(i)})^{(1-y_j)} }

P(Y,Z=1|\theta)=P(Z=1|\theta)P(Y|Z=1,\theta)=\pi p^{y_j}(1-p)^{1-y_j}

P(Y,Z=0|\theta)=P(Z=0|\theta)P(Y|Z=0,\theta)=(1-\pi) q^{y_j}(1-q)^{1-y_j}

代入Q(\theta,\theta^{(i)})=\sum_zP(Z|Y,\theta^{(i)})logP(Y,Z|\theta)

M步:

對(duì)Q求偏導(dǎo)得到\theta^{(i)}的估計(jì)為:

參考:
李航《統(tǒng)計(jì)學(xué)習(xí)方法》
https://blog.csdn.net/wendaomudong_l2d4/article/details/79005461

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末腻贰,一起剝皮案震驚了整個(gè)濱河市吁恍,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌播演,老刑警劉巖冀瓦,帶你破解...
    沈念sama閱讀 216,372評(píng)論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異写烤,居然都是意外死亡翼闽,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門洲炊,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)感局,“玉大人尼啡,你說(shuō)我怎么就攤上這事⊙ⅲ” “怎么了崖瞭?”我有些...
    開(kāi)封第一講書(shū)人閱讀 162,415評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)撑毛。 經(jīng)常有香客問(wèn)我书聚,道長(zhǎng),這世上最難降的妖魔是什么藻雌? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,157評(píng)論 1 292
  • 正文 為了忘掉前任雌续,我火速辦了婚禮,結(jié)果婚禮上蹦疑,老公的妹妹穿的比我還像新娘西雀。我一直安慰自己,他們只是感情好歉摧,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,171評(píng)論 6 388
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著腔呜,像睡著了一般叁温。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上核畴,一...
    開(kāi)封第一講書(shū)人閱讀 51,125評(píng)論 1 297
  • 那天膝但,我揣著相機(jī)與錄音,去河邊找鬼谤草。 笑死跟束,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的丑孩。 我是一名探鬼主播冀宴,決...
    沈念sama閱讀 40,028評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼温学!你這毒婦竟也來(lái)了略贮?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 38,887評(píng)論 0 274
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤仗岖,失蹤者是張志新(化名)和其女友劉穎逃延,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體轧拄,經(jīng)...
    沈念sama閱讀 45,310評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡揽祥,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,533評(píng)論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了檩电。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片拄丰。...
    茶點(diǎn)故事閱讀 39,690評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡府树,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出愈案,到底是詐尸還是另有隱情挺尾,我是刑警寧澤,帶...
    沈念sama閱讀 35,411評(píng)論 5 343
  • 正文 年R本政府宣布站绪,位于F島的核電站遭铺,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏恢准。R本人自食惡果不足惜魂挂,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,004評(píng)論 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望馁筐。 院中可真熱鬧涂召,春花似錦、人聲如沸敏沉。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,659評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)盟迟。三九已至秋泳,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間攒菠,已是汗流浹背迫皱。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,812評(píng)論 1 268
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留辖众,地道東北人卓起。 一個(gè)月前我還...
    沈念sama閱讀 47,693評(píng)論 2 368
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像凹炸,于是被迫代替她去往敵國(guó)和親戏阅。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,577評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容