EM算法

EM算法

EM算法基本思想

? 最大期望算法(Expectation-Maximization algorithm, EM)耸彪,是一類通過(guò)迭代進(jìn)行極大似然估計(jì)的優(yōu)化算法造成,通常作為牛頓迭代法的替代局蚀,用于對(duì)包含隱變量或缺失數(shù)據(jù)的概率模型進(jìn)行參數(shù)估計(jì)彻桃。

? 最大期望算法基本思想是經(jīng)過(guò)兩個(gè)步驟交替進(jìn)行計(jì)算:

? 第一步是計(jì)算期望(E)急但,利用對(duì)隱藏變量的現(xiàn)有估計(jì)值澎媒,計(jì)算其最大似然估計(jì)值

? 第二步是最大化(M),最大化在E步上求得的最大似然值來(lái)計(jì)算參數(shù)的值波桩。

? M步上找到的參數(shù)估計(jì)值被用于下一個(gè)E步計(jì)算中戒努,這個(gè)過(guò)程不斷交替進(jìn)行。

EM算法推導(dǎo)

? 對(duì)于m個(gè)樣本觀察數(shù)據(jù)x=(x^{1},x^{2},...,x^{m})镐躲,現(xiàn)在想找出樣本的模型參數(shù)\theta储玫,其極大化模型分布的對(duì)數(shù)似然函數(shù)為:
\theta = \mathop{\arg\max}_\theta\sum\limits_{i=1}^m logP(x^{(i)};\theta)
如果得到的觀察數(shù)據(jù)有未觀察到的隱含數(shù)據(jù)z=(z^{(1)},z^{(2)},...z^{(m)}),極大化模型分布的對(duì)數(shù)似然函數(shù)則為:
\theta =\mathop{\arg\max}_\theta\sum\limits_{i=1}^m logP(x^{(i)};\theta) = \mathop{\arg\max}_\theta\sum\limits_{i=1}^m log\sum\limits_{z^{(i)}}P(x^{(i)}, z^{(i)};\theta) \tag{a}
由于上式不能直接求出\theta萤皂,采用縮放技巧:
\sum\limits_{i=1}^m log\sum\limits_{z^{(i)}}P(x^{(i)}, z^{(i)};\theta) = \sum\limits_{i=1}^m log\sum\limits_{z^{(i)}}Q_i(z^{(i)})\frac{P(x^{(i)}, z^{(i)};\theta)}{Q_i(z^{(i)})} \\ \geqslant \sum\limits_{i=1}^m \sum\limits_{z^{(i)}}Q_i(z^{(i)})log\frac{P(x^{(i)}, z^{(i)};\theta)}{Q_i(z^{(i)})}
上式用到了Jensen不等式:
log\sum\limits_j\lambda_jy_j \geqslant \sum\limits_j\lambda_jlogy_j\;\;, \lambda_j \geqslant 0, \sum\limits_j\lambda_j =1
并且引入了一個(gè)未知的新分布Q_i(z^{(i)})撒穷。

此時(shí),如果需要滿足Jensen不等式中的等號(hào)裆熙,所以有:
\frac{P(x^{(i)}, z^{(i)};\theta)}{Q_i(z^{(i)})} =c, c為常數(shù)
由于Q_i(z^{(i)})是一個(gè)分布端礼,所以滿足
\sum\limits_{z}Q_i(z^{(i)}) =1
綜上禽笑,可得:
Q_i(z^{(i)}) = \frac{P(x^{(i)}, z^{(i)};\theta)}{\sum\limits_{z}P(x^{(i)}, z^{(i)};\theta)} = \frac{P(x^{(i)}, z^{(i)};\theta)}{P(x^{(i)};\theta)} = P( z^{(i)}|x^{(i)};\theta)
如果Q_i(z^{(i)}) = P( z^{(i)}|x^{(i)};\theta) 蛤奥,則第(1)式是我們的包含隱藏?cái)?shù)據(jù)的對(duì)數(shù)似然的一個(gè)下界蒲每。如果我們能極大化這個(gè)下界,則也在嘗試極大化我們的對(duì)數(shù)似然喻括。即我們需要最大化下式:
\mathop{\arg\max}_\theta \sum\limits_{i=1}^m \sum\limits_{z^{(i)}}Q_i(z^{(i)})log\frac{P(x^{(i)}邀杏, z^{(i)};\theta)}{Q_i(z^{(i)})}
簡(jiǎn)化得:
\mathop{\arg\max}_\theta \sum\limits_{i=1}^m \sum\limits_{z^{(i)}}Q_i(z^{(i)})log{P(x^{(i)}, z^{(i)};\theta)}
以上即為EM算法的M步,\sum\limits_{z^{(i)}}Q_i(z^{(i)})log{P(x^{(i)}, z^{(i)};\theta)}?可理解為logP(x^{(i)}, z^{(i)};\theta)基于條件概率分布Q_i(z^{(i)})的期望唬血。以上即為EM算法中E步和M步的具體數(shù)學(xué)含義望蜡。

圖解EM算法

? 考慮上一節(jié)中的(a)式,表達(dá)式中存在隱變量拷恨,直接找到參數(shù)估計(jì)比較困難脖律,通過(guò)EM算法迭代求解下界的最大值到收斂為止。

在這里插入圖片描述

? 圖片中的紫色部分是我們的目標(biāo)模型p(x|\theta)腕侄,該模型復(fù)雜小泉,難以求解析解,為了消除隱變量z^{(i)}的影響冕杠,我們可以選擇一個(gè)不包含z^{(i)}的模型r(x|\theta)微姊,使其滿足條件r(x|\theta) \leqslant p(x|\theta)

求解步驟如下:

(1)選取\theta_1分预,使得r(x|\theta_1) = p(x|\theta_1)兢交,然后對(duì)此時(shí)的r求取最大值,得到極值點(diǎn)\theta_2笼痹,實(shí)現(xiàn)參數(shù)的更新配喳。

(2)重復(fù)以上過(guò)程到收斂為止,在更新過(guò)程中始終滿足r \leqslant p.

EM算法流程

輸入:觀察數(shù)據(jù)x=(x^{(1)},x^{(2)},...x^{(m)})凳干,聯(lián)合分布p(x,z ;\theta)晴裹,條件分布p(z|x; \theta),最大迭代次數(shù)J

1)隨機(jī)初始化模型參數(shù)\theta的初值\theta^0救赐。

2)for \ j \ from \ 1 \ to \ J

? a) E步涧团。計(jì)算聯(lián)合分布的條件概率期望:
Q_i(z^{(i)}) = P( z^{(i)}|x^{(i)}, \theta^{j})

L(\theta, \theta^{j}) = \sum\limits_{i=1}^m\sum\limits_{z^{(i)}}P( z^{(i)}|x^{(i)}, \theta^{j})log{P(x^{(i)}, z^{(i)};\theta)}

? b) M步。極大化L(\theta, \theta^{j})净响,得到\theta^{j+1}:
\theta^{j+1} = \mathop{\arg\max}_\theta L(\theta, \theta^{j})
? c) 如果\theta^{j+1}收斂少欺,則算法結(jié)束。否則繼續(xù)回到步驟a)進(jìn)行E步迭代馋贤。

輸出:模型參數(shù)\theta?

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末畏陕,一起剝皮案震驚了整個(gè)濱河市配乓,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖犹芹,帶你破解...
    沈念sama閱讀 206,839評(píng)論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件崎页,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡腰埂,警方通過(guò)查閱死者的電腦和手機(jī)飒焦,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)屿笼,“玉大人牺荠,你說(shuō)我怎么就攤上這事÷恳唬” “怎么了休雌?”我有些...
    開(kāi)封第一講書(shū)人閱讀 153,116評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)肝断。 經(jīng)常有香客問(wèn)我杈曲,道長(zhǎng),這世上最難降的妖魔是什么胸懈? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 55,371評(píng)論 1 279
  • 正文 為了忘掉前任担扑,我火速辦了婚禮,結(jié)果婚禮上趣钱,老公的妹妹穿的比我還像新娘魁亦。我一直安慰自己,他們只是感情好羔挡,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,384評(píng)論 5 374
  • 文/花漫 我一把揭開(kāi)白布洁奈。 她就那樣靜靜地躺著,像睡著了一般绞灼。 火紅的嫁衣襯著肌膚如雪利术。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 49,111評(píng)論 1 285
  • 那天低矮,我揣著相機(jī)與錄音印叁,去河邊找鬼。 笑死军掂,一個(gè)胖子當(dāng)著我的面吹牛轮蜕,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播蝗锥,決...
    沈念sama閱讀 38,416評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼跃洛,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了终议?” 一聲冷哼從身側(cè)響起汇竭,我...
    開(kāi)封第一講書(shū)人閱讀 37,053評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤葱蝗,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后细燎,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體两曼,經(jīng)...
    沈念sama閱讀 43,558評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,007評(píng)論 2 325
  • 正文 我和宋清朗相戀三年玻驻,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了悼凑。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,117評(píng)論 1 334
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡璧瞬,死狀恐怖户辫,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情彪蓬,我是刑警寧澤寸莫,帶...
    沈念sama閱讀 33,756評(píng)論 4 324
  • 正文 年R本政府宣布,位于F島的核電站档冬,受9級(jí)特大地震影響膘茎,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜酷誓,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,324評(píng)論 3 307
  • 文/蒙蒙 一披坏、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧盐数,春花似錦棒拂、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,315評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至漾峡,卻和暖如春攻旦,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背生逸。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,539評(píng)論 1 262
  • 我被黑心中介騙來(lái)泰國(guó)打工牢屋, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人槽袄。 一個(gè)月前我還...
    沈念sama閱讀 45,578評(píng)論 2 355
  • 正文 我出身青樓烙无,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親遍尺。 傳聞我的和親對(duì)象是個(gè)殘疾皇子截酷,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,877評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容