Variational Inference 變分推斷

自從接觸深度學(xué)習(xí)后援制,每每遇到相關(guān)數(shù)學(xué)公式都頭疼。其中變分推斷出現(xiàn)的頻率之多芍瑞,讓我一見它到便跳過直接看與其相關(guān)的結(jié)果晨仑。所以,經(jīng)常處于模模糊糊半懂不懂的狀態(tài)拆檬,讓我十分痛苦洪己。于是,這幾天我便想結(jié)束這種痛苦竟贯,故仔細(xì)的看了相關(guān)資料答捕,并作如下小結(jié)。

變分推斷簡單來說便是需要根據(jù)已有數(shù)據(jù)推斷需要的分布P屑那;當(dāng)P不容易表達(dá)拱镐,不能直接求解時(shí),可以嘗試用變分推斷的方法持际。即沃琅,尋找容易表達(dá)和求解的分布Q,當(dāng)QP的差距很小的時(shí)候蜘欲,Q就可以作為P的近似分布代替P益眉。

數(shù)學(xué)推導(dǎo)


學(xué)過概率論的人一般都會(huì)知道貝葉斯公式:P(z|x)=\frac{P(x,z)}{P(x)} \tag{1.1}同理,P(x,z)=P(x|z)P(z) \tag{1.2}其中P(z|x)被稱作后驗(yàn)概率,P(x|z)被稱為似然度郭脂,P(z)則是先驗(yàn)概率空繁。經(jīng)過簡單的交換可得:P(x)=\frac{P(x,z)}{P(z|x)} \tag{1.3}

對(1.3)式左右兩側(cè)取底為e的對數(shù),并且右式同除Q(z)(Q(z)作用下面將解釋)
\begin{align*}\ln P(x)&=\ln P(x,z)-\ln P(z|x) \tag{1.4}\\ &=\ln{\frac{P(x,z)}{Q(z)}}-\ln{\frac{P(z|x)}{Q(z)}}\\ &=\ln{P(x,z)}-\ln{Q(z)}-\ln{\frac{P(z|x)}{Q(z)}}\\ \end{align*}
對于式(1.4)兩邊取期望:
\begin{align*} \int_{z}\ln{P(x)}Q(z)dz&=\ln{P(x)}\tag{1.5}\\ &=\underbrace{\int_z{\ln{P(x,z)}Q(z)dz-\int_z\ln{Q(z)}Q(z)dz}}_{L(Q)-Evidence Lower Bound(ELOB)}\underbrace{-\int_z{\ln{\frac{P(z|x)}{Q(z)}Q(z)dz}}}_{KL(Q||P)}\\ \end{align*}
計(jì)算到此,我們要思考一個(gè)問題:何時(shí)ELOB達(dá)到最大值朱庆?這個(gè)問題其實(shí)很簡單盛泡,由于KL散度本身大于等于0,所以\ln{P(x)}便是ELOB的上界
我們不是討論變分推斷嗎娱颊,為什么討論起ELOB了呢傲诵?其實(shí)上面我們提到了用Q去逼近P,所以式(1.4)從而引進(jìn)了Q(z)箱硕。而衡量兩個(gè)分布的相似程度的一種標(biāo)準(zhǔn)便是KL散度拴竹,KL的值越小表示兩種分布越相似。什么時(shí)候最小呢剧罩?只要KL=0便是最小栓拜,這個(gè)條件看似說明了一切,但是我們只知道Q不知道P的分布啊惠昔,沒法確定兩者是否為0幕与,所以KL=0便成了一個(gè)雞肋的條件,食之無味镇防,棄之可惜啊啦鸣。這時(shí)候救世主ELOB出現(xiàn)了,她的光輝照耀世界~(中二ing来氧,笑)诫给。

式(1.5)分為兩部分,既然我們沒法確定KL散度啦扬,我們只好利用ELOB(ELOB可以看做是Q(z)的函數(shù)——即函數(shù)的函數(shù)(泛函中狂,本學(xué)渣只聽說過沒有正式學(xué)習(xí)過))。既然KL散度要得到最小扑毡,那么就要設(shè)法使ELOB到達(dá)最大胃榕。

是時(shí)候展示真正的技術(shù)了——EZ

下面證明ELOB的上界:
\begin{align*} \ln{P(x)}=&\ln{\int_z{P(x,z)dz}}\\ &=\ln{\int_z{\frac{P(x,z)}{Q(z)}Q(z)dz}}\\ &=\ln{\Bbb{E_{Q(Z)}}[\frac{P(x,z)}{Q(z)}]}\\ (由詹森不等式可得)&\geq{\Bbb{E_{Q(Z)}}[\frac{\ln{P(x,z)}}{Q(z)}]}\\ &=\underbrace{\Bbb{E_{Q(Z)}}[\ln{P(x,z)}]-\Bbb{E_{Q(Z)}}[\ln{Q(z)}]}_{ELOB}\\ \end{align*}
以上我們知道了通過使得ELOB最大化的這種間接的方式從而使得KL散度盡可能的小,那么接下來便是介紹如何使得ELOB盡可能的趨近其上界僚楞。

假設(shè)Z={z_1,\cdots勤晚,z_n},現(xiàn)實(shí)生活中大多數(shù)P(z)\neq{P(z_1)P(z_2)\cdots P(z_n)},但是我們選擇Q(z)時(shí)可以選我們知道到的泉褐,簡單的赐写,獨(dú)立同分布的概率分布(選非獨(dú)立同分布的我也不攔著)Q(z)=Q(z_1)Q(z_2) \cdots Q(z_n)。選好了Q(z),好戲也要開場了膜赃。
\begin{align*} \because L(Q) &= \int{Q(z) \ln{P(x,z)}dz}-\int{Q(z)\ln{Q(Z)}dz}\\ &= \underbrace{\int{\prod_{i=1}^{n}{Q_i(z_i)}\ln{P(x,z)dz}}}_{Part1}- \underbrace{\int{\prod_{i=1}^{n}{Q_i(z_i)} \sum_{i=1}^{n}\ln{Q_i(z_i)dz}}}_{Part2} \tag{1.6}\\ Part1&= \int_{z_1} \cdots \int_{z_n} \prod_{i=1}^n Q_i(z_i)\ln{P(x,z)}dz_1 \dots dz_n\\ 當(dāng)i=j時(shí): Part1 &= \int Q_j(z_j)(\int \cdots \int_{z_{i \neq j}} \prod_{i \neq j}^n Q_i(z_i) \ln P(x,z)\prod_{i\neq j}^ndz_i)dz_j\\ &=\int_{z_j}Q_j(z_j)(\int\cdots \int_{z_{i\neq j}}\ln{P(x,z)}\prod_{i\neq j}^nQ_j(z_j)dz_j)\\ &=\int_{z_j}Q_j(z_j)(\Bbb{E}_{i\neq j}[\ln{P(x,z)}])dz_j\\ 同理挺邀,可推出Part2:\\ Part2&=\sum_{i=1}^n(\int_{z_i}Q_i(z_i)\ln Q_i(z_i)dz_i)\\ \end{align*}
下面證明Part2變量為兩個(gè)時(shí),可得:
\int_{x_1}\int_{x_2}[f(x_1)+f(x_2)]P(x_1)P(x_2)dx_1dx_2=\int_{x_1}f(x_1)P(x_1)dx_1+\int_{x_2}f(x_2)P(x_2)dx_2
推至N個(gè)時(shí),Part2得證端铛。當(dāng)i=j泣矛,即只對某個(gè)z_j感興趣時(shí),Part2可簡寫為:
\begin{align*} Part2=\int_{z_j}Q_j(z_j)\ln Q_j(z_j)dz_j+const\\ \end{align*}
再令:\ln{\overline{P}_j(x,z_j)}=\Bbb{E}_{i\neq j}[\ln{P(x,z)}]可得:
L(Q_j)=Part1-Part2=\int_{z_j}Q_j(z_j)\ln{[\frac{\overline{P}_j(x,z_j)}{Q_j(z_j)}]}dz_j+const \to-KL(\Bbb{E}_{i\neq j}[\ln{P(x,z)}]||Q_j(z_j))
推導(dǎo)到這,豁然開朗禾蚕。原來ELOB最后也要化為一個(gè)-KL散度您朽,故最大值為0當(dāng)且僅當(dāng)\ln{Q_i(z_j)=\Bbb{E}_{i\neq j}[\ln{P(x,z)}]}。最后换淆,簡單說明如何獲得穩(wěn)定\ln{Q}的迭代過程:
\begin{align*} \ln Q_1^*(z_1)&=\int_{Q_2}\cdots \int_{Q_n}\ln{P(x,z)}Q_2(z_2)\cdots Q_n(z_n)dz_2\cdots dz_n\\ \ln Q_2^*(z_2)&=\int_{Q_1}\cdots \int_{Q_n}\ln{P(x,z)}Q_1^*(z_1)\cdots Q_n(z_n)dz_1\cdots dz_n\\ \vdots\\ \ln Q_n^*(z_n)&=\int_{Q_1}\cdots \int_{Q_{n-1}}\ln{P(x,z)}Q_1^*(z_1)\cdots Q_{n-1}^*(z_{n-1})dz_1\cdots dz_{n-1}\\ \end{align*}
經(jīng)過多次算法迭代哗总,\ln{Q}收斂于固定值,從而得到最大ELOB倍试,進(jìn)而確定所需KL散度與Q分布讯屈。

綜述


變分推斷是利用已知分布通過調(diào)整使其符合我們需要卻難以用公式表達(dá)的分布。由ELOBKL散度的關(guān)系县习,通過得到ELOB的上界間接獲得KL(Q(z)||P(z|x))散度涮母。對于ELOB的上界,又可以通過轉(zhuǎn)化為相關(guān)的KL(\Bbb{E}_{i\neq j}[\ln{P(x,z)}]||Q_j(z_j))散度求解躁愿。

\begin{align*} KL(\Bbb{E}_{i\neq j}[\ln{P(x,z)}]||Q_j(z_j))\to ELOB\to KL(Q(z)||P(z|x)) \to 調(diào)整后的Q(z) \end{align*}
用一張圖來表示Q分布的變化叛本。

vi.png

文中配圖來源于《徐亦達(dá)機(jī)器學(xué)習(xí)》

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市攘已,隨后出現(xiàn)的幾起案子炮赦,更是在濱河造成了極大的恐慌,老刑警劉巖样勃,帶你破解...
    沈念sama閱讀 211,265評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異性芬,居然都是意外死亡峡眶,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,078評論 2 385
  • 文/潘曉璐 我一進(jìn)店門植锉,熙熙樓的掌柜王于貴愁眉苦臉地迎上來博敬,“玉大人旅东,你說我怎么就攤上這事。” “怎么了赔退?”我有些...
    開封第一講書人閱讀 156,852評論 0 347
  • 文/不壞的土叔 我叫張陵,是天一觀的道長钢颂。 經(jīng)常有香客問我经窖,道長,這世上最難降的妖魔是什么彭沼? 我笑而不...
    開封第一講書人閱讀 56,408評論 1 283
  • 正文 為了忘掉前任缔逛,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘褐奴。我一直安慰自己按脚,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,445評論 5 384
  • 文/花漫 我一把揭開白布敦冬。 她就那樣靜靜地躺著辅搬,像睡著了一般。 火紅的嫁衣襯著肌膚如雪脖旱。 梳的紋絲不亂的頭發(fā)上堪遂,一...
    開封第一講書人閱讀 49,772評論 1 290
  • 那天,我揣著相機(jī)與錄音夯缺,去河邊找鬼蚤氏。 笑死,一個(gè)胖子當(dāng)著我的面吹牛踊兜,可吹牛的內(nèi)容都是我干的竿滨。 我是一名探鬼主播,決...
    沈念sama閱讀 38,921評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼捏境,長吁一口氣:“原來是場噩夢啊……” “哼于游!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起垫言,我...
    開封第一講書人閱讀 37,688評論 0 266
  • 序言:老撾萬榮一對情侶失蹤贰剥,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后筷频,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體蚌成,經(jīng)...
    沈念sama閱讀 44,130評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,467評論 2 325
  • 正文 我和宋清朗相戀三年凛捏,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了担忧。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,617評論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡坯癣,死狀恐怖瓶盛,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情示罗,我是刑警寧澤惩猫,帶...
    沈念sama閱讀 34,276評論 4 329
  • 正文 年R本政府宣布,位于F島的核電站蚜点,受9級特大地震影響轧房,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜禽额,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,882評論 3 312
  • 文/蒙蒙 一锯厢、第九天 我趴在偏房一處隱蔽的房頂上張望皮官。 院中可真熱鬧,春花似錦实辑、人聲如沸捺氢。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,740評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽摄乒。三九已至,卻和暖如春残黑,著一層夾襖步出監(jiān)牢的瞬間馍佑,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,967評論 1 265
  • 我被黑心中介騙來泰國打工梨水, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留拭荤,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,315評論 2 360
  • 正文 我出身青樓疫诽,卻偏偏與公主長得像舅世,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子奇徒,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,486評論 2 348

推薦閱讀更多精彩內(nèi)容

  • 作者:知乎用戶 鏈接:https://www.zhihu.com/question/41765860/answer...
    w蕾絲閱讀 1,719評論 0 1
  • 格列佛在學(xué)習(xí)了一定的語言后請求國王允許他四處走走雏亚。格列佛看到了飛島的中心有一塊金剛石,來控制飛島的運(yùn)動(dòng)軌跡摩钙,格列佛...
    陳靜怡1閱讀 2,311評論 0 1
  • 威海職涯研討坊開動(dòng)啦胖笛!首次活動(dòng)的參與者是往期新精英職業(yè)生涯規(guī)劃認(rèn)證班的學(xué)員网持,大家相互認(rèn)識、了解长踊,講講學(xué)習(xí)的初衷...
    eebd4933252b閱讀 247評論 0 0
  • 昨晚讀完了這本書翎碑,坦白的講,這本書最先最吸引我的是那極具西北風(fēng)光的照片之斯,風(fēng)景遼闊磅礴大氣的照片深深震撼到我。 本書...
    攀巖的蝸牛111閱讀 1,111評論 4 3