無標題文章

# 背景

貝葉斯統(tǒng)計推斷是一個非常*藝術(shù)*的東西,他的先驗結(jié)果(prior knowledge)是一種專家的經(jīng)驗,而**貝葉斯公式**給出的后驗分布是貝葉斯推斷的基本工具。每個大學生都應該學過數(shù)理統(tǒng)計,其中提及的貝葉斯統(tǒng)計推斷都是一些基于簡單先驗和簡單后驗的結(jié)果。

但當我們一旦碰到復雜的先驗(比如高維參數(shù)又沾、復雜先驗分布),我們用貝葉斯公式得出的后驗分布將變得非常復雜熙卡,在計算上會非常困難杖刷。為此,先人提出了**MCMC算法**方便我們可以對任何后驗分布進行計算或推斷驳癌。其思想就是其名字:兩個MC滑燃。

第一個MC: Monte Carlo(蒙特卡洛)。這個簡單來說是讓我們使用隨機數(shù)(隨機抽樣)來解決計算問題颓鲜。在MCMC中意味著:后驗分布作為一個隨機樣本生成器不瓶,我們利用它來生成樣本(simulation),然后通過這些樣本對一些感興趣的計算問題(特征數(shù)灾杰,預測)進行估計蚊丐。

第二個MC:Markov Chain(馬爾科夫鏈)。第二個MC是這個方法的關(guān)鍵艳吠,因為我們在第一個MC中看到麦备,我們需要利用**后驗分布**生成隨機樣本,但后驗分布太復雜昭娩,一些package中根本沒有相應的隨機數(shù)生成函數(shù)(如`rnorm(),rbinom()`)怎么辦凛篙?答案是我們可以利用Markov Chain的**平穩(wěn)分布**這個概念實現(xiàn)對復雜后驗分布的抽樣。

# Markov Chain

為了能順利闡述MCMC算法栏渺,這里就簡單地講一下所涉及到的馬爾科夫鏈概念呛梆。因為都是我個人的理解,這里所講不敢說都是正確的磕诊,希望各位童鞋能夠獨立思考填物。

## 1.什么是Markov Chain

隨機過程$\{X_n\},X_n$的狀態(tài)空間為有限集或可列集纹腌,比如當$X_n=i$,就稱過程在n處于狀態(tài)i。

定義:如果對任何一列狀態(tài)$i_0,i_1,...,i_{n-1},i,j$滞磺,及對任何n≥0升薯,隨機過程$\{X_n\}$滿足Markov性質(zhì):

$$P\{X_{n+1}=j|X_0=i_0,...X_{n-1}=i_{n-1},X_n=i\}\\=P\{X_{n+1}=j|X_n=i\}$$

**轉(zhuǎn)移概率**

$P\{x_{n+1}=j|X_n=i\}$成為Markov鏈的一步轉(zhuǎn)移概率$P_{ij}^{n,n+1}$,當這個概率與n無關(guān),則記之為$P_{ij}$

**轉(zhuǎn)移概率矩陣P**

這個矩陣的元素就是一步轉(zhuǎn)移概率$P_{ij}$

**結(jié)論**

一個Markov鏈可以由它的初始狀態(tài)以及轉(zhuǎn)移概率矩陣P完全確定。(證明略击困,自行百度或翻書)

## 2.n步轉(zhuǎn)移概率

所謂n步轉(zhuǎn)移概率就是從狀態(tài)i走n步正好到狀態(tài)j的概率涎劈,我們記為$P_{ij}^{(n)}$。

利用概率分割的思想阅茶,由基礎(chǔ)概率論中**全概率公式**可以得到$$P_{ij}^{(n)}=\Sigma_{k=0}^{\infty}P_{ik}P_{kj}^{(n-1)}$$ 寫成矩陣形式就是$$P^{(n)}=P\times P^{(n-1)}$$

進一步推廣蛛枚,我們就推出了著名的Chapman-Kolmogorov方程:$$P_{ij}^{(n+m)}=\Sigma_{k=0}^{\infty}P_{ik}^{(n)}P_{kj}^{(m)}$$寫成矩陣形式就是$$P^{(m+n)}=P^{(m)}\times P^{(n)}$$

## 3.Markov鏈的極限定理和平穩(wěn)分布

現(xiàn)在我們已經(jīng)有了n步轉(zhuǎn)移概率的概念,一個很簡單的想法就是如果n趨向無窮會怎么樣脸哀?這個問題也是后面**極限分布**以及**平穩(wěn)分布**的來源蹦浦,更是MCMC算法中第二個MC的關(guān)鍵。

要回答這個問題首先要掌握幾個關(guān)鍵概念企蹭,我先列出來白筹,如果不熟悉的可以自行百度或翻書:

1. 互達性($i \leftrightarrow j$)

2. 周期性(d(i))

3. 常返與瞬過($f_{ii}=1$)

4. 常返時($\T_i$)

### 3.1互達性智末、周期性

幾個重要結(jié)論(證明略谅摄,自行百度,或者call me)

1. $i \leftrightarrow j,\Rightarrow d(i)=d(j)$

2. $若存在d(i)<\infty,則存在N系馆,對所有n>N,有P_{ii}^{(nd(i))}>0$

3. $P_{ji}^{(m)}>0,\Rightarrow 存在N送漠,對所有n>N,有P_{ii}^{(m+nd(i))}>0$

4. 對于非周期不可約Markov鏈的轉(zhuǎn)移概率矩陣P,存在N由蘑,當n≥N時闽寡,$P^{(n)}>0$

### 3.2常返、瞬過尼酿、常返時

1. 引入重要概率$f_{ij}^{(n)}$表示從i出發(fā)在n步**首次**到達j的概率爷狈,我們約定$f_{ii}^{(0)}=0$

2. $定義f_{ij}=\Sigma_{n=1}^{\infty}f_{ij}^{(n)}$表示從i出發(fā)**最終**到j(luò)的概率。

3. $定義:如果f_{ii}=1,則狀態(tài)i是常返的裳擎,否則是瞬過的$

4. $我們記T_i為首次返回i的步長,且\mu_i=ET_i$

5. $若\mu_i=\infty,則稱狀態(tài)i是零常返涎永,否則正常返$

### 3.3 極限定理

是時候回答上面那個問題了!(摘自網(wǎng)絡(luò)共享PPT)

![](/Users/CDX/Pictures/markov\ limit.png)

另外對于一個正常返鹿响、非周期的狀態(tài)(也稱為遍歷ergodic)羡微,我們有結(jié)論:$$對所有i\leftrightarrow j,有l(wèi)imP_{ji}^{(n)}=limP_{ii}^{(n)}=\frac{1}{\mu_i}$$

>到這里,我們可以想象了惶我,n步轉(zhuǎn)移概率矩陣最終的極限形式應該是由相同的行向量組成的B杈蟆!绸贡!我們把那個行向量稱為極限概率分布盯蝴。? 但是毅哗,問題還沒完,要計算極限概率结洼,就要根據(jù)極限定理黎做,求出很多東西(如$f_{ii}^{(n)}$),實際中并不方便松忍。所以蒸殿,我們要引入*平穩(wěn)分布*這個概念。最關(guān)鍵的部分來了C汀:晁!摊溶!

### 3.3 平穩(wěn)分布

什么是平穩(wěn)分布爬骤?它和求極限概率分布有什么關(guān)系呢?

定義:Markov鏈有轉(zhuǎn)移概率矩陣P莫换,如果有一個概率分布$\{\pi_i \}滿足\pi_j =\Sigma_{i=0}^{\infty}\pi_i P_{ij}$,則稱為這個Markov鏈的平穩(wěn)分布霞玄。這個定義用矩陣形式寫出來就是π*P=π.

>這個定義內(nèi)容很豐富:如果一個過程的初始狀態(tài)$X_0$有平穩(wěn)分布π,我們可以知道對所有n,$X_n$有相同的分布π拉岁。再根據(jù)Markov性質(zhì)可以得到坷剧,對任何k,有$X_n,X_{n+1},...,X_{n+k}$的聯(lián)合分布不依賴于n喊暖,顯然這個過程是嚴格平穩(wěn)的惫企,平穩(wěn)分布也由此得名!陵叽!

**重要定理**

若一個markov鏈中所有的狀態(tài)都是遍歷的狞尔,則對所有i,j有$limP_{ij}^{(n)}=\pi_j存在,且\pi=\{\pi_j,j≥0\}就是平穩(wěn)分布$巩掺。反之偏序,拖一個不可約Markov鏈只存在一個平穩(wěn)分布,且這個Markov鏈的所有狀態(tài)都是遍歷的胖替,則這個平穩(wěn)分布就是該Markov鏈的極限概率分布研儒。$$limP_{ij}^{(n)}=\pi_j$$

>上面這條定理就給出了通過求平穩(wěn)分布來求Markov鏈極限概率分布的簡單方法。到這里我對第二個MC的解讀也就結(jié)束了刊殉。下一期我們就要開始具體講講怎么應用MCMC算法對后驗分布進行抽樣和推斷殉摔。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市记焊,隨后出現(xiàn)的幾起案子逸月,更是在濱河造成了極大的恐慌,老刑警劉巖遍膜,帶你破解...
    沈念sama閱讀 222,627評論 6 517
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件碗硬,死亡現(xiàn)場離奇詭異瓤湘,居然都是意外死亡,警方通過查閱死者的電腦和手機恩尾,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,180評論 3 399
  • 文/潘曉璐 我一進店門弛说,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人翰意,你說我怎么就攤上這事木人。” “怎么了冀偶?”我有些...
    開封第一講書人閱讀 169,346評論 0 362
  • 文/不壞的土叔 我叫張陵醒第,是天一觀的道長。 經(jīng)常有香客問我进鸠,道長稠曼,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 60,097評論 1 300
  • 正文 為了忘掉前任客年,我火速辦了婚禮霞幅,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘量瓜。我一直安慰自己司恳,他們只是感情好,可當我...
    茶點故事閱讀 69,100評論 6 398
  • 文/花漫 我一把揭開白布榔至。 她就那樣靜靜地躺著抵赢,像睡著了一般欺劳。 火紅的嫁衣襯著肌膚如雪唧取。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,696評論 1 312
  • 那天划提,我揣著相機與錄音枫弟,去河邊找鬼。 笑死鹏往,一個胖子當著我的面吹牛淡诗,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播伊履,決...
    沈念sama閱讀 41,165評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼韩容,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了唐瀑?” 一聲冷哼從身側(cè)響起群凶,我...
    開封第一講書人閱讀 40,108評論 0 277
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎哄辣,沒想到半個月后请梢,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體赠尾,經(jīng)...
    沈念sama閱讀 46,646評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,709評論 3 342
  • 正文 我和宋清朗相戀三年毅弧,在試婚紗的時候發(fā)現(xiàn)自己被綠了气嫁。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,861評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡够坐,死狀恐怖寸宵,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情元咙,我是刑警寧澤邓馒,帶...
    沈念sama閱讀 36,527評論 5 351
  • 正文 年R本政府宣布,位于F島的核電站蛾坯,受9級特大地震影響光酣,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜脉课,卻給世界環(huán)境...
    茶點故事閱讀 42,196評論 3 336
  • 文/蒙蒙 一救军、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧倘零,春花似錦唱遭、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,698評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至袖瞻,卻和暖如春司致,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背聋迎。 一陣腳步聲響...
    開封第一講書人閱讀 33,804評論 1 274
  • 我被黑心中介騙來泰國打工脂矫, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人霉晕。 一個月前我還...
    沈念sama閱讀 49,287評論 3 379
  • 正文 我出身青樓庭再,卻偏偏與公主長得像,于是被迫代替她去往敵國和親牺堰。 傳聞我的和親對象是個殘疾皇子拄轻,可洞房花燭夜當晚...
    茶點故事閱讀 45,860評論 2 361

推薦閱讀更多精彩內(nèi)容

  • 本文主要摘抄整理自Rickjin的《LDA數(shù)學八卦》 統(tǒng)計模擬中一個很重要的問題就是給定一個概率分布$p(x)$,...
    iV0id閱讀 437評論 0 1
  • RL 強化學習任務通常用馬爾科夫決策過程(Markov Decision Process,簡稱 MDP)來描述: ...
    fanlu閱讀 853評論 0 50
  • 背景 貝葉斯統(tǒng)計推斷是一個非常藝術(shù)的東西,他的先驗結(jié)果(prior knowledge)是一種專家的經(jīng)驗伟葫,而貝葉斯...
    大仙Dylon閱讀 16,933評論 5 6
  • 記得剛上大一的時候恨搓。。扒俯∧套浚咳咳一疯,不好意思,我的初戀是不是有點晚啊夺姑。其實啊墩邀,我高中的時候暗戀過(這個有機會再詳細給你們...
    亦秋空飄云閱讀 248評論 0 0
  • “琳,我跟你說我感覺我已經(jīng)碰到了以后可以過過一輩子的人盏浙∶级茫” “哦?是嗎废膘?不是我吧竹海?” “不是,你別鬧丐黄。就在我身邊我...
    正版寧寒閱讀 327評論 0 1