HMM-Forward/Backward算法實(shí)現(xiàn)

M 個(gè)隱狀態(tài) - $S^M$
長(zhǎng)度為T的觀測(cè)序列 - $V^T$
轉(zhuǎn)移矩陣 - $A$
發(fā)射矩陣 - $B$
初始概率分布 - $\pi$

Evaluation Problem

給定 $\theta, V_M \to 估計(jì) p(V_T|\theta)$ , 其中 $\theta \to s, v, a_{ij}, b_{jk}$

方法：

找出所有的隱狀態(tài)荒揣， $S^M$ 辉川， M是隱狀態(tài)的數(shù)目
從所有的隱狀態(tài)序列 $S^M$ 中重父，找到生成觀測(cè)序列 $V^T$ 的概率

數(shù)學(xué)表達(dá)：

$p(V^T|\theta) = \sum_{r=1}^{R}p(V^T|S_{r}^{T})p(S_{r}^{T}) \\ where \quad S_{r}^{T} = \{s_1(1), s_2(2)... s_r(T)\}$

上面的R=最大數(shù)目的關(guān)于隱狀態(tài)的可能序列
因此可以得到枯饿，1-T的時(shí)間位置上番川，每個(gè)時(shí)刻t都可能是上述M個(gè)隱狀態(tài)的任意一個(gè)取值，那么這個(gè)R的數(shù)目等于 $R = M^T$

為了計(jì)算序列長(zhǎng)度為T的可觀測(cè)序列 $V^T$ 的生成概率懈糯，我們應(yīng)該采用每個(gè)可能的隱藏狀態(tài)序列，計(jì)算它們產(chǎn)生 $V^T$ 的概率单雾，然后將這些概率相加赚哗。

以一個(gè)具體的示例講解

Forward-and-Backward-Algorithm-in-Hidden-Markov-Model-adeveloperdiary.com_.jpg

上述通過(guò)隱狀態(tài)生成的觀測(cè)序列： $(sun, sun, rain) \to (happy, sad, happy)$ 可以計(jì)算生成概率

$p(happy, sad, happy | sun, sun, rain ) = p(happy|sun) * p(sad|sun) * p(happy|rain)$

數(shù)學(xué)上：

$p(V^T|S_{r}^{T}) = \prod_{t=1}^{T}p(v(t)|s(t))$

但是不幸的是，我們真的不知道隱藏狀態(tài)的具體順序硅堆，這些順序會(huì)生成可觀測(cè)變量 $happy, sad, happy$

我們可以計(jì)算 $V^T$ 和與之對(duì)應(yīng)的 $S^T$ 的聯(lián)合概率

Forward-and-Backward-Algorithm-in-Hidden-Markov-Model-adeveloperdiary.com-2.jpg

$p(S^T) = p(sun|initial state) * p(sun|sun) * p(rain|sun) = \prod_{t=1}^{T}p(s(t)|s(t-1))$
$p(V^T|S^T) = p(happy|sun) * p(sad|sun) * p(happy|rain) = \prod_{t=1}^{T}p(v(t)|s(t))$

$p(V^T, S^T) = p(V^T|S^T)p(S^T) = \prod_{t=1}^{T}p(v(t)|s(t)) \prod_{t=1}^{T}p(s(t)|s(t-1))$

上述只是特定的一個(gè)隱狀態(tài)序列生成觀測(cè)序列的例子屿储，那么還有別的觀測(cè)序列生成這個(gè)可觀測(cè)序列，那么對(duì)所有的序列進(jìn)行上述的計(jì)算然后求和

假設(shè)只有兩種隱狀態(tài)sun, rain, 那么一共有三個(gè)時(shí)刻渐逃，所以隱狀態(tài)序列的大小一共有 $2^3=8$

$p(happy,sad,happy|model) = p(happy,sad,happy,sun,sun,sun) + p(happy,sad,happy,sun,sun,rain) + p(happy,sad,happy,sun,rain,rain)+ . . .$

數(shù)學(xué)上够掠，假設(shè)共有R種可能的序列 $R=M^T$

$\begin{equation} \label{eq1} \begin{split} p(V^T|\theta) & = \sum_{All Seq of S}p(V^T, S^T) \\ & = \sum_{All Seq of S}p(V^T|S^T)p(S^T) \\ & = \sum_{r=1}^{R}\prod_{t=1}^{T}p(v(t)|s(t)) \prod_{t=1}^{T}p(s(t)|s(t-1)) \\ & = \sum_{r=1}^{R}\prod_{t=1}^{T}p(v(t)|s(t))p(s(t)|s(t-1)) \end{split} \end{equation}$

但是計(jì)算復(fù)雜度很高， $O(M^T\cdot T)$ 需要優(yōu)化茄菊，我們將采用動(dòng)態(tài)規(guī)劃來(lái)克服上述解決方案中的指數(shù)計(jì)算疯潭。有兩種這樣的算法赊堪，F(xiàn)orward算法，backward算法,可以指數(shù)級(jí)復(fù)雜度降到多項(xiàng)式復(fù)雜度 $O(M^2\cdot T)$ 竖哩。

Forward算法

給定一系列可見(jiàn)狀態(tài) $V^T$ 哭廉，則隱馬爾可夫模型在特定時(shí)間步長(zhǎng)t處在特定隱藏狀態(tài)s的概率是多少。

$\alpha(t) = p(v(1)...v(t), s(t)=j) = p(v_{1:t}, s(t)=j)$

當(dāng)t=1時(shí)：
$\begin{equation} \label{eq222} \begin{split} \alpha_{j}(1) & = p(v_{k}(1), s(1)=j) \\ & = p(v_{k}(1)|s(1)=j)p(s(1)=j) \\ & = \pi_{j}p(v_{k}(1)|s(1)=j)\\ & = \pi_{j}b_{jk} \end{split} \end{equation}$

其中 $\pi=初始狀態(tài)分布$
上式中的 $b_{jk}$ 表示t=1時(shí)刻的發(fā)射概率

如果通過(guò)向量的方式計(jì)算取不同的隱狀態(tài)j相叁，可以通過(guò)向量乘積計(jì)算遵绰，即 $\mathrm{\alpha(1)} = \mathrm{\pi}\mathrm{B_{:,k}}$

當(dāng)t=2時(shí)：

獲得t=1的結(jié)果后, t=2的計(jì)算公式中的一部分需要借助t=1的計(jì)算結(jié)果
$\begin{equation} \label{eq333} \begin{split} \alpha_{j}(2) & = p(v_{k}(1),v_{k}(2), s(2)=j) \\ & = \sum_{i=1}^{M} p(v_{k}(1), v_{k}(2), s(1)=i, s(2)=j) \\ & = \sum_{i=1}^{M} p(v_{k}(2)|s(2)=j, v_{k}(1), s(1)=i)p(s(2)=j, v_{k}(1), s(1)=i) \\ & = \sum_{i=1}^{M} p(v_{k}(2)|s(2)=j, v_{k}(1), s(1)=i)p(s(2)=j|s(1)=i, v_{k}(1))p(v_{k}(1), s(1)=i) \\ & = \sum_{i=1}^{M} p(v_{k}(2)|s(2)=j)p(s(2)=j|s(1)=i)p(v_{k}(1), s(1)=i) \\ & = p(v_{k}(2)|s(2)=j)\sum_{i=1}^{M} p(s(2)=j|s(1)=i)p(v_{k}(1), s(1)=i) \\ & = b_{jkv(2)}\sum_{i=1}^{M} a_{i2}\alpha_{i}(1) \end{split} \end{equation}$

如果通過(guò)向量的方式計(jì)算取不同的隱狀態(tài)j，可以通過(guò)向量乘積計(jì)算增淹，即 $\mathrm{\alpha(2)} = \mathrm{B_{:, k}} \times (\mathrm{\alpha_{:,1}} \cdot \mathrm{a_{:, 2}})$

其中 $a_{i2} = 轉(zhuǎn)移概率$
$b_{jkv(2)} = 發(fā)射概率在t=2時(shí)刻$
$\alpha_{i}(1) = 前向概率在t=1時(shí)刻$

解釋：因?yàn)樵趖=1時(shí)刻的椿访，s(1)有M個(gè)狀態(tài)，所以從s(1)到s(2)需要把M種狀態(tài)都要考慮進(jìn)來(lái),在第二步的時(shí)候虑润，加了sum符號(hào)

進(jìn)一步得到通用公式

generalized-Equation.jpg

當(dāng)然也可以通過(guò)圖示的方式

Forward-and-Backward-Algorithm-in-Hidden-Markov-Model-adeveloperdiary.com-4.jpg

上圖如果用通用公式可以得到
$\alpha_{2}(t) = b_{2k}\sum_{i=1}^{M}\alpha_{i}(t-1)a_{i2}$
如果把其他的也寫出來(lái)
$\alpha_{1}(t) = b_{1k}\sum_{i=1}^{M}\alpha_{i}(t-1)a_{i1}$
$\alpha_{3}(t) = b_{3k}\sum_{i=1}^{M}\alpha_{i}(t-1)a_{i3}$

總結(jié)：前向算法的遞推關(guān)系如下

recursive-forward-equation.jpg

Forward算法代碼實(shí)現(xiàn)

假設(shè)做出如下定義：

隱狀態(tài)共兩個(gè),分別是AAA成玫，BBB
觀測(cè)狀態(tài)取值為三個(gè)，分別是0端辱， 1梁剔， 2
假設(shè)已經(jīng)知道轉(zhuǎn)移矩陣A，和發(fā)射矩陣B

init_matrix.jpg

import pandas as pd
import numpy as np

data = pd.read_csv('data/data_python.csv')
 
V = data['Visible'].values


# Transition Probabilities
A = np.array(((0.54, 0.46), (0.49, 0.51)))
 
# Emission Probabilities
B = np.array(((0.16, 0.26, 0.58), (0.25, 0.28, 0.47)))
 
# Equal Probabilities for the initial distribution
π = np.array((0.5, 0.5))

def forward(V, A, B, π):
    alpha = np.zeros((a.shape[0], V.shape[0]))
    alpha[:, 0] = π*B[:, V[0]]
    T = len(V)
    M = A.shape[0]
    for t in range(1, T):
        for j in range(M):
            alpha[j, t] = B[j, V[t]]*alpha[:, t-1]@A[:, j]
    return alpha

alpha = forward(V, A, B, π)

Backward算法

$\begin{equation} \label{eq6} \begin{split} \beta_{i}(t) & = p(v_{k}(t+1),v_{k}(T)|s(t)=i) \\ & = \sum_{j=0}^{M} p(v_{k}(t+1)... v_{k}(T), s(t+1)=j|s(t)=i) \\ & = \sum_{j=0}^{M} p(v_{k}(t+2)... v_{k}(T)|v_{k}(t+1), s(t+1)=j, s(t)=i)p(v_{k}(t+1),s(t+1)=j|s(t)=i)\\ & = \sum_{j=0}^{M} p(v_{k}(t+2)... v_{k}(T)|v_{k}(t+1), s(t+1)=j, s(t)=i)p(v_{k}(t+1)|s(t+1)=j,s(t)=i)p(s(t+1)=j|s(t)=i)\\ & = \sum_{j=0}^{M} p(v_{k}(t+2)... v_{k}(T)|s(t+1)=j)p(v_{k}(t+1)|s(t+1)=j)p(s(t+1)=j|s(t)=i)\\ & = \sum_{j=0}^{M} \beta_{j}(t+1)b_{jk}(t+1)a_{ij} \end{split} \end{equation}$

其中 $a_{ij}$ 表示t時(shí)刻到t+1時(shí)刻的轉(zhuǎn)移概率
$b_{jk}(t+1)$ 表示t+1時(shí)刻舞蔽，單詞為k的發(fā)射概率
$\beta_{j}(t+1)$ 表示t+1時(shí)刻的后向概率

當(dāng)然也可以通過(guò)圖示的方式

Forward-and-Backward-Algorithm-in-Hidden-Markov-Model-adeveloperdiary.com-5.jpg

generialized-equation2.jpg

def backward(V, A, B):
    M = A.shape[0]
    T = len(V)
    beta = np.zeros((M, T))
    
    beta[:, -1] = np.ones(M)
    
    for t in range(T-2, 0, -1):
        for j in range(M):
            beta[j, t] = (B[:, V[t+1]]*beta[:, t+1])@A[j, :]
    return beta

beta = backward(V, A, B)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末荣病，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子渗柿，更是在濱河造成了極大的恐慌个盆，老刑警劉巖，帶你破解...
沈念sama閱讀 212,542評(píng)論 6贊 493
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件朵栖，死亡現(xiàn)場(chǎng)離奇詭異颊亮，居然都是意外死亡，警方通過(guò)查閱死者的電腦和手機(jī)陨溅，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 90,596評(píng)論 3贊 385
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門终惑，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)，“玉大人门扇，你說(shuō)我怎么就攤上這事雹有。” “怎么了臼寄？”我有些...
開(kāi)封第一講書(shū)人閱讀 158,021評(píng)論 0贊 348
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵霸奕，是天一觀的道長(zhǎng)。經(jīng)常有香客問(wèn)我吉拳，道長(zhǎng)质帅，這世上最難降的妖魔是什么？我笑而不...
開(kāi)封第一講書(shū)人閱讀 56,682評(píng)論 1贊 284
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮煤惩，結(jié)果婚禮上嫉嘀，老公的妹妹穿的比我還像新娘。我一直安慰自己盟庞，他們只是感情好吃沪，可當(dāng)我...
茶點(diǎn)故事閱讀 65,792評(píng)論 6贊 386
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布。她就那樣靜靜地躺著什猖，像睡著了一般票彪。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上不狮，一...
開(kāi)封第一講書(shū)人閱讀 49,985評(píng)論 1贊 291
城市分裂傳說(shuō)
那天降铸，我揣著相機(jī)與錄音，去河邊找鬼摇零。笑死推掸，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的驻仅。我是一名探鬼主播谅畅，決...
沈念sama閱讀 39,107評(píng)論 3贊 410
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼噪服！你這毒婦竟也來(lái)了毡泻？” 一聲冷哼從身側(cè)響起，我...
開(kāi)封第一講書(shū)人閱讀 37,845評(píng)論 0贊 268
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤粘优，失蹤者是張志新（化名）和其女友劉穎仇味，沒(méi)想到半個(gè)月后，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體雹顺，經(jīng)...
沈念sama閱讀 44,299評(píng)論 1贊 303
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡丹墨，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 36,612評(píng)論 2贊 327
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了嬉愧。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片贩挣。...
茶點(diǎn)故事閱讀 38,747評(píng)論 1贊 341
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖没酣，靈堂內(nèi)的尸體忽然破棺而出王财，到底是詐尸還是另有隱情，我是刑警寧澤四康，帶...
沈念sama閱讀 34,441評(píng)論 4贊 333
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站狭握，受9級(jí)特大地震影響闪金，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 40,072評(píng)論 3贊 317
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一哎垦、第九天我趴在偏房一處隱蔽的房頂上張望囱嫩。院中可真熱鬧，春花似錦漏设、人聲如沸墨闲。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 30,828評(píng)論 0贊 21
一樁弒父案郑口，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)鸳碧。三九已至，卻和暖如春犬性，著一層夾襖步出監(jiān)牢的瞬間瞻离，已是汗流浹背。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 32,069評(píng)論 1贊 267
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工乒裆，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留套利，地道東北人。一個(gè)月前我還...
沈念sama閱讀 46,545評(píng)論 2贊 362
代替公主和親
正文我出身青樓鹤耍，卻偏偏與公主長(zhǎng)得像肉迫，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子稿黄，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 43,658評(píng)論 2贊 350

HMM-Forward/Backward算法實(shí)現(xiàn)

Evaluation Problem

Forward算法

Forward算法代碼實(shí)現(xiàn)

Backward算法

推薦閱讀更多精彩內(nèi)容