隱馬爾科夫模型(HMM)

隱形馬爾可夫模型侯嘀,英文是 Hidden Markov Models庆冕,所以以下就簡(jiǎn)稱 HMM。
既是馬爾可夫模型实夹,就一定存在馬爾可夫鏈橄浓,該馬爾可夫鏈服從馬爾可夫性質(zhì):即無(wú)記憶性粒梦。也就是說(shuō),這一時(shí)刻的狀態(tài)荸实,受且只受前一時(shí)刻的影響匀们,而不受更往前時(shí)刻的狀態(tài)的影響。
其實(shí)隱馬爾科夫模型就是一個(gè)三元的元組准给,隱含狀態(tài)轉(zhuǎn)移概率矩陣 A泄朴,觀測(cè)狀態(tài)轉(zhuǎn)移概率矩陣 B,初始狀態(tài)概率矩陣π露氮。
這里說(shuō)說(shuō)大概怎么用這個(gè)模型祖灰。
假設(shè)我有幾個(gè)句子:

要買(mǎi)\o 一個(gè)\o 70平\m 房子\o 價(jià)格\o 6000元\j 每平\o
想\o 買(mǎi)個(gè)\o 大小\o 80\m 房子\o 價(jià)格\o 5000元\j 每平\o
一個(gè)\o 100平\m 房子\o 每平\o 9000\j
有沒(méi)有\(zhòng)o 60平\m 房子\o 兩個(gè)人\o 住\o 夠\o
大小\o 100平\m 房子\o 價(jià)格\o 80萬(wàn)\j

那么這些句子連在一起我們就可以看做是一個(gè)鏈,在這個(gè)鏈中沦辙,每個(gè)詞就是一個(gè)可觀測(cè)序列夫植,每個(gè)詞對(duì)應(yīng)的標(biāo)簽就是它的隱藏狀態(tài)。例如:要買(mǎi)\o油讯,那么要買(mǎi)就是可觀測(cè)的详民,\o就是它的隱藏狀態(tài)。
對(duì)于這個(gè)鏈的三個(gè)狀態(tài)分別如下:

  • 初始狀態(tài) π:表示隱含狀態(tài)在初始時(shí)刻t=1的[概率]矩陣陌兑,(例如t=1時(shí)沈跨,P(S1)=p1、P(S2)=P2兔综、P(S3)=p3饿凛,則初始狀態(tài)概率矩陣 π=[ p1 p2 p3 ]。
    那么該鏈隱藏狀態(tài)的初始概率為软驰,
    \o: 22/30
    \m: 5/30
    \j: 4/30
    分別就是每個(gè)隱狀態(tài)出現(xiàn)的次數(shù)和所有隱狀態(tài)次數(shù)作比較涧窒。

  • 隱含狀態(tài)轉(zhuǎn)移概率矩陣 A:描述了HMM模型中各個(gè)狀態(tài)之間的轉(zhuǎn)移概率。其中Aij = P( Sj | Si ),1≤i,j≤N.表示在 t 時(shí)刻锭亏、狀態(tài)為 Si 的條件下纠吴,在 t+1 時(shí)刻狀態(tài)是 Sj 的概率。
    p(sj|si) = #(si,sj)/(si)

sj/si \o \m \j
\o 13/22 5/22 4/22
\m 1 0 0
\j 1 0 0

這個(gè)矩陣就是指每個(gè)隱藏狀態(tài)和它前一刻的狀態(tài)的轉(zhuǎn)移概率慧瘤。

  • 觀測(cè)狀態(tài)轉(zhuǎn)移概率矩陣 B(混淆矩陣):令N代表隱含狀態(tài)數(shù)目戴已,M代表可觀測(cè)狀態(tài)數(shù)目,則:Bij = P( Oi | Sj ), 1≤i≤M,1≤j≤N.表示在 t 時(shí)刻锅减、隱含狀態(tài)是 Sj 條件下糖儡,觀察狀態(tài)為 Oi 的概率。
    p(oi|sj) = #(oi,sj)/#(sj)
sj/oi 要買(mǎi) 一個(gè) 70平 房子 價(jià)格 每平 6000元 買(mǎi)個(gè) 大小 80 5000元 100平 9000 有沒(méi)有 60平 兩個(gè)人 80萬(wàn)
\o 1/22 2/22 0 5/22 3/22 3/22 0 1/22 1/22 2/22 0 0 0 0 1/22 0 1/22 1/22 1/22 0
\m 0 0 1/5 0 0 0 0 0 0 0 1/5 0 2/5 0 0 1/5 0 0 0 0
\j 0 0 0 0 0 0 1/3 0 0 0 0 1/3 0 1/3 0 0 0 0 0 0

一般的怔匣,可以用λ=(A,B,π)三元組來(lái)簡(jiǎn)潔的表示一個(gè)隱馬爾可夫模型握联。隱馬爾可夫模型實(shí)際上是標(biāo)準(zhǔn)馬爾可夫模型的擴(kuò)展,添加了可觀測(cè)狀態(tài)集合和這些狀態(tài)與隱含狀態(tài)之間的概率關(guān)系。


一般HMM模型對(duì)應(yīng)著三個(gè)問(wèn)題拴疤,我們來(lái)看看百度怎么說(shuō)的這三個(gè)問(wèn)題:

  • 評(píng)估問(wèn)題:
    給定觀測(cè)序列 O=O1O2O3…Ot和模型參數(shù)λ=(A,B,π)永部,怎樣有效計(jì)算某一觀測(cè)序列的概率,進(jìn)而可對(duì)該HMM做出相關(guān)評(píng)估呐矾。例如苔埋,已有一些模型參數(shù)各異的HMM,給定觀測(cè)序列O=O1O2O3…Ot蜒犯,我們想知道哪個(gè)HMM模型最可能生成該觀測(cè)序列组橄。通常我們利用forward算法或者Backward算法分別計(jì)算每個(gè)HMM產(chǎn)生給定觀測(cè)序列O的概率,然后從中選出最優(yōu)的HMM模型罚随。
    對(duì)于上面咱們自己建的那個(gè)模型玉工,這個(gè)問(wèn)題就是給定一句話,并給出這句話中每個(gè)詞對(duì)應(yīng)的標(biāo)簽淘菩,根據(jù)模型遵班,計(jì)算每個(gè)標(biāo)簽的概率。

  • 解碼問(wèn)題:
    給定觀測(cè)序列 O=O1O2O3…Ot 和模型參數(shù)λ=(A,B,π)潮改,怎樣尋找某種意義上最優(yōu)的隱狀態(tài)序列狭郑。在這類問(wèn)題中,我們感興趣的是馬爾科夫模型中隱含狀態(tài)汇在,這些狀態(tài)不能直接觀測(cè)但卻更具有價(jià)值翰萨,通常利用Viterbi算法來(lái)尋找。
    對(duì)于上面已經(jīng)建好的模型糕殉,給定三個(gè)詞亩鬼,那么,根據(jù)模型阿蝶,計(jì)算產(chǎn)生這三個(gè)詞分別對(duì)應(yīng)了什么標(biāo)簽雳锋。

  • 學(xué)習(xí)問(wèn)題:
    即HMM的模型參數(shù)λ=(A,B,π)未知,如何調(diào)整這些參數(shù)以使觀測(cè)序列O=O1O2O3…Ot的概率盡可能的大羡洁。通常使用Baum-Welch算法以及Reversed Viterbi算法解決玷过。
    假設(shè)我只有一句話和這句話有哪些標(biāo)簽,那么我們?nèi)绾谓⒁粋€(gè)模型焚廊,使我們知道的句子的概率盡可能的大。


這里大概講兩種算法:

向前算法

假設(shè)我拿上面的一句話來(lái)做向前算法:
一個(gè)\o 100平\m 房子\o 每平\o 9000\j

  • 那么在t=1時(shí)刻习劫,該時(shí)刻標(biāo)簽為\o咆瘟,如果該時(shí)刻的詞是一個(gè),那么概率就是
    P(一個(gè),\o)=P(\o的初始概率) x P(一個(gè) | \o)=22/30 x 2/22
  • 在t=2時(shí)刻該詞為100平诽里,那么\m概率
    P(t=1 一個(gè),t=2 100平,t=2 \m) = [P(t=1 一個(gè),t=1 \o) x P(t=2 \m | t=1 \o) +P(t=1 一個(gè),t=1 \m) x P(t=2 \m | t=1 \m) + P(t=1 一個(gè),t=1 \j) x P(t=2 \m | t=1 \j)] x P(t=2 100平 | t=2 \m)
  • 在t=3時(shí)刻該詞為房子袒餐,那么\o的概率
    P(t=1 一個(gè),t=2 100平,t=3 房子,t=3 \o)
    ...這里就不推了,太多了,不過(guò)計(jì)算方式如上灸眼。

維特比求解

也是我們假設(shè)我們有一句話:
一個(gè) 100平 房子 每平 9000
在這里我們只知道這個(gè)序列的可觀測(cè)狀態(tài)卧檐,想要獲得每一個(gè)詞的隱含狀態(tài)。那么焰宣,

  • t=1時(shí)刻
    P(\o)=P(一個(gè)|\o) x P(\o|初始概率)=2/22 x 22/30
    P(\m)=P(一個(gè)|\m) x P(\m|初始概率)=0 x 5/30
    P(\j)=P(一個(gè)|\j) x P(\j|初始概率)=0 x 4/30
    那么一個(gè)這個(gè)詞最有可能的便簽就是\o
  • t=2時(shí)刻
    P(t=1 \o,t=2 \o) = P(t=1 \o) x P(\o -> \o) x P(100平|\o)=(2/22 x 22/30) x 13/22 x 0
    P(t=1 \o,t=2 \m) = P(t=1 \o) x P(\o -> \m) x P(100平|\m)
    P(t=1 \o,t=2 \j) ...
    P(t=1 \m,t=2 \o) ...
    P(t=1 \m,t=2 \m) ...
    P(t=1 \m,t=2 \j) ...
    P(t=1 \j,t=2 \o) ...
    P(t=1 \j,t=2 \m) ...
    P(t=1 \j,t=2 \j) ...
  • t=3時(shí)刻計(jì)算方式如上霉囚,他們的狀態(tài)都只和上一時(shí)刻t-1有關(guān)。

最后我們可以獲得每一時(shí)刻最大概率的隱藏狀態(tài)就是每一時(shí)刻觀測(cè)狀態(tài)對(duì)應(yīng)的隱藏狀態(tài)匕积。
這個(gè)算法大概就是通過(guò)已知的可以觀察到的序列盈罐,和一些已知的狀態(tài)轉(zhuǎn)換之間的概率情況,通過(guò)綜合狀態(tài)之間的轉(zhuǎn)移概率和前一個(gè)狀態(tài)的情況計(jì)算出概率最大的狀態(tài)轉(zhuǎn)換路徑闪唆,從而推斷出隱含狀態(tài)的序列的情況盅粪。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市悄蕾,隨后出現(xiàn)的幾起案子票顾,更是在濱河造成了極大的恐慌,老刑警劉巖帆调,帶你破解...
    沈念sama閱讀 206,311評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件奠骄,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡贷帮,警方通過(guò)查閱死者的電腦和手機(jī)戚揭,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,339評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)撵枢,“玉大人民晒,你說(shuō)我怎么就攤上這事〕荩” “怎么了潜必?”我有些...
    開(kāi)封第一講書(shū)人閱讀 152,671評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)沃但。 經(jīng)常有香客問(wèn)我磁滚,道長(zhǎng),這世上最難降的妖魔是什么宵晚? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 55,252評(píng)論 1 279
  • 正文 為了忘掉前任垂攘,我火速辦了婚禮,結(jié)果婚禮上淤刃,老公的妹妹穿的比我還像新娘晒他。我一直安慰自己,他們只是感情好逸贾,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,253評(píng)論 5 371
  • 文/花漫 我一把揭開(kāi)白布陨仅。 她就那樣靜靜地躺著津滞,像睡著了一般。 火紅的嫁衣襯著肌膚如雪灼伤。 梳的紋絲不亂的頭發(fā)上触徐,一...
    開(kāi)封第一講書(shū)人閱讀 49,031評(píng)論 1 285
  • 那天,我揣著相機(jī)與錄音狐赡,去河邊找鬼撞鹉。 笑死,一個(gè)胖子當(dāng)著我的面吹牛猾警,可吹牛的內(nèi)容都是我干的孔祸。 我是一名探鬼主播,決...
    沈念sama閱讀 38,340評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼发皿,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼崔慧!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起穴墅,我...
    開(kāi)封第一講書(shū)人閱讀 36,973評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤惶室,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后玄货,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體皇钞,經(jīng)...
    沈念sama閱讀 43,466評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,937評(píng)論 2 323
  • 正文 我和宋清朗相戀三年松捉,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了夹界。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,039評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡隘世,死狀恐怖可柿,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情丙者,我是刑警寧澤复斥,帶...
    沈念sama閱讀 33,701評(píng)論 4 323
  • 正文 年R本政府宣布,位于F島的核電站械媒,受9級(jí)特大地震影響目锭,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜纷捞,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,254評(píng)論 3 307
  • 文/蒙蒙 一痢虹、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧主儡,春花似錦奖唯、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,259評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至臀玄,卻和暖如春瓢阴,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背健无。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,485評(píng)論 1 262
  • 我被黑心中介騙來(lái)泰國(guó)打工荣恐, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人累贤。 一個(gè)月前我還...
    沈念sama閱讀 45,497評(píng)論 2 354
  • 正文 我出身青樓叠穆,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親臼膏。 傳聞我的和親對(duì)象是個(gè)殘疾皇子硼被,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,786評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容

  • 本系列第三篇,承接前面的《淺談機(jī)器學(xué)習(xí)基礎(chǔ)》和《淺談深度學(xué)習(xí)基礎(chǔ)》渗磅。 自然語(yǔ)言處理緒論 什么是自然語(yǔ)言處理嚷硫? 自然...
    我偏笑_NSNirvana閱讀 17,517評(píng)論 2 68
  • 隱馬爾可夫模型(Hidden Markov Model,HMM) 最初由 L. E. Baum 和其它一些學(xué)者發(fā)表...
    vlnk2012閱讀 6,592評(píng)論 3 47
  • 日子過(guò)得有點(diǎn)昏昏浩浩始鱼,都忘記今天是周六了仔掸。可能是昨天回家有點(diǎn)早就誤以為昨天是周六了医清,所以剛剛與老朋友通話時(shí)還在提醒...
    燦爛陽(yáng)光1閱讀 181評(píng)論 0 4
  • 1. 準(zhǔn)備工作 1.1軟硬件環(huán)境 CPU:64位 OS:Windows 10 1.2 Python3.5 選用Py...
    朱亞超閱讀 992評(píng)論 0 2
  • 我躺在床上起暮,玩著ipad。 等會(huì)兒去吃飯会烙,我這么想著负懦。 看了看表,還早持搜,那算了吧密似,繼續(xù) 在笑話八卦的頁(yè)面里切換,用...
    憂郁的魷魚(yú)閱讀 197評(píng)論 0 1