隱馬爾科夫模型(HMM)

1 簡(jiǎn)介

隱馬爾可夫模型(Hidden Markov Model)惋鸥,簡(jiǎn)稱HMM, 是一種基于概率統(tǒng)計(jì)的模型鸟废,是一種結(jié)構(gòu)最簡(jiǎn)單的動(dòng)態(tài)貝葉斯網(wǎng)猜敢,是一種重要的有向圖模型。它用來描述一個(gè)含有隱含未知參數(shù)的馬爾可夫過程(Markov Process)盒延。其難點(diǎn)是從可觀察參數(shù)中確定該過程的隱參數(shù)锣枝,然后利用這些參數(shù)來作進(jìn)一步的分析。

自上世紀(jì)80年代發(fā)展起來兰英,隱馬爾科夫模型是比較經(jīng)典的機(jī)器學(xué)習(xí)模型了撇叁,它在語(yǔ)音識(shí)別、文字識(shí)別畦贸、自然語(yǔ)言處理陨闹、模式識(shí)別等領(lǐng)域得到廣泛的應(yīng)用。當(dāng)然薄坏,隨著深度學(xué)習(xí)的崛起(RNN趋厉,LSTM等神經(jīng)網(wǎng)絡(luò)序列模型),HMM的地位有所下降胶坠。但是作為一個(gè)經(jīng)典的模型君账,學(xué)習(xí)HMM的模型和對(duì)應(yīng)算法,對(duì)我們解決問題建模的能力提高以及算法思路的拓展還是很好的沈善。

1.1 馬爾可夫過程(Markov Process)

馬爾可夫過程 (Markov Process)乡数,它因俄羅斯數(shù)學(xué)家安德烈·馬爾可夫而得名椭蹄,代表數(shù)學(xué)中具有馬爾可夫性質(zhì)的離散隨機(jī)過程。它的原始模型馬爾可夫鏈净赴,由安德烈·馬爾可夫于1907年提出绳矩。

隨機(jī)過程中,每個(gè)狀態(tài)的轉(zhuǎn)移只依賴于之前的 n 個(gè)狀態(tài)玖翅,這個(gè)過程被稱為1個(gè) n 階的模型翼馆,其中 n 是影響轉(zhuǎn)移狀態(tài)的數(shù)目。最簡(jiǎn)單的馬爾科夫過程就是一階過程金度,每一個(gè)狀態(tài)的轉(zhuǎn)移只依賴于其之前的那一個(gè)狀態(tài)应媚。注意這和確定性系統(tǒng)不一樣,因?yàn)檫@種轉(zhuǎn)移是有概率的猜极,而不是確定性的中姜。

X1, … , Xn,每個(gè)狀態(tài)值取決于前面有限個(gè)狀態(tài)魔吐。如果 Xn+1 對(duì)于過去狀態(tài)的條件概率分布僅是 Xn 的一個(gè)函數(shù)扎筒,則

這里 x 為過程中的某個(gè)狀態(tài)莱找。這個(gè)恒等式可被看作是馬爾可夫性質(zhì)

通俗的說就是酬姆,隨機(jī)過程中某一時(shí)刻的狀態(tài),只與它前一時(shí)刻的狀態(tài)有關(guān)奥溺,以上就是馬爾科夫性質(zhì)辞色。我們知道自然世界中的很多現(xiàn)象都不符合這一性質(zhì),但是我們可以假設(shè)其具有馬爾科夫性質(zhì)浮定,這為原來很多無章可循的問題提供了一種解法相满。?

如果某一隨機(jī)過程滿足馬爾科夫性質(zhì),則稱這一過程為馬爾科夫過程桦卒,或稱馬爾科夫鏈立美。

馬爾可夫鏈(Markov Chain),描述了一種狀態(tài)序列方灾,其每個(gè)狀態(tài)值取決于前面有限個(gè)狀態(tài)建蹄。馬爾可夫鏈?zhǔn)蔷哂旭R爾可夫性質(zhì)的隨機(jī)變量的一個(gè)數(shù)列。這些變量的范圍裕偿,即它們所有可能取值的集合洞慎,被稱為“狀態(tài)空間”,而?Xn 的值則是在時(shí)間 n 的狀態(tài)嘿棘。

狀態(tài)間的轉(zhuǎn)移概率(可以寫成狀態(tài)轉(zhuǎn)移矩陣)

在馬爾科夫鏈中劲腿,每一個(gè)圓圈代表相應(yīng)時(shí)刻的狀態(tài),有向邊代表了可能的狀態(tài)轉(zhuǎn)移鸟妙,權(quán)值表示狀態(tài)轉(zhuǎn)移概率焦人。?

1.2 HMM中的隱

這里“隱”指的是馬爾科夫鏈中任意時(shí)刻的狀態(tài)變量是不可見的挥吵,也就是說狀態(tài)序列S0,S1,...,St無法直接觀測(cè)到。但是HMM中每時(shí)刻有一個(gè)可見的觀測(cè)值Ot與之對(duì)應(yīng)垃瞧,而且Ot有且僅于當(dāng)前時(shí)刻隱狀態(tài)St有關(guān)蔫劣,St外化表現(xiàn)為Ot的概率稱為輸出概率,因此隱馬爾科夫模型的結(jié)構(gòu)圖如下所示个从。

因此,隱馬爾科夫模型中馬爾科夫鏈指的是隱狀態(tài)S0,S1,...,St序列脉幢。

2 HMM模型五元組

HMM模型可以用五元組(O,S,A,B,π)表示。其中

O:{o0,o1,...,0n}表示觀測(cè)序列嗦锐,是系統(tǒng)的外在可觀測(cè)變量嫌松。

S:{s0,s1,...,sn}表示隱狀態(tài)序列,是導(dǎo)致系統(tǒng)外在表現(xiàn)變化的內(nèi)因奕污。

A:{aij=p(sj|si)}表示狀態(tài)轉(zhuǎn)移概率萎羔。 ?這個(gè)概率 表明了隱狀態(tài)從一種狀態(tài)轉(zhuǎn)換到另一種狀態(tài)的概率。

B:{bij=p(oj|si)}表示輸出概率碳默。 這個(gè)概率表明了從某種隱變量到可觀測(cè)值的概率贾陷。

π :{ π 0,π1,...,πm},表示初始狀態(tài)概率分布嘱根。

3 HMM 模型的三個(gè)基本問題

根據(jù)以上HMM模型五元組表示髓废,我們可以歸納出HMM模型解決的三個(gè)經(jīng)典的問題。?

1)?評(píng)估觀察序列概率该抒。即給定模型λ=(A,B,π)和O={o1,o2,...on}(狀態(tài)轉(zhuǎn)移矩陣A慌洪,輸出矩陣B,和觀測(cè)序列O這些已知)凑保,計(jì)算在模型λ下觀測(cè)序列O出現(xiàn)的概率P(O|λ)冈爹。這個(gè)問題的求解需要用到前向后向(forward/Backward?)算法,這個(gè)問題是HMM模型三個(gè)問題中最簡(jiǎn)單的欧引。

這就是評(píng)估問題频伤,最顯而易見的一個(gè)應(yīng)用就是異常檢測(cè),如果一個(gè)多次HMM模型實(shí)驗(yàn)的結(jié)果都顯示觀測(cè)序列出現(xiàn)的概率較小芝此,說明觀測(cè)序列和模型不太吻合憋肖,則可以斷定系統(tǒng)可能出現(xiàn)了異常。該問題最簡(jiǎn)單粗暴的解法就是直接組合出所有的可能隱藏狀態(tài)序列癌蓖,然后求出每個(gè)隱藏狀態(tài)序列導(dǎo)致觀測(cè)序列發(fā)生的概率瞬哼,最后將概率求和即是最終結(jié)果。但是列舉出所有可能的狀態(tài)序列是一個(gè)指數(shù)爆炸增長(zhǎng)的問題租副,在實(shí)際系統(tǒng)中不太可能實(shí)現(xiàn)坐慰。因此有人提出了forward/Backward 算法。?

2)預(yù)測(cè)問題,也稱為解碼問題结胀。即給定模型λ=(A,B, π )和O={o1,o2,...on} (狀態(tài)轉(zhuǎn)移矩陣A赞咙,輸出矩陣B,和觀測(cè)序列O這些已知) 糟港,求最有可能產(chǎn)生該觀測(cè)序列的隱藏狀態(tài)序列攀操,這個(gè)問題的求解需要用到基于動(dòng)態(tài)規(guī)劃的維特比算法。這個(gè)問題是HMM模型三個(gè)問題中復(fù)雜度居中的算法秸抚。

這個(gè)問題通常被稱作解碼問題速和,該問題通常也被稱作“由果溯因”。隱狀態(tài)通常是導(dǎo)致系統(tǒng)外在表現(xiàn)變化的“內(nèi)因”剥汤,觀測(cè)序列只是隱狀態(tài)變化帶來的“結(jié)果”颠放。最常見的應(yīng)用就是語(yǔ)音識(shí)別,即將某一段語(yǔ)音轉(zhuǎn)化成對(duì)應(yīng)的文字序列吭敢。解決該問題也可以采用同問題一類似的枚舉法碰凶,只需要將所有可能序列的概率求和改為找最大概率對(duì)應(yīng)序列即可,但同樣效率不高鹿驼。因此解決此類問題常用Viterbi算法欲低。

3)模型參數(shù)學(xué)習(xí)問題。即給定觀測(cè)序列O={o1,o2,...on}畜晰,估計(jì)模型λ=(A,B, π )的參數(shù)砾莱,使該模型下觀測(cè)序列的條件概率P(O|λ)最大。這個(gè)問題的求解需要用到基于EM算法的鮑姆-韋爾奇算法舷蟀。這個(gè)問題是HMM模型三個(gè)問題中最復(fù)雜的恤磷。

已知僅僅是很多觀測(cè)序列面哼,估計(jì)HMM模型的參數(shù)的可能取值野宜。這個(gè)問題被稱作學(xué)習(xí)問題,通過大量的樣本數(shù)據(jù)去學(xué)習(xí)最優(yōu)的模型參數(shù)魔策,該問題的求解比較復(fù)雜匈子,常采用Baum-Welch算法。

4 參考

如何用簡(jiǎn)單易懂的例子解釋隱馬爾可夫模型闯袒? https://www.zhihu.com/question/20962240

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末虎敦,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子政敢,更是在濱河造成了極大的恐慌其徙,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,311評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件喷户,死亡現(xiàn)場(chǎng)離奇詭異唾那,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)褪尝,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,339評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門闹获,熙熙樓的掌柜王于貴愁眉苦臉地迎上來期犬,“玉大人,你說我怎么就攤上這事避诽」昊ⅲ” “怎么了?”我有些...
    開封第一講書人閱讀 152,671評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵沙庐,是天一觀的道長(zhǎng)鲤妥。 經(jīng)常有香客問我,道長(zhǎng)拱雏,這世上最難降的妖魔是什么旭斥? 我笑而不...
    開封第一講書人閱讀 55,252評(píng)論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮古涧,結(jié)果婚禮上垂券,老公的妹妹穿的比我還像新娘。我一直安慰自己羡滑,他們只是感情好菇爪,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,253評(píng)論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著柒昏,像睡著了一般凳宙。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上职祷,一...
    開封第一講書人閱讀 49,031評(píng)論 1 285
  • 那天氏涩,我揣著相機(jī)與錄音,去河邊找鬼有梆。 笑死是尖,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的泥耀。 我是一名探鬼主播饺汹,決...
    沈念sama閱讀 38,340評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼痰催!你這毒婦竟也來了兜辞?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,973評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤夸溶,失蹤者是張志新(化名)和其女友劉穎逸吵,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體缝裁,經(jīng)...
    沈念sama閱讀 43,466評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡扫皱,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,937評(píng)論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片啸罢。...
    茶點(diǎn)故事閱讀 38,039評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡编检,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出扰才,到底是詐尸還是另有隱情允懂,我是刑警寧澤,帶...
    沈念sama閱讀 33,701評(píng)論 4 323
  • 正文 年R本政府宣布衩匣,位于F島的核電站蕾总,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏琅捏。R本人自食惡果不足惜生百,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,254評(píng)論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望柄延。 院中可真熱鬧蚀浆,春花似錦、人聲如沸搜吧。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,259評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)滤奈。三九已至摆昧,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間蜒程,已是汗流浹背绅你。 一陣腳步聲響...
    開封第一講書人閱讀 31,485評(píng)論 1 262
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留昭躺,地道東北人忌锯。 一個(gè)月前我還...
    沈念sama閱讀 45,497評(píng)論 2 354
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像窍仰,于是被迫代替她去往敵國(guó)和親汉规。 傳聞我的和親對(duì)象是個(gè)殘疾皇子礼殊,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,786評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容

  • 隱形馬爾可夫模型驹吮,英文是 Hidden Markov Models,所以以下就簡(jiǎn)稱 HMM晶伦。既是馬爾可夫模型碟狞,就一...
    errorrrr閱讀 985評(píng)論 0 4
  • 隱馬爾可夫模型 是統(tǒng)計(jì)模型,它用來描述一個(gè)含有隱含未知參數(shù)的馬爾可夫過程婚陪。其難點(diǎn)是從可觀察的參數(shù)中確定該過程的隱含...
    mmmwhy閱讀 1,252評(píng)論 0 0
  • 直接上鏈接吧 1.聊聊隱馬爾科夫模型(HMM) 2.一文搞懂HMM 3.HMM-python實(shí)例
    JRlu閱讀 518評(píng)論 0 3
  • 最近在做一個(gè)項(xiàng)目族沃,需要把出租車軌跡點(diǎn)映射到路段上,需要用到HMM,所以先好好學(xué)習(xí)下這個(gè)東西吧脆淹。 正文 隱馬爾科夫模...
    此生望盡天涯路閱讀 870評(píng)論 0 1
  • 《想讓孩子學(xué)會(huì)分享盖溺,請(qǐng)先允許他們自私》 讓孩子學(xué)會(huì)分享漓糙,并不意味著他們不可以捍衛(wèi)自己的物權(quán);讓孩子學(xué)會(huì)分享烘嘱,并不意...
    喵媽愛小魚閱讀 264評(píng)論 0 0