隱馬爾科夫模型

隱含馬爾科夫模型
通信的本質就是編解碼和傳輸?shù)倪^程
觀測信號:o_1, o_2, ...
發(fā)送源的信息:s_1, s_2, ...
已知o_1, o_2, ...的情況下,求得令條件概率P(s_1,s_2,...|o_1,o_2,...)達到最大值得那個信息串s_1, s_2, ...余佛,即(解碼)
s_1,s_2,... =\mathop{\arg\max}\limits_{all\ s_1,s_2,...} P(s_1,s_2,...|o_1,o_2,...)

通過貝葉斯公式柠新,上述公式等價變換為
\frac{P(o_1,o_2,...|s_1,s_2,...)\cdot P(s_1,s_2,...)}{P(o_1,o_2,...)}
P(o_1,o_2,...)發(fā)送端產(chǎn)生信息o_1,o_2,...的可能性(比如說話的人),可忽略的常數(shù)
P(s_1,s_2,...)表示s_1,s_2,...在接收端是合符情理的信號
P(o_1,o_2,...|s_1,s_2,...)表示信息s_1,s_2,...在傳輸后變成接收的信號o_1,o_2,...的可能性

P(o_1,o_2,...|s_1,s_2,...)\cdot P(s_1,s_2,...)可以用Hidden Markov Model來估計

只與它的前一個狀態(tài)有關辉巡,即P(s_t|s_1,s_2,...,s_{t-1})=P(s_t|s_{t-1})的隨機過程恨憎,稱為馬爾科夫過程,也稱為馬爾科夫鏈

圖中表示P(S_{t+1}=m_3|S_t=m_2)=0.6郊楣,P(S_{t+1}=m_4|S_t=m_2)=0.4

隱含馬爾科夫模型是馬爾科夫鏈的一個擴展:任一時刻t的狀態(tài)s_t是不可見的憔恳,但輸出o_ts_t相關而且僅跟s_t相關,即獨立輸出假設

基于馬爾科夫假設和獨立輸出假設净蚤,某個特定的狀態(tài)序列s_1,s_2,...產(chǎn)出輸出符號o_1,o_2,...的概率:
P(s_1,s_2,...,o_1,o_2,...)=\prod_{t}P(s_t|s_{t-1})\cdot P(o_t|s_t)

P(o_1,o_2,...|s_1,s_2,...)=\prod_{t}P(o_t|s_t)P(s_1,s_2,...)=\prod_{t}P(s_t|s_{t-1})可以得到上式钥组,說明了通信的解碼問題可以用隱含馬爾科夫模型來解決。同時今瀑,找出上式的最大值進而找出要識別的句子s_1,s_2,...程梦,可以用維特比算法(Viterbi Algorithm)

P(s_1,s_2,...)是語言模型
P(o_1,o_2,...|s_1,s_2,...)在語音識別叫“聲學模型”点把,在機器翻譯叫“翻譯模型”

P(s_t|s_{t-1})表示從前一個狀態(tài)s_{t-1}進入當前狀態(tài)s_t的概率,稱為轉移概率
P(o_t|s_t)表示每個狀態(tài)s_t產(chǎn)生相應輸出符號o_t的概率作烟,稱為生成概率

訓練隱含馬爾科夫模型的過程愉粤,即估算轉移概率和生成概率(稱為模型參數(shù)),直接估算上述參數(shù)需要大量的人工標注數(shù)據(jù)拿撩,成本非常高衣厘。
更實用的方式是僅僅通過大量觀測到的信號o_1,o_2,...就能推算出模型參數(shù)的P(s_t|s_{t-1})P(o_t|s_t),即無監(jiān)督學習的訓練方法压恒,主要使用的鮑姆-韋爾奇算法影暴。

鮑姆-韋爾奇算法的思想:
1、首先找到一組能夠產(chǎn)出輸出序列o_1,o_2,...的模型參數(shù)(比如轉移概率P和輸出概率Q為均勻分布時探赫,是可以產(chǎn)出任意輸出序列的)型宙,記為M_{\theta_0}
2、根據(jù)這個模型M_{\theta_0}伦吠,計算出某個特定的輸出序列的概率P(O|M_{\theta_0})妆兑;以及最有可能產(chǎn)出這個輸出的狀態(tài)序列P(S|M_{\theta_0}),獲得產(chǎn)生O的所有可能路徑以及這些路徑的概率毛仪,和每個狀態(tài)經(jīng)歷了多少次搁嗓,到達了哪些狀態(tài),輸出了哪些符號(看作標注的訓練數(shù)據(jù))箱靴,再根據(jù):
P(s_t|s_{t-1})=\frac{P(s_t,s_{t-1})}{P(s_{t-1})}P(o_t|s_t)=\frac{P(o_t, s_t)}{P(s_t)}
計算出新的模型參數(shù)\theta_1腺逛,即得到M_{\theta_1},可以證明P(O|M_{\theta_1}) > P(O|M_{\theta_0})
3衡怀、重復2直至沒有找到更好的模型M_{\theta}

上述過程也就是EM過程(Expectation-Maximization)

總結
通信模型可以用隱含馬爾科夫模型來解決棍矛,自然語言處理、語音識別跟通信原理相通抛杨,當然也可以用它
解碼算法:維特比算法
訓練算法:鮑姆-韋爾奇算法

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末够委,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子蝶桶,更是在濱河造成了極大的恐慌慨绳,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,590評論 6 517
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件真竖,死亡現(xiàn)場離奇詭異脐雪,居然都是意外死亡,警方通過查閱死者的電腦和手機恢共,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,157評論 3 399
  • 文/潘曉璐 我一進店門战秋,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人讨韭,你說我怎么就攤上這事脂信⊙Ⅲ” “怎么了?”我有些...
    開封第一講書人閱讀 169,301評論 0 362
  • 文/不壞的土叔 我叫張陵狰闪,是天一觀的道長疯搅。 經(jīng)常有香客問我,道長埋泵,這世上最難降的妖魔是什么幔欧? 我笑而不...
    開封第一講書人閱讀 60,078評論 1 300
  • 正文 為了忘掉前任,我火速辦了婚禮丽声,結果婚禮上礁蔗,老公的妹妹穿的比我還像新娘。我一直安慰自己雁社,他們只是感情好浴井,可當我...
    茶點故事閱讀 69,082評論 6 398
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著霉撵,像睡著了一般磺浙。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上徒坡,一...
    開封第一講書人閱讀 52,682評論 1 312
  • 那天屠缭,我揣著相機與錄音,去河邊找鬼崭参。 笑死,一個胖子當著我的面吹牛款咖,可吹牛的內容都是我干的何暮。 我是一名探鬼主播,決...
    沈念sama閱讀 41,155評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼铐殃,長吁一口氣:“原來是場噩夢啊……” “哼海洼!你這毒婦竟也來了?” 一聲冷哼從身側響起富腊,我...
    開封第一講書人閱讀 40,098評論 0 277
  • 序言:老撾萬榮一對情侶失蹤坏逢,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后赘被,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體是整,經(jīng)...
    沈念sama閱讀 46,638評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 38,701評論 3 342
  • 正文 我和宋清朗相戀三年民假,在試婚紗的時候發(fā)現(xiàn)自己被綠了浮入。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,852評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡羊异,死狀恐怖事秀,靈堂內的尸體忽然破棺而出彤断,到底是詐尸還是另有隱情,我是刑警寧澤易迹,帶...
    沈念sama閱讀 36,520評論 5 351
  • 正文 年R本政府宣布宰衙,位于F島的核電站,受9級特大地震影響睹欲,放射性物質發(fā)生泄漏供炼。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 42,181評論 3 335
  • 文/蒙蒙 一句伶、第九天 我趴在偏房一處隱蔽的房頂上張望劲蜻。 院中可真熱鬧,春花似錦考余、人聲如沸先嬉。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,674評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽疫蔓。三九已至,卻和暖如春身冬,著一層夾襖步出監(jiān)牢的瞬間衅胀,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,788評論 1 274
  • 我被黑心中介騙來泰國打工酥筝, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留滚躯,地道東北人。 一個月前我還...
    沈念sama閱讀 49,279評論 3 379
  • 正文 我出身青樓嘿歌,卻偏偏與公主長得像掸掏,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子宙帝,可洞房花燭夜當晚...
    茶點故事閱讀 45,851評論 2 361

推薦閱讀更多精彩內容

  • 16宿命:用概率思維提高你的勝算 以前的我是風險厭惡者丧凤,不喜歡去冒險,但是人生放棄了冒險步脓,也就放棄了無數(shù)的可能愿待。 ...
    yichen大刀閱讀 6,059評論 0 4
  • 公元:2019年11月28日19時42分農(nóng)歷:二零一九年 十一月 初三日 戌時干支:己亥乙亥己巳甲戌當月節(jié)氣:立冬...
    石放閱讀 6,889評論 0 2
  • 年紀越大,人的反應就越遲鈍靴患,腦子就越不好使仍侥,計劃稍有變化,就容易手忙腳亂鸳君,亂了方寸访圃。 “玩壞了”也是如此,不但會亂...
    玩壞了閱讀 2,154評論 2 1
  • 感動 我在你的眼里的樣子相嵌,就是你的樣子腿时。 相互內化 沒有絕對的善惡 有因必有果 當你以自己的價值觀幸福感去要求其他...
    周粥粥叭閱讀 1,640評論 1 5
  • 昨天考過了阿里規(guī)范况脆,心里舒坦了好多,敲代碼也猶如神助批糟。早早完成工作回家嘍
    常亞星閱讀 3,042評論 0 1