定義: 關于時序的概率模型涂召,描述由一個隱藏得馬爾可夫鏈隨機生成不可觀測的狀態(tài)隨機序列,再由各個狀態(tài)生成一個觀測而產(chǎn)生的觀測隨機序列的過程吼和。
狀態(tài)序列: 隱藏的馬爾可夫鏈隨機生成的狀態(tài)的序列
觀測序列: 每一個狀態(tài)生成一個觀測拉鹃,而由此產(chǎn)生的觀測的隨機序列
序列的每一個位置又可以看做是一個時刻
隱馬爾可夫模型由初始概率分布、狀態(tài)轉移概率分布以及觀測概率分布確定慌烧。形式定義如下:
所有可能的狀態(tài)的集合:Q={q1,q2,q3,q4...qN}
所有可能的觀測的集合:V={v1,v2,v3,v4...vN}
長度為T的狀態(tài)序列:I=(i1,i2,i3,i4,...iT)
對于的長度為T的觀測序列:O=(o1,o2,o3,o4...oT)
狀態(tài)轉移概率矩陣:A = [aij]NxN逐抑,其中
aij = P(it+1=qj|it=qi), i=1,2,...,N; j=1,2,...,N, 是在時刻t處于狀態(tài)qi的條件下在時刻t+1轉移到qj的概率。
觀測概率矩陣:B=[bj(k)]NxM, 其中bj(k)=P(ot=vk|it=qj), k=1,2,...,M; j=1,2,...,N 是指時刻t處于狀態(tài)qj的條件下生成觀測vk的概率屹蚊。
PP 代表初始狀態(tài)概率向量: PP = (ppi); 其中ppi=P(i1=qi) , i = 1,2,...,N 指時刻t=1處于狀態(tài)qi的概率厕氨。
簡述的bug無法插入數(shù)學公式,好坑爹
隱馬爾可夫由初始狀態(tài)概率向量PP汹粤、狀態(tài)轉移概率矩陣A和觀測概率矩陣B決定命斧。PP和A決定狀態(tài)序列,B決定觀測序列嘱兼。因此隱馬爾可夫模型lambda可以用用三元符號表示国葬,即 lambda = (A, B, PP), A、B芹壕、PP稱為隱馬爾可夫模型的三要素胃惜。
隱馬爾可夫模型的兩個基本假設:
(1) 齊次馬爾可夫性假設,即假設隱藏得馬爾可夫鏈再任意時刻t的狀態(tài)只依賴于其前一時刻的狀態(tài)哪雕,與其他時刻的狀態(tài)及觀測無關船殉,也與時刻t無關。
P(it|it-1, ot-1,it-2, ot-2,...i1, o1) = P(it|it-1)
(2)觀測獨立性假設斯嚎,即假設任意時刻的觀測只依賴于該時刻的馬爾可夫鏈的狀態(tài)利虫,與其他觀測及狀態(tài)無關。
P(ot|iT, oT, iT-1, oT-1,...,it+1, ot+1, it, it-1, ot-1,...,i1,o1) = P(ot|it)
隱馬爾可夫模型可以用于標注堡僻,這是狀態(tài)對應這標記糠惫。標注問題是給定觀測的序列預測其對應標記序列《ひ撸可以假設標注問題的數(shù)據(jù)是由隱馬爾可夫模型生成的硼讽。
觀測序列的生成過程
算法(觀測序列的生成)
輸入:隱馬爾可夫模型 lambda = (A, B, PP), 觀測序列長度T
輸出:觀測序列 O = (o1,o2,o3,o4,...,oT)
(1) 按照初始狀態(tài)分布PP產(chǎn)生狀態(tài)i1
(2)令t=1
(3)安裝狀態(tài)it的觀測概率分布bi1(k)生成ot
(4)安裝狀態(tài)it的狀態(tài)轉移概率分布{aitit+1}產(chǎn)生狀態(tài)it+1; it+1 = 1, 2, 3,...,N
(5)令t=t+1牲阁;如果t< T, 轉(3)固阁;否則壤躲,終止
隱馬爾可夫模型的3個基本問題
(1)概率計算問題:給定模型lambda = (A, B, PP)和觀測序列O = (o1,o2,o3,o4,...,oT),計算再模型lambda下觀測序列O出現(xiàn)的概率P(O|lambda).
(2)學習問題:已知觀測序列O = (o1,o2,o3,o4,...,oT)备燃,估計模型lambda參數(shù)碉克,使得在該模型下觀測序列概率P(O|lambda)最大。即用最大似然估計的方法估計參數(shù)并齐。
(3)預測問題:也稱為解碼問題漏麦,已知模型lambda = (A, B, PP)和觀測序列O = (o1,o2,o3,o4,...,oT),求對給定觀測序列條件概率P(I|O)最大的狀態(tài)序列I=(i1, i2,i3,..,iT)况褪。即給定觀測序列撕贞,求最有可能的對應的狀態(tài)序列。
Reference:
《統(tǒng)計學習方法》李航