概率圖模型

近一周學(xué)習(xí)了概率圖模型西傀,總結(jié)下自己的理解,當(dāng)然只是概括介紹我認(rèn)為比較核心的概念阶剑,所以不會做細(xì)致的算法說明等翠储,如果有不正確的地方歡迎大家指正??

整個模型分類參考下面圖

(1)(本圖來自統(tǒng)計自然語言處理)

概率圖模型是一類用圖來表達(dá)的相關(guān)變量關(guān)系的概率模型,它以圖為工具洞难,點(diǎn)表示變量舆吮,邊表示變量間的概率相關(guān)關(guān)系。

從圖(1)可看見,概率圖模型可分為基本的兩類:有向圖圖模型(貝葉斯網(wǎng)絡(luò)為代表)和無向圖模型(馬爾科夫網(wǎng)絡(luò)為代表)色冀。下面會大致介紹下:馬爾科夫模型潭袱,有向圖模型(貝葉斯網(wǎng)絡(luò),隱馬爾科夫模型)锋恬。無向圖模型(馬爾科夫網(wǎng)絡(luò)(馬爾科夫隨機(jī)場就是典型的馬爾科夫網(wǎng)絡(luò))屯换,條件隨機(jī)場)

貝葉斯網(wǎng)絡(luò):

屬于生成模型,借助有向無環(huán)圖(DAG圖)來刻畫屬性簡的依賴關(guān)系与学,并使用條件概率表來描述屬性的聯(lián)合概率分布彤悔,這里重點(diǎn)是計算聯(lián)合概率分布

例如:

(2)(來自周志華的機(jī)器學(xué)習(xí))

方法:比如x1是x3,x4的父節(jié)點(diǎn)索守,父子節(jié)點(diǎn)有一定的概率依賴關(guān)系晕窑。然后通過右邊的條件概率表給出所有這種父子依賴關(guān)系的概率表,就可以計算出屬性x1,x2,x3....的聯(lián)合概率分布定義:P(x1,x2,x3,x4,x5)=P(x1)P(x2)P(x3|x1)P(x4|x1,x2)P(x5|x2)卵佛,當(dāng)然西瓜書中還分析了一些條件獨(dú)立性的證明杨赤,有興趣的自己可以閱讀

1.學(xué)習(xí):

如果都知道各個變量,各個屬性間的依賴關(guān)系截汪,只需要對各個條件概率表進(jìn)行計數(shù)疾牲,就能夠得到聯(lián)合概率分布。但實(shí)際情況中幾乎不會輕易得到所有的關(guān)系依賴衙解,所有貝葉斯網(wǎng)絡(luò)的首要任務(wù)是根據(jù)訓(xùn)練數(shù)據(jù)找出最“恰當(dāng)”的貝葉斯網(wǎng)阳柔,也就是學(xué)習(xí)出屬性間的依賴關(guān)系,得到聯(lián)合概率分布丢郊。使用的是評分函數(shù)算法

2.推斷

通過第一步的學(xué)習(xí)得到了聯(lián)合概率分布盔沫,屬性,變量間的依賴關(guān)系枫匾,也就是得到了貝葉斯網(wǎng)絡(luò)后架诞,就可以通過它來回答"查詢",及通過一些已知屬性變量的觀測值來預(yù)測一些其他的屬性干茉。比如圖(1)中谴忧,通過x1來預(yù)測x3,x4等

2.1 近似推斷(吉布斯采樣)

現(xiàn)實(shí)情況中,網(wǎng)絡(luò)的節(jié)點(diǎn)很多角虫,很難通過貝葉斯網(wǎng)絡(luò)定義的聯(lián)合概率來精確計算后驗(yàn)概率沾谓,所以會使用吉布斯采樣來近似推斷


3.EM算法

EM算法是一種常用的估計參數(shù)隱變量的算法,是一種迭代的方法戳鹅,步驟是:E步均驶,通過隨機(jī)初始化參數(shù)theta,通過訓(xùn)練數(shù)據(jù)推斷出最優(yōu)的隱變量Z枫虏。M步妇穴,通過Z爬虱,進(jìn)一步調(diào)整參數(shù)theta

前面討論都是假設(shè)樣本已被觀測到,也就是樣本的"完整性"來做的腾它,但實(shí)際情況很多都是"不完整的"跑筝,比如西瓜的根蒂已經(jīng)脫落,就無法看出"蜷縮"和"硬挺"瞒滴。這種變量我們稱為隱變量曲梗,常用的EM算法來對隱變量進(jìn)行填充計算


馬爾科夫模型

馬爾科夫描述了一類重要的隨機(jī)變化過程,我們常常會考察一個隨機(jī)變量序列妓忍,這些隨機(jī)變化并不是相互獨(dú)立的虏两,每個隨機(jī)變量的值依賴于這個序列前面的狀態(tài),可表示為

(3)(來自統(tǒng)計自然語言處理)

如果定義只與前一時刻有關(guān)系单默,那么稱為一階馬爾科夫鏈

(4)(來自統(tǒng)計自然語言處理)

隱馬爾科夫模型(HMM)

馬爾科夫模型默認(rèn)的是每個狀態(tài)代表的一個可觀察的序列碘举,隱馬爾科夫模型描述的是狀態(tài)是隱藏的,不可觀察的搁廓。還有一個可輸出的觀測序列引颈。這種模型有兩個隨機(jī),1是狀態(tài)轉(zhuǎn)移的隨機(jī)境蜕,2是一個狀態(tài)可觀察值的隨機(jī)蝙场。

(5)(周志華機(jī)器學(xué)習(xí))

1.其中幾個重要的參數(shù):a.狀態(tài)轉(zhuǎn)移概率,y1,y2....的轉(zhuǎn)移概率粱年。? b.輸出觀察概率y輸出x的概率售滤。c.初始狀態(tài)概率,y1

2.HMM解決的問題

a.如何評估模型與觀測序列之間的匹配程度台诗,例如許多任務(wù)已有觀察序列{x1,x2,x3...xn-1}求x(n)的最有可能值完箩,就是轉(zhuǎn)換為判定模型,P(x|theta)最大的匹配程度

b.根據(jù)觀測序列推斷出隱藏的模型狀態(tài)拉队,已經(jīng){x1,x2,x3...x(n)},求{y1,y2,y3...y(n)}拄丰。如語音識別中香追,觀測值為語音符號相速,隱藏狀態(tài)為文字

c.如何訓(xùn)練模型沿腰,使其能最好的描述觀測數(shù)據(jù),即調(diào)整模型參數(shù)[A,B,PI]事哭,使得該觀測序列出現(xiàn)的概率最大


馬爾科夫隨機(jī)場(馬爾科夫網(wǎng)絡(luò))

馬爾科夫隨機(jī)場是典型的馬爾科夫網(wǎng)絡(luò)漫雷,是一種著名的無向圖模型,多個變量之間的聯(lián)合概率分布能夠基于團(tuán)分解為多個因子的乘積(可以和貝葉斯網(wǎng)對比鳍咱,貝葉斯網(wǎng)可理解為基于各個父子節(jié)點(diǎn)分開乘積)

團(tuán):

對于圖中的任意兩點(diǎn)都有線相連降盹,則稱該結(jié)點(diǎn)子集為一個"團(tuán)",若在一個團(tuán)中加入另外的節(jié)點(diǎn)都不再形成團(tuán)谤辜,那么陳該該結(jié)點(diǎn)子集為"極大團(tuán)"

勢函數(shù):

亦稱"因子"(factor)澎现,這是定義在變量子集上的非負(fù)實(shí)函數(shù)仅胞,主要用于定義概率分布函數(shù):

各個極大團(tuán)概率分布的乘積

條件隨機(jī)場

是一種判別式無向圖模型,對條件分布進(jìn)行建模剑辫。試圖對多個變量在給定觀測值后的條件概率進(jìn)行建模。具體說就是給定X={x1,x2,x3,....xn}和Y={y1,y2,y3...yn}然后建立模型P(Y|X)渠欺。然后對后面給定的(x11,x12,x....)直接使用P(Y|X)模型進(jìn)行預(yù)測妹蔽。標(biāo)記變量y可以是結(jié)構(gòu)型變量,即其分量直接具有某種相關(guān)性挠将。

例如胳岂,NLP中處理詞性標(biāo)注任務(wù)中,觀測數(shù)據(jù)為語句(單詞序列)舔稀,標(biāo)記為相應(yīng)的詞性序列乳丰,具有線性序列結(jié)構(gòu)。另外在語法分析任務(wù)中内贮,輸出標(biāo)記則是語法樹产园,具有樹形結(jié)構(gòu)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市夜郁,隨后出現(xiàn)的幾起案子什燕,更是在濱河造成了極大的恐慌,老刑警劉巖竞端,帶你破解...
    沈念sama閱讀 218,546評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件屎即,死亡現(xiàn)場離奇詭異,居然都是意外死亡事富,警方通過查閱死者的電腦和手機(jī)技俐,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,224評論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來统台,“玉大人雕擂,你說我怎么就攤上這事〗让” “怎么了捂刺?”我有些...
    開封第一講書人閱讀 164,911評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長募寨。 經(jīng)常有香客問我族展,道長,這世上最難降的妖魔是什么拔鹰? 我笑而不...
    開封第一講書人閱讀 58,737評論 1 294
  • 正文 為了忘掉前任仪缸,我火速辦了婚禮,結(jié)果婚禮上列肢,老公的妹妹穿的比我還像新娘恰画。我一直安慰自己宾茂,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,753評論 6 392
  • 文/花漫 我一把揭開白布拴还。 她就那樣靜靜地躺著跨晴,像睡著了一般。 火紅的嫁衣襯著肌膚如雪片林。 梳的紋絲不亂的頭發(fā)上端盆,一...
    開封第一講書人閱讀 51,598評論 1 305
  • 那天,我揣著相機(jī)與錄音费封,去河邊找鬼焕妙。 笑死,一個胖子當(dāng)著我的面吹牛弓摘,可吹牛的內(nèi)容都是我干的焚鹊。 我是一名探鬼主播,決...
    沈念sama閱讀 40,338評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼韧献,長吁一口氣:“原來是場噩夢啊……” “哼末患!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起势决,我...
    開封第一講書人閱讀 39,249評論 0 276
  • 序言:老撾萬榮一對情侶失蹤阻塑,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后果复,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體陈莽,經(jīng)...
    沈念sama閱讀 45,696評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,888評論 3 336
  • 正文 我和宋清朗相戀三年虽抄,在試婚紗的時候發(fā)現(xiàn)自己被綠了走搁。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,013評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡迈窟,死狀恐怖私植,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情车酣,我是刑警寧澤曲稼,帶...
    沈念sama閱讀 35,731評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站湖员,受9級特大地震影響贫悄,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜娘摔,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,348評論 3 330
  • 文/蒙蒙 一窄坦、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦鸭津、人聲如沸彤侍。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,929評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽盏阶。三九已至,卻和暖如春闻书,著一層夾襖步出監(jiān)牢的瞬間般哼,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,048評論 1 270
  • 我被黑心中介騙來泰國打工惠窄, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人漾橙。 一個月前我還...
    沈念sama閱讀 48,203評論 3 370
  • 正文 我出身青樓杆融,卻偏偏與公主長得像,于是被迫代替她去往敵國和親霜运。 傳聞我的和親對象是個殘疾皇子脾歇,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,960評論 2 355

推薦閱讀更多精彩內(nèi)容

  • 在之前的一段時間里,忙于周圍的亂七八糟的事情,在更新了上一期之后自己也很久沒有更新,自己也想,如果自己沒有用一種良...
    云時之間閱讀 2,435評論 0 5
  • 神經(jīng)網(wǎng)絡(luò) 原理 《機(jī)器學(xué)習(xí)》周志華 14.1 隱馬爾可夫模型 機(jī)器學(xué)習(xí)最重要的任務(wù),是根據(jù)一些已觀察到的證據(jù)(例如...
    hxiaom閱讀 1,316評論 0 1
  • 寫在最前面 如今機(jī)器學(xué)習(xí)和深度學(xué)習(xí)如此火熱淘捡,相信很多像我一樣的普通程序猿或者還在大學(xué)校園中的同學(xué)藕各,一定也想?yún)⑴c其中...
    EddyLiu2017閱讀 2,884評論 0 2
  • mac歐路詞典(3.6.3版本)同步時出現(xiàn)以下問題,但網(wǎng)絡(luò)無問題焦除。 打開Terminal激况,輸入```rm ~/Li...
    KentShen閱讀 5,742評論 0 1
  • 我正在上班乌逐,女兒用她奶奶的手機(jī)給我打電話,說媽媽你“嗖”一下來接我吧创葡,我要回家浙踢。 我問她爺爺奶奶呢,她說奶奶在旁邊...
    搔耳朵的貓閱讀 257評論 0 0