總是搞混啤挎,這里總結(jié)一下常規(guī)的叫法:
先驗(yàn)概率:
事件發(fā)生前的預(yù)判概率÷汛眨可以是基于歷史數(shù)據(jù)的統(tǒng)計(jì)庆聘,可以由背景常識(shí)得出,也可以是人的主觀觀點(diǎn)給出勺卢。一般都是單獨(dú)事件概率伙判,如P(x),P(y)。后驗(yàn)概率:
事件發(fā)生后求的反向條件概率黑忱;或者說宴抚,基于先驗(yàn)概率求得的反向條件概率。概率形式與條件概率相同甫煞。條件概率:
一個(gè)事件發(fā)生后另一個(gè)事件發(fā)生的概率菇曲。一般的形式為P(x|y)表示y發(fā)生的條件下x發(fā)生的概率。
貝葉斯公式:P(y|x) = ( P(x|y) * P(y) ) / P(x)
這里:
P(y|x) 是后驗(yàn)概率抚吠,一般是我們求解的目標(biāo)常潮。
P(x|y) 是條件概率,又叫似然概率楷力,一般是通過歷史數(shù)據(jù)統(tǒng)計(jì)得到喊式。一般不把它叫做先驗(yàn)概率孵户,但從定義上也符合先驗(yàn)定義。
P(y) 是先驗(yàn)概率岔留,一般都是人主觀給出的夏哭。貝葉斯中的先驗(yàn)概率一般特指它。
P(x) 其實(shí)也是先驗(yàn)概率献联,只是在貝葉斯的很多應(yīng)用中不重要(因?yàn)橹灰畲蠛篁?yàn)不求絕對(duì)值)方庭,需要時(shí)往往用全概率公式計(jì)算得到。
實(shí)例:假設(shè)y是文章種類酱固,是一個(gè)枚舉值;x是向量头朱,表示文章中各個(gè)單詞的出現(xiàn)次數(shù)运悲。
在擁有訓(xùn)練集的情況下,顯然除了后驗(yàn)概率P(y|x)中的x來自一篇新文章無法得到项钮,p(x),p(y),p(x|y)都是可以在抽樣集合上統(tǒng)計(jì)出的班眯。
最大似然理論:
認(rèn)為P(x|y)最大的類別y,就是當(dāng)前文檔所屬類別烁巫。即Max P(x|y) = Max p(x1|y)p(x2|y)...p(xn|y), for all y貝葉斯理論:
認(rèn)為需要增加先驗(yàn)概率p(y)署隘,因?yàn)橛锌赡苣硞€(gè)y是很稀有的類別幾千年才看見一次,即使P(x|y)很高亚隙,也很可能不是它磁餐。
所以y = Max P(x|y) * P(y), 其中p(y)一般是數(shù)據(jù)集里統(tǒng)計(jì)出來的。
從上例來講阿弃,貝葉斯理論顯然更合理一些诊霹;但實(shí)際中很多先驗(yàn)概率是拍腦袋得出的(不準(zhǔn)),有些甚至是為了方便求解方便生造出來的(硬湊)渣淳,那有先驗(yàn)又有什么好處呢脾还?一般攻擊貝葉斯都在于這一點(diǎn)