拋硬幣的結(jié)果滿足二項分布,即若每次試驗正面向上的概率為θ夸赫,進(jìn)行m次試驗菩帝,其中n次正面向上的概率為
當(dāng)時,若進(jìn)行十次試驗憔足,出現(xiàn)五次正面向上的概率最大胁附,四次或六次正面向上的概率略小。如果
滓彰,十次試驗中依然是出現(xiàn)五次正面向上的概率最大,此時
反過來思考州袒,倘若不知道正面向上的概率揭绑,只有“拋十次硬幣出現(xiàn)五次正面向上”這一觀察結(jié)果,能否判定呢郎哭?顯然是不行的他匪。
都是很有可能的;甚至當(dāng)
時夸研,十次試驗仍有2%的幾率出現(xiàn)五次正面向上邦蜜。
可見,當(dāng)觀察到試驗結(jié)果時亥至,我們無法準(zhǔn)確判定的確切值悼沈,而只能對它的概率分布作出判斷贱迟。在上述例子中,我們傾向于認(rèn)為
的可能性較大絮供,而等于
的可能性較小衣吠。
定量描述“取值的可能性”需要引入似然性的概念。似然性表示參數(shù)為某個特定值的可能性壤靶,也等于對應(yīng)參數(shù)下樣本分布的概率缚俏,即
在本例中,十次試驗出現(xiàn)五次正面向上時贮乳,的似然函數(shù)即為
在
變化時忧换,似然函數(shù)的大小即代表
取值可能性的大小。
需要注意的是向拆,似然函數(shù)的值并不等于參數(shù)取到某值的確切概率亚茬,函數(shù)值大小關(guān)系僅反應(yīng)取對應(yīng)自變量的可能性大小關(guān)系。若要定量描述參數(shù)的概率分布及其取某一確切值的概率亲铡,需要對似然函數(shù)進(jìn)行歸一化處理得到其概率密度函數(shù)才写,即通過除以函數(shù)面積構(gòu)造新函數(shù)讓其在給定區(qū)間內(nèi)積分為1.因此,對一正函數(shù)
,在給定定義域內(nèi)作
,則
對于二項分布的似然函數(shù)作同樣處理奖蔓,則有
為表美觀赞草,我們令,則
至此,我們成功推導(dǎo)出了Beta分布的概率密度公式吆鹤。Beta分布描述的是厨疙,進(jìn)行伯努利試驗(拋硬幣),出現(xiàn)次正面疑务,
次反面時沾凄,正面向上的概率
的概率分布。當(dāng)我們沒有拋硬幣時知允,出現(xiàn)正面與反面向上的次數(shù)均為0撒蟀,此時可認(rèn)為硬幣正面向上的概率滿足
的分布,即均勻分布温鸽;其概率密度函數(shù)如圖
若拋了三次硬幣均為正面保屯,此時正面向上概率滿足
即有充分理由認(rèn)為正面向上概率靠近1
當(dāng)分別進(jìn)行10次試驗出現(xiàn)5正5反以及進(jìn)行1000次試驗出現(xiàn)500正500反時涤垫,正面向上概率分別滿足
顯然,
貝葉斯公式指出,后驗概率正比于為先驗概率×似然性镰惦。若后驗分布與先驗分布屬于同類迷守,則先驗分布與后驗分布被稱作共軛分布,該先驗分布被稱為似然函數(shù)的共軛先驗旺入。
共軛先驗的概念必須基于似然函數(shù)進(jìn)行討論兑凿。在拋硬幣的例子中,我們通過對似然函數(shù)的歸一化得到了分布茵瘾,因此若將先驗分布也設(shè)為
分布礼华,對后驗分布的計算在代數(shù)上將十分簡便。除了二項分布-
分布外拗秘,正態(tài)分布-正態(tài)分布圣絮、泊松分布-
分布也是常見的共軛分布。