極大似然估計

現(xiàn)實情況中我們可能會遇到這樣的一些例子磁奖,需要得到一所高校有車學(xué)生的分布情況(假定符合參數(shù)為p的伯努利分布),某地區(qū)成年男性的身高分布情況(假定符合參數(shù)為u1看幼,σ1的正態(tài)分布),南極洲成年帝企鵝的體重分布(假定符合參數(shù)為u2史辙,σ2的正態(tài)分布)等等。

由于時間和經(jīng)費的限制佩伤,不可能進行全面統(tǒng)計聊倔,我們只能通過一定的觀察,得到一系列的觀察值生巡,在上述假定概率分布模型上耙蔑,現(xiàn)在需要求出是哪個具體的概率分布生成了這些觀察值。要解決這個問題孤荣,就需要用到參數(shù)估計方法甸陌,即估計出上述的參數(shù)p,(u盐股,σ)钱豁,而最大似然估計就是這樣一種方法。

最大似然估計是一個在已知觀察結(jié)果(即樣本)和給定概率分布模型的基礎(chǔ)上遂庄,估計概率分布模型的參數(shù)寥院,并使得在該參數(shù)下,生成這個已知樣本的可能性最大的方法涛目。

舉第一個例子秸谢,設(shè)我們已經(jīng)獲得了一個樣本集{X1,X2,…,Xn},其中Xi=0表示選取的學(xué)生沒有車霹肝,Xi= 1表示選取的學(xué)生有車估蹄。 Xi服從概率為未知參數(shù)p的伯努利分布,那么根據(jù)伯努利分布的定義沫换,每個Xi的概率質(zhì)量函數(shù)為:

f(xi;p)=pxi(1?p)1?xi

其中Xi=0或1臭蚁。 首先,要通過極大似然估計方法求出參數(shù)p讯赏,需要定義似然函數(shù)垮兑。前面提到,最大似然估計就是去找參數(shù)估計值漱挎,使得已經(jīng)觀察到的樣本值發(fā)生概率最大系枪。既然這些樣本已經(jīng)實現(xiàn)了,其發(fā)生概率最大才符合邏輯磕谅。這就是求所有觀測值樣本的聯(lián)合概率最大化私爷。因此,似然函數(shù)在形式上膊夹,其實就是樣本的聯(lián)合概率衬浑。對連續(xù)型隨機變量和離散型隨機變量,樣本的似然函數(shù)分別是概率密度和概率質(zhì)量函數(shù)的連乘形式放刨。

對于本例工秩,似然函數(shù)為:

L(p)=∏i=1nf(xi;p)=px1(1?p)1?x1×px2(1?p)1?x2×...×pxn(1?p)1?xn

將上式化簡,我們得到:

L(p)=p∑xi(1?p)n?∑xi

在實際應(yīng)用中进统,為了求解方便拓诸,一般使用似然函數(shù)的對數(shù)。

ln(L(p))=ln(p∑xi(1?p)n?∑xi)=(∑xi)ln(p)+(n?∑xi)ln(1?p)

我們知道麻昼,對數(shù)函數(shù)是單調(diào)遞增的奠支。這意味著使得ln(L(p))獲得極大值的p也是使得L(p)獲得極大值的p。下圖為對數(shù)函數(shù)的圖像抚芦。

利用一元函數(shù)求極大值的方法倍谜,對上式兩邊求p的導(dǎo)數(shù),并令其等于0:

?ln(L(p))?p=∑xip?(n?∑xi)1?p≡0

兩邊乘以p(1-p)叉抡,得到:

(∑xi)(1?p)?(n?∑xi)p=0

化簡后:

∑xi?np=0

需要說明的是尔崔,這里的p實際上是我們估計的p,因此使用如下的符號:

p?=∑xin=∑ni=1xin

假設(shè)我們隨機觀察了30個學(xué)生的樣本褥民,樣本集為:

{0,0,0,0,0,1,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,1,0,0,1,0}

通過上述的極大似然估計方法季春,可以求出預(yù)估的參數(shù)為:

p?=∑ni=1xin=530=0.167

再來看另一個例子:

假定該高校男生的體重呈均值為μ,標準差為σ的正態(tài)分布消返。我們獲得了隨機采樣10個男學(xué)生的體重如下(單位:斤):

序號體重

1115

2122

3130

4127

5149

6160

7152

8138

9149

10180

正態(tài)分布的概率密度函數(shù)為:

f(xi;μ,σ2)=1σ2π ̄ ̄ ̄√exp[?(xi?μ)22σ2]

根據(jù)上面的定義载弄,似然函數(shù)是概率質(zhì)量函數(shù)(離散隨機變量)或概率密度函數(shù)(連續(xù)隨機變量)的乘積耘拇,因此:

L(μ,σ)=1σn(2π ̄ ̄ ̄√)nexp[?12σ2∑i=1n(xi?μ)2]

我們把上式的似然函數(shù)可以看作是參數(shù)θ1和θ2的函數(shù),其中:

θ1=μ,θ2=σ2

因此宇攻,似然函數(shù)可以改寫為:

L(θ1,θ2)=∏i=1nf(xi;θ1,θ2)=θ?n/22(2π)?n/2exp[?12θ2∑i=1n(xi?θ1)2]

而相應(yīng)的對數(shù)似然函數(shù)則為:

logL(θ1,θ2)=?n2logθ2?n2log(2π)?∑ni=1(xi?θ1)22θ2

這是一個關(guān)于θ1和θ2的二元函數(shù)惫叛,根據(jù)二元函數(shù)求極值的方法,先求θ1的偏導(dǎo)數(shù)(partial derivative)逞刷,然后設(shè)偏導(dǎo)數(shù)為0嘉涌。我們得到:

?logL(θ1,θ2)?θ1=?2∑ni=1(xi?θ1)2θ2=0

∑i=1n(xi?θ1)=0

∑i=1nxi?nθ1=0

由此我們得到參數(shù)θ1的極大似然估計是:

θ1^=μ?=∑ni=1xin=xˉ

現(xiàn)在對θ2求偏導(dǎo)數(shù)(partial derivative),然后設(shè)偏導(dǎo)數(shù)為0夸浅。我們得到:

?logL(θ1,θ2)?θ2=?n2θ2+∑ni=1(xi?θ1)22θ22=0

兩邊同時乘以2θ22:

?nθ2+∑i=1n(xi?θ1)2=0

由此得到參數(shù)θ2的極大似然估計是:

θ2^=σ?2=∑(xi?θ1)2n=∑(xi?xˉ)2n

概括起來仑最,我們已經(jīng)求出了均值μ和方差σ2的最大似然估計:

μ?=∑xin=xˉ,σ?2=∑(xi?xˉ)2n

你發(fā)現(xiàn)沒有,這實質(zhì)上就是教科書中均值和方差的計算公式帆喇!

最后我們根據(jù)樣本數(shù)據(jù)警医,計算μ和方差σ:

μ?=∑xin=142.2,σ?2=∑(xi?xˉ)2n=18.654

于是,我們得到求極大似然估計的一般步驟:

- 根據(jù)設(shè)定概率模型番枚,寫出聯(lián)合概率形式的似然函數(shù)

- 對似然函數(shù)取對數(shù)法严,并整理

- 求導(dǎo)數(shù)或偏導(dǎo)數(shù),并賦值為0

- 求解方程

最后葫笼,談?wù)劇八迫还烙嫛钡氖褂们疤幔?/p>

- 已經(jīng)假定了概率模型深啤,如二項分布,正態(tài)分布等路星;

- 已經(jīng)有了一些觀察結(jié)果的集合溯街。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市洋丐,隨后出現(xiàn)的幾起案子呈昔,更是在濱河造成了極大的恐慌,老刑警劉巖友绝,帶你破解...
    沈念sama閱讀 211,042評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件堤尾,死亡現(xiàn)場離奇詭異,居然都是意外死亡迁客,警方通過查閱死者的電腦和手機郭宝,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,996評論 2 384
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來掷漱,“玉大人粘室,你說我怎么就攤上這事〔贩叮” “怎么了衔统?”我有些...
    開封第一講書人閱讀 156,674評論 0 345
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經(jīng)常有香客問我锦爵,道長舱殿,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,340評論 1 283
  • 正文 為了忘掉前任棉浸,我火速辦了婚禮怀薛,結(jié)果婚禮上刺彩,老公的妹妹穿的比我還像新娘迷郑。我一直安慰自己,他們只是感情好创倔,可當我...
    茶點故事閱讀 65,404評論 5 384
  • 文/花漫 我一把揭開白布嗡害。 她就那樣靜靜地躺著,像睡著了一般畦攘。 火紅的嫁衣襯著肌膚如雪霸妹。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,749評論 1 289
  • 那天知押,我揣著相機與錄音叹螟,去河邊找鬼。 笑死台盯,一個胖子當著我的面吹牛罢绽,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播静盅,決...
    沈念sama閱讀 38,902評論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼良价,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了蒿叠?” 一聲冷哼從身側(cè)響起明垢,我...
    開封第一講書人閱讀 37,662評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎市咽,沒想到半個月后痊银,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,110評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡施绎,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,451評論 2 325
  • 正文 我和宋清朗相戀三年溯革,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片粘姜。...
    茶點故事閱讀 38,577評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡鬓照,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出孤紧,到底是詐尸還是另有隱情豺裆,我是刑警寧澤,帶...
    沈念sama閱讀 34,258評論 4 328
  • 正文 年R本政府宣布,位于F島的核電站臭猜,受9級特大地震影響躺酒,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜蔑歌,卻給世界環(huán)境...
    茶點故事閱讀 39,848評論 3 312
  • 文/蒙蒙 一羹应、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧次屠,春花似錦园匹、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,726評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至本昏,卻和暖如春供汛,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背涌穆。 一陣腳步聲響...
    開封第一講書人閱讀 31,952評論 1 264
  • 我被黑心中介騙來泰國打工怔昨, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人宿稀。 一個月前我還...
    沈念sama閱讀 46,271評論 2 360
  • 正文 我出身青樓趁舀,卻偏偏與公主長得像,于是被迫代替她去往敵國和親原叮。 傳聞我的和親對象是個殘疾皇子赫编,可洞房花燭夜當晚...
    茶點故事閱讀 43,452評論 2 348

推薦閱讀更多精彩內(nèi)容

  • 極大似然估計是一種參數(shù)估計的方法。先驗概率是 知因求果奋隶,后驗概率是 知果求因擂送,極大似然是 知果求最可能的原因。即它...
    不會停的蝸牛閱讀 9,371評論 1 23
  • 極大似然估計和貝葉斯估計是兩種估計模型參數(shù)的方法唯欣。分別代表了兩種學(xué)派的思想嘹吨。 極大似然估計是概率學(xué)派的觀點,其認為...
    codeman_liu閱讀 738評論 0 0
  • 〇境氢、說明 極大似然估計(Maximum Likelihood Estimation,MLE)蟀拷,也稱最大似然估計。統(tǒng)...
    Herbert002閱讀 4,121評論 0 5
  • 【概述】 SVM訓(xùn)練分類器的方法是尋找到超平面萍聊,使正負樣本在超平面的兩側(cè)(分類正確性即“分得開”)问芬,且樣本到超平面...
    sealaes閱讀 11,042評論 0 7
  • 前些日子和朋友說起現(xiàn)在的95后也開始闖蕩社會了此衅,時間都TM去哪兒了强戴?!是啊挡鞍,95后的領(lǐng)軍人物也都是2字打頭的年齡了...
    Redfever閱讀 391評論 2 2