深入淺出最大似然估計(jì)(Maximum Likelihood Estimation)

最大似然估計(jì)是利用已知的樣本的結(jié)果,在使用某個(gè)模型的基礎(chǔ)上古劲,反推最有可能導(dǎo)致這樣結(jié)果的模型參數(shù)值斥赋。

深入淺出最大似然估計(jì)

例子1:抽球

舉個(gè)通俗的例子:假設(shè)一個(gè)袋子裝有白球與紅球,比例未知产艾,現(xiàn)在抽取10次(每次抽完都放回疤剑,保證事件獨(dú)立性),假設(shè)抽到了7次白球和3次紅球闷堡,在此數(shù)據(jù)樣本條件下隘膘,可以采用最大似然估計(jì)法求解袋子中白球的比例(最大似然估計(jì)是一種“模型已定,參數(shù)未知”的方法)杠览。當(dāng)然弯菊,這種數(shù)據(jù)情況下很明顯,白球的比例是70%踱阿,但如何通過理論的方法得到這個(gè)答案呢管钳?一些復(fù)雜的條件下钦铁,是很難通過直觀的方式獲得答案的,這時(shí)候理論分析就尤為重要了才漆,這也是學(xué)者們?yōu)楹我岢鲎畲笏迫还烙?jì)的原因牛曹。我們可以定義從袋子中抽取白球和紅球的概率如下:

x1為第一次采樣,x2為第二次采樣醇滥,f為模型, theta為模型參數(shù)

其中theta是未知的黎比,因此,我們定義似然L為:

L為似然的符號(hào)

兩邊取ln鸳玩,取ln是為了將右邊的乘號(hào)變?yōu)榧犹?hào)焰手,方便求導(dǎo)。

兩邊取ln的結(jié)果怀喉,左邊的通常稱之為對(duì)數(shù)似然。
這是平均對(duì)數(shù)似然

最大似然估計(jì)的過程船响,就是找一個(gè)合適的theta躬拢,使得平均對(duì)數(shù)似然的值為最大。因此见间,可以得到以下公式:

最大似然估計(jì)的公式

這里討論的是2次采樣的情況聊闯,當(dāng)然也可以拓展到多次采樣的情況:

最大似然估計(jì)的公式(n次采樣)

我們定義M為模型(也就是之前公式中的f),表示抽到白球的概率為theta米诉,而抽到紅球的概率為(1-theta)菱蔬,因此10次抽取抽到白球7次的概率可以表示為:

10次抽取抽到白球7次的概率

將其描述為平均似然可得:

10次抽取抽到白球7次的平均對(duì)數(shù)似然,抽球的情況比較簡(jiǎn)單史侣,可以直接用平均似然來求解

那么最大似然就是找到一個(gè)合適的theta拴泌,獲得最大的平均似然。因此我們可以對(duì)平均似然的公式對(duì)theta求導(dǎo)惊橱,并另導(dǎo)數(shù)為0蚪腐。

求導(dǎo)過程

由此可得,當(dāng)抽取白球的概率為0.7時(shí)税朴,最可能產(chǎn)生10次抽取抽到白球7次的事件回季。

例子2:正態(tài)分布

假如有一組采樣值(x1,...,xn),我們知道其服從正態(tài)分布正林,且標(biāo)準(zhǔn)差已知泡一。當(dāng)這個(gè)正態(tài)分布的期望為多少時(shí),產(chǎn)生這個(gè)采樣數(shù)據(jù)的概率為最大觅廓?

這個(gè)例子中正態(tài)分布就是模型M鼻忠,而期望就是前文提到的theta。

似然
正態(tài)分布的公式杈绸,當(dāng)?shù)谝粎?shù)(期望)為0粥烁,第二參數(shù)(方差)為1時(shí)贤笆,分布為標(biāo)準(zhǔn)正態(tài)分布
似然值
對(duì)上式求導(dǎo)可得


綜上所述,可得求解最大似然估計(jì)的一般過程為:

1. 寫出似然函數(shù)讨阻;

2. 如果無法直接求導(dǎo)的話芥永,對(duì)似然函數(shù)取對(duì)數(shù);

3. 求導(dǎo)數(shù) 钝吮;

4. 求解模型中參數(shù)的最優(yōu)值埋涧。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市奇瘦,隨后出現(xiàn)的幾起案子棘催,更是在濱河造成了極大的恐慌,老刑警劉巖耳标,帶你破解...
    沈念sama閱讀 211,042評(píng)論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件醇坝,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡次坡,警方通過查閱死者的電腦和手機(jī)呼猪,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,996評(píng)論 2 384
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來砸琅,“玉大人嘶摊,你說我怎么就攤上這事昂羡。” “怎么了?”我有些...
    開封第一講書人閱讀 156,674評(píng)論 0 345
  • 文/不壞的土叔 我叫張陵高帖,是天一觀的道長(zhǎng)砸烦。 經(jīng)常有香客問我搂擦,道長(zhǎng)崭孤,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,340評(píng)論 1 283
  • 正文 為了忘掉前任棕所,我火速辦了婚禮视粮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘橙凳。我一直安慰自己蕾殴,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,404評(píng)論 5 384
  • 文/花漫 我一把揭開白布岛啸。 她就那樣靜靜地躺著钓觉,像睡著了一般。 火紅的嫁衣襯著肌膚如雪坚踩。 梳的紋絲不亂的頭發(fā)上荡灾,一...
    開封第一講書人閱讀 49,749評(píng)論 1 289
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼批幌。 笑死础锐,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的荧缘。 我是一名探鬼主播皆警,決...
    沈念sama閱讀 38,902評(píng)論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼截粗!你這毒婦竟也來了信姓?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,662評(píng)論 0 266
  • 序言:老撾萬榮一對(duì)情侶失蹤绸罗,失蹤者是張志新(化名)和其女友劉穎意推,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體珊蟀,經(jīng)...
    沈念sama閱讀 44,110評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡菊值,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,451評(píng)論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了育灸。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片腻窒。...
    茶點(diǎn)故事閱讀 38,577評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖描扯,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情趟薄,我是刑警寧澤绽诚,帶...
    沈念sama閱讀 34,258評(píng)論 4 328
  • 正文 年R本政府宣布,位于F島的核電站杭煎,受9級(jí)特大地震影響恩够,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜羡铲,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,848評(píng)論 3 312
  • 文/蒙蒙 一蜂桶、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧也切,春花似錦扑媚、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,726評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至倒槐,卻和暖如春旬痹,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,952評(píng)論 1 264
  • 我被黑心中介騙來泰國(guó)打工两残, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留永毅,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,271評(píng)論 2 360
  • 正文 我出身青樓人弓,卻偏偏與公主長(zhǎng)得像沼死,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子票从,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,452評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容

  • 轉(zhuǎn)載 http://blog.csdn.net/zouxy09 EM算法是一種迭代算法漫雕,用于含有隱含變量的概率模型...
    Jlan閱讀 2,149評(píng)論 1 13
  • 轉(zhuǎn)載自最大似然估計(jì)(通俗易懂) 一、例子1 最大似然估計(jì)是建立在這樣的思想上:已知某個(gè)參數(shù)能使這個(gè)樣本出現(xiàn)的概率最...
    ShaderJoy閱讀 1,128評(píng)論 0 2
  • 前面的文章主要從理論的角度介紹了自然語言人機(jī)對(duì)話系統(tǒng)所可能涉及到的多個(gè)領(lǐng)域的經(jīng)典模型和基礎(chǔ)知識(shí)峰鄙。這篇文章浸间,甚至之后...
    我偏笑_NSNirvana閱讀 13,881評(píng)論 2 64
  • 本文轉(zhuǎn)自 劉未鵬的博客! 概率論只不過是把常識(shí)用數(shù)學(xué)公式表達(dá)了出來吟榴。 記得讀本科的時(shí)候魁蒜,最喜歡到城里的計(jì)算機(jī)書店里...
    Bioquan閱讀 4,520評(píng)論 1 29
  • 早上開心的事就是 睡醒的時(shí)候 看到你昨天晚上回我的 我來不及看到的內(nèi)容 ???
    雞腿飯先生閱讀 246評(píng)論 0 0