轉(zhuǎn)載前言
本科的時候?qū)O大似然估計這個名詞搞得云里霧里票腰,雖然會解題城看,但是總是不知道為何要這么做,生活中會遇到嗎杏慰?
今天看到一篇文章很好的解釋了極大似然估計這個名詞测柠,我放在下面炼鞠。看完這篇文章鹃愤,我覺得likelihood極大似然這個抽象的名詞不如翻譯成白話簇搅,最有可能估計完域。但是這到底是什么意思呢软吐。比如,我們?nèi)佑矌乓魉埃貜?fù)了N多次發(fā)現(xiàn)正反面的出現(xiàn)的概率并不是1:1凹耙,而是0.6:0.4,并不符合常識肠仪,在這種情況下肖抱,我們就會像 估計這個硬幣有問題吧,極有可能它的形狀或者其他原因?qū)е铝怂疵娉霈F(xiàn)的概率并不相等异旧,卻是0.6:0.4意述。這個估計就叫極大似然估計的結(jié)果,而我愿意稱之為極有可能估計吮蛹。當(dāng)然這是我們憑借直覺和常識的出的結(jié)論荤崇,而極大似然估計則是用數(shù)學(xué)證明了這個直覺上的結(jié)論,也就是用數(shù)學(xué)的方法找出最有可能的對硬幣正反面分布不均的一個解釋潮针。
以下全文轉(zhuǎn)載自知乎專欄术荤,大家可以去看看,https://zhuanlan.zhihu.com/p/36824006
1 引入
機器學(xué)習(xí)中每篷,經(jīng)常會遇到極大似然估計 (Maximum Likelihood Estimation, MLE) 這個名詞瓣戚,它的含義是什么?它能夠解決什么問題焦读?我們該如何理解并使用它子库?本篇就對此進行詳細(xì)的闡述和回答。
舉一個最簡單直觀的例子矗晃,假設(shè)投擲硬幣仑嗅,我們每次投擲的結(jié)果只有兩種:一正一反,古往今來喧兄,無數(shù)的實驗和直覺告訴我們无畔,投硬幣這件事情正反兩面的概率就是五五分,即正面概率 0.5吠冤,反面概率也是 0.5浑彰。
然而,我們怎么知道概率是 0.5 的呢拯辙?我們憑什么說就是 0.5郭变,不可以是 0.55 或者 0.48 呢颜价?因為有很多人做過這個實驗,投多次硬幣诉濒,比如投100次周伦,大體上正反兩面的次數(shù)總是都差不多,因此未荒,我們就 估計 這個事情(投擲為正面)發(fā)生的概率為 0.5专挪。
注意,上述的這個思維推理的過程很直覺化片排,我們?nèi)祟惡芏鄷r候?qū)δ臣虑榈呐袛嗥鋵嵕褪沁@樣:多次經(jīng)歷某件事情寨腔,比如買水果,我們每次都在看水果的外觀來判斷該水果是否新鮮可口率寡,久而久之迫卢,我們就會發(fā)現(xiàn),拍著清脆欲裂的西瓜有更大的概率會香甜可口冶共,這其實也就是機器學(xué)習(xí)的基本世界觀:從經(jīng)驗到規(guī)律乾蛤。那么換成計算機解決,就是 數(shù)據(jù) -> 規(guī)則 (Data -> Rule)捅僵。
2 極大似然估計的概念
說了這么多家卖,那么極大似然估計到底是什么呢?再來看看我們剛剛說的拋硬幣的例子命咐,其實我們并不知道一枚硬幣拋出之后正面朝上的客觀概率是多少篡九,因為畢竟我們不是上帝,但是我們還是很想知道這個概率的大小醋奠,我們唯一的手段就是榛臼,做實驗,從實驗結(jié)果的數(shù)據(jù)中發(fā)現(xiàn)這個事件其中的規(guī)律窜司。比如沛善,我們拋擲 100 次,發(fā)現(xiàn)正面有 52 次塞祈,反面有 48 次金刁。此時,這個結(jié)果就給我們判斷正面的概率提供了一種依據(jù)议薪,現(xiàn)在可能有很多人會立刻說:“我知道了尤蛮,根據(jù)這次實驗的結(jié)果,正面的概率應(yīng)該是 0.52 斯议!”說的沒錯产捞,這個論斷的思維過程就是概率理論中我們最常看到的一個詞 :“估計”哼御。
但是坯临,我們是如何估計的焊唬?直覺上,100 次中有 52 次正面看靠,因此我們估計正面概率為 0.52赶促,這似乎很簡單直觀。但是如果從純粹的數(shù)學(xué)理論角度去思考挟炬,我們應(yīng)當(dāng)給出一個完美的解釋鸥滨。為了能夠解釋好這種估計的方法,數(shù)學(xué)家提出了極大似然估計辟宗。
極大似然估計的哲學(xué)內(nèi)涵就是:我們對某個事件發(fā)生的概率未知爵赵,但我們做了一些實驗吝秕,有過一些對這個事件的經(jīng)歷(經(jīng)驗)泊脐,那么我們認(rèn)為,這個事件的概率應(yīng)該是能夠與我們做的實驗結(jié)果最吻合烁峭,當(dāng)然容客,前提是我們做的實驗次數(shù)應(yīng)當(dāng)足夠多。如果只做一次實驗约郁,顯然我們就會估計概率為 0 或 1 了缩挑。
3 計算
這部分圖片太多,轉(zhuǎn)載不方便鬓梅。供置。。就直接去看原文吧