uniform機(jī)器學(xué)習(xí)極簡(jiǎn)入門(mén)1--極大似然法

大家好广凸,我是uniform典鸡,本人平時(shí)關(guān)注機(jī)器學(xué)習(xí)和深度學(xué)習(xí)相關(guān)的工作被廓,后續(xù)我將會(huì)不斷推出機(jī)器學(xué)習(xí)&深度學(xué)習(xí)的入門(mén)教程,力圖把各個(gè)公式結(jié)合在一起萝玷,給大家呈現(xiàn)不一樣的數(shù)學(xué)和統(tǒng)計(jì)嫁乘。最新的一些業(yè)界paper也會(huì)后續(xù)開(kāi)相應(yīng)的專(zhuān)欄來(lái)read昆婿,希望大家關(guān)注。

1 極大似然法的通俗理解

最大似然估計(jì)法(MLE:max likelihood estimation)其實(shí)就是希望通過(guò)樣本來(lái)估計(jì)總體的參數(shù)蜓斧。

已知一個(gè)袋子仓蛆,里面分別裝有兩種顏色的球(紅色和白色),我們有放回地從這個(gè)袋子抽取10次挎春,得到8個(gè)紅色球和2個(gè)白色球看疙,求解該袋子的紅色球的占比概率。

為了計(jì)算這個(gè)概率直奋,我們希望最合理的參數(shù)應(yīng)該是使得上述事件發(fā)生概率最大的參數(shù)能庆。

在參數(shù)估計(jì)的方法理論上,一直存在兩種學(xué)派

1 頻率派
2 貝葉斯學(xué)派

一般我們假設(shè):數(shù)據(jù)屬于獨(dú)立同分布

今天介紹的最大似然就是頻率學(xué)派的方法理論脚线,我們假設(shè)紅色球的概率為p搁胆,則白色球的概率為(1-p),上述描述的事件可以用如下概率表示:

L=p^8(1-p)^2

只需要求得上述式子使得L取最大值的p即可邮绿。
上述式子求解極值的方法一般是先取對(duì)數(shù)

logL=8*logp+2*log(1-p)

求導(dǎo)得到

\frac{\partial{logL}}{\partial{p}}=\frac{8}{p}+\frac{-2}{1-p}=0

p=\frac{4}{5}

2 極大似然法的一般式子

通過(guò)上述的例子渠旁,我們明白了極大似然法如何進(jìn)行參數(shù)估計(jì),我們用更加一般的式子表示如下:
\theta_{MLE}=argmaxP(D|\theta)

其中D表示數(shù)據(jù)集(即上述我們采樣的樣本)船逮,式子表示希望找到某個(gè)\theta使得P(D)概率最大顾腊。

上面我們提到了MLE屬于頻率學(xué)派的理論基礎(chǔ),然而對(duì)于貝葉斯學(xué)派傻唾,他們認(rèn)為參數(shù)\theta本身不是一個(gè)常量投慈,而是應(yīng)該也服從某個(gè)分布(即我們所說(shuō)的先驗(yàn)分布)承耿。我們先給式子如下:
P(\theta|D)=\frac{P(D|\theta)*P(\theta)}{\sum{P(D|\theta)*P(\theta)}}

\theta=argmaxP(\theta|D)=argmaxP(D|\theta)*P(\theta)

這個(gè)式子就是我們所說(shuō)的后驗(yàn)概率冠骄,我們目標(biāo)就是希望后驗(yàn)概率最大(MAP)。

我們做如下假設(shè)
L=P(D|\theta)*P(\theta)

logL=logP(D|\theta)+logP(\theta)

從擬合的角度來(lái)看加袋,最后一項(xiàng)logP(\theta)其實(shí)就是一個(gè)類(lèi)似正則化的作用凛辣。第一項(xiàng)是表示經(jīng)驗(yàn)損失。

3 更一般的例子

我們舉個(gè)后續(xù)文章會(huì)陸續(xù)用到的例子:

假設(shè)要估計(jì)某個(gè)學(xué)校男生女生的身高分布职烧,已知該校男生和女生的身高分別服從兩個(gè)參數(shù)不同的高斯分布扁誓,以男生抽樣為例子,我們從男生中抽樣得到n名學(xué)生的身高(x1, x2, x3, ...,xn)蚀之,請(qǐng)問(wèn)該校男生的身高分布蝗敢。

上述問(wèn)題用數(shù)學(xué)公式表示如下:
L=\prod_{i=1}^{n}{P(x_i)}

P(x_i)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x_i-\mu)^2}{2\sigma^2}}

根據(jù)MLE,我們的目標(biāo)依然是最大化L足删,由于連乘計(jì)算求導(dǎo)不方便寿谴,我們?nèi)?duì)數(shù)

logL=\sum_{i=1}^{n}logP(x_i) =\sum_{i=1}^{n}log(\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x_i-\mu)^2}{2\sigma^2}})

由于凸函數(shù)極值是導(dǎo)數(shù)為零的點(diǎn),所以求如下等式
\frac{\partial{logL}}{\partial{\mu}}=0

\frac{\partial{logL}}{\partial{\sigma}}=0

可以求得
\mu=\frac{1}{n}\sum_{i=1}^{n}{x_i}

\sigma^2=\frac{1}{n}\sum_{i=1}^{n}{(x_i-\mu)^2}

根據(jù)抽樣的x帶入上述式子可以求得估計(jì)的分布結(jié)果失受。

如果上述x是多維向量讶泰,那么上述參數(shù)估計(jì)可以推廣到高維(對(duì)應(yīng)的高斯分布也是高維高斯分布咏瑟,后續(xù)我們會(huì)舉更多高維例子)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市痪署,隨后出現(xiàn)的幾起案子码泞,更是在濱河造成了極大的恐慌,老刑警劉巖狼犯,帶你破解...
    沈念sama閱讀 212,454評(píng)論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件余寥,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡悯森,警方通過(guò)查閱死者的電腦和手機(jī)劈狐,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,553評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)呐馆,“玉大人肥缔,你說(shuō)我怎么就攤上這事⌒诶矗” “怎么了续膳?”我有些...
    開(kāi)封第一講書(shū)人閱讀 157,921評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)收班。 經(jīng)常有香客問(wèn)我坟岔,道長(zhǎng),這世上最難降的妖魔是什么摔桦? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 56,648評(píng)論 1 284
  • 正文 為了忘掉前任社付,我火速辦了婚禮,結(jié)果婚禮上邻耕,老公的妹妹穿的比我還像新娘鸥咖。我一直安慰自己,他們只是感情好兄世,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,770評(píng)論 6 386
  • 文/花漫 我一把揭開(kāi)白布啼辣。 她就那樣靜靜地躺著,像睡著了一般御滩。 火紅的嫁衣襯著肌膚如雪鸥拧。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 49,950評(píng)論 1 291
  • 那天削解,我揣著相機(jī)與錄音富弦,去河邊找鬼。 笑死氛驮,一個(gè)胖子當(dāng)著我的面吹牛腕柜,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 39,090評(píng)論 3 410
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼媳握,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼碱屁!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起蛾找,我...
    開(kāi)封第一講書(shū)人閱讀 37,817評(píng)論 0 268
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤娩脾,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后打毛,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體柿赊,經(jīng)...
    沈念sama閱讀 44,275評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,592評(píng)論 2 327
  • 正文 我和宋清朗相戀三年幻枉,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了碰声。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,724評(píng)論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡熬甫,死狀恐怖胰挑,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情椿肩,我是刑警寧澤瞻颂,帶...
    沈念sama閱讀 34,409評(píng)論 4 333
  • 正文 年R本政府宣布,位于F島的核電站郑象,受9級(jí)特大地震影響贡这,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜厂榛,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,052評(píng)論 3 316
  • 文/蒙蒙 一盖矫、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧击奶,春花似錦辈双、人聲如沸同木。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,815評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)豆励。三九已至,卻和暖如春哀卫,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,043評(píng)論 1 266
  • 我被黑心中介騙來(lái)泰國(guó)打工萄唇, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人术幔。 一個(gè)月前我還...
    沈念sama閱讀 46,503評(píng)論 2 361
  • 正文 我出身青樓另萤,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子四敞,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,627評(píng)論 2 350