嗯,今天在看《機(jī)器學(xué)習(xí)實(shí)戰(zhàn)》的Logistic回歸部分牡整,代碼實(shí)現(xiàn)看的一頭霧水粉铐,原理也不太懂疼约,各種查資料,其中有個關(guān)鍵的部分需要似然函數(shù)的相關(guān)知識蝙泼,無奈大學(xué)時候這部分就沒學(xué)懂過程剥,幸虧在一篇博客(kevinGao - 博客園)上找到了講的非常不錯的文章,雖然好像也是轉(zhuǎn)載自維基百科。那么就友情借鑒一下其內(nèi)容好了织鲸,真的一下就看懂了舔腾。
在數(shù)理統(tǒng)計學(xué)中,似然函數(shù)是一種關(guān)于統(tǒng)計模型中的參數(shù)的函數(shù)搂擦,表示模型參數(shù)中的似然性稳诚。
似然函數(shù)在統(tǒng)計推斷中有重大作用,如在最大似然估計和費(fèi)雪信息之中的應(yīng)用等等瀑踢“饣梗“似然性”與“或然性”或“概率”意思相近,都是指某種事件發(fā)生的可能性橱夭,但是在統(tǒng)計學(xué)中氨距,“似然性”和“或然性”或“概率”又有明確的區(qū)分。
概率用于在已知一些參數(shù)的情況下棘劣,預(yù)測接下來的觀測所得到的結(jié)果俏让,而
似然性 則是用于在已知某些觀測所得到的結(jié)果時,對有關(guān)事物的性質(zhì)的參數(shù)進(jìn)行估計茬暇。
在這種意義上首昔,似然函數(shù)可以理解為條件概率的逆反。
在已知某個參數(shù)B時糙俗,事件A會發(fā)生的概率寫作
勒奇。
利用貝葉斯定理,
因此臼节,我們可以反過來構(gòu)造表示似然性的方法:已知有事件A發(fā)生撬陵,運(yùn)用似然函數(shù)
,我們估計參數(shù)B的可能性网缝。
形式上巨税,似然函數(shù)也是一種條件概率函數(shù),但我們關(guān)注的變量改變了:
注意到這里并不要求似然函數(shù)滿足歸一性:
粉臊。一個似然函數(shù)乘以一個正的常數(shù)之后仍然是似然函數(shù)草添。對所有α > 0,都可以有似然函數(shù):
例子:
考慮投擲一枚硬幣的實(shí)驗(yàn)扼仲。通常來說远寸,已知投出的硬幣正面朝上和反面朝上的概率各自是pH= 0.5,便可以知道投擲若干次后出現(xiàn)各種結(jié)果的可能性屠凶。比如說驰后,投兩次都是正面朝上的概率是0.25。用條件概率表示矗愧,就是:
其中H表示正面朝上灶芝。
在統(tǒng)計學(xué)中,我們關(guān)心的是在已知一系列投擲的結(jié)果時,關(guān)于硬幣投擲時正面朝上的可能性的信息夜涕。我們可以建立一個統(tǒng)計模型:假設(shè)硬幣投出時會有pH的概率正面朝上犯犁,而有1 ?pH的概率反面朝上。這時女器,條件概率可以改寫成似然函數(shù):
也就是說酸役,對于取定的似然函數(shù),在觀測到兩次投擲都是正面朝上時驾胆,pH= 0.5的似然性是0.25(這并不表示當(dāng)觀測到兩次正面朝上時pH= 0.5的概率是0.25)涣澡。
如果考慮pH= 0.6,那么似然函數(shù)的值也會改變丧诺。
注意到似然函數(shù)的值變大了暑塑。這說明,如果參數(shù)pH的取值變成0.6的話锅必,結(jié)果觀測到連續(xù)兩次正面朝上的概率要比假設(shè)pH= 0.5時更大。也就是說惕艳,參數(shù)pH取成0.6 要比取成0.5 更有說服力搞隐,更為“合理”≡短拢總之劣纲,似然函數(shù)的重要性不是它的具體取值,而是當(dāng)參數(shù)變化時函數(shù)到底變小還是變大谁鳍。對同一個似然函數(shù)癞季,如果存在一個參數(shù)值,使得它的函數(shù)值達(dá)到最大的話倘潜,那么這個值就是最為“合理”的參數(shù)值绷柒。
在這個例子中,似然函數(shù)實(shí)際上等于:
涮因, 其中
废睦。
如果取pH= 1,那么似然函數(shù)達(dá)到最大值1养泡。也就是說嗜湃,當(dāng)連續(xù)觀測到兩次正面朝上時,假設(shè)硬幣投擲時正面朝上的概率為1是最合理的澜掩。
類似地购披,如果觀測到的是三次投擲硬幣,頭兩次正面朝上肩榕,第三次反面朝上刚陡,那么似然函數(shù)將會是:
, 其中T表示反面朝上,
橘荠。
這時候屿附,似然函數(shù)的最大值將會在
的時候取到。也就是說哥童,當(dāng)觀測到三次投擲中前兩次正面朝上而后一次反面朝上時挺份,估計硬幣投擲時正面朝上的概率
是最合理的。