從貝葉斯角度看L1及L2正則化

首先寫一下為什么會寫這個吧精算,之前在看linUCB的一篇博客的時候,看到了這么一段話:

納尼!嶺回歸還可以從貝葉斯角度來得到呢崇猫!頓時覺得自己知識面太窄诅福,暴露了自己渣渣的本質(zhì)匾委。既然知識面窄,那就廢話不多說氓润,惡補一波吧赂乐!本文涉及到的內(nèi)容可能有點多,不過只要你能從頭到尾讀下來咖气,相信你一定能夠有所收獲挨措!

本文涉及的知識點有:
頻率派和貝葉斯學(xué)派
概率和似然
拉普拉斯分布和正態(tài)分布
極大似然方法求線性回歸
貝葉斯角度看L1和L2正則化

1、頻率派和貝葉斯學(xué)派

頻率派
頻率派認為需要將推斷的參數(shù)θ視作未知的定值崩溪,而樣本X是隨機的浅役,其著眼點在樣本空間,有關(guān)的概率計算都是針對X的分布伶唯。頻率學(xué)派認為參數(shù)雖然我們不知道觉既,但是它是固定的,我們要通過隨機產(chǎn)生的樣本去估計這個參數(shù)抵怎,所以才有了最大似然估計這些方法奋救。

貝葉斯派
貝葉斯派把參數(shù)θ也視作滿足某一個分布的隨機變量,而樣本X是固定的反惕,其著眼點在參數(shù)空間尝艘,重視參數(shù)θ的分布,固定的操作模式是通過參數(shù)的先驗分布結(jié)合樣本信息得到參數(shù)的后驗分布姿染。

貝葉斯學(xué)派強調(diào)人的先驗的作用背亥,即人以往認知的作用。并且通過不斷增添新的知識悬赏,來更新以往的認知狡汉。 舉個例子來說:有一個袋子里面裝了紅球和黑球,在試驗之前闽颇,我們已知這個袋子里面是5黑5紅的概率是0.8盾戴,是10黑5紅的概率是0.2,這個概率分布稱為先驗概率兵多。之后觀察者開始新的觀測或?qū)嶒灒ㄓ蟹呕爻槿?00次尖啡,得到80次黑的橄仆,20次紅的)。經(jīng)過中間的獨立重復(fù)試驗衅斩,觀察者獲得了一些新的觀測結(jié)果盆顾,這些新的觀測將以含有不確定性的邏輯推斷的方式影響觀察者原有的認識,即觀測者一開始認為袋子里是5黑5紅的可能性更大畏梆,但是經(jīng)過了上面的事實之后您宪,修正了原有的認識,認為是10黑5紅可能性更大奠涌,此時的概率稱為后驗概率宪巨。

2、概率和似然

在我們繼續(xù)進行下去之前铣猩,我們先來弄清楚兩個概念:似然(likelihood)和概率(probability)揖铜。兩者都是對可能性的表示。概率是在給定了一定參數(shù)值后达皿,表示了一件事物發(fā)生的可能性;而似然則反其道而行之贿肩,是在給定了一系列結(jié)果后峦椰,表示了某一組參數(shù)值的可能性。那么最大似然估計的思想汰规,就是在給定了一組結(jié)果后哪一組參數(shù)的可能性最大汤功;反過來說,就是使用這樣一組參數(shù)溜哮,出現(xiàn)給定結(jié)果的可能性最大滔金。

3、拉普拉斯分布和正態(tài)分布

拉普拉斯分布
拉普拉斯分布的概率密度函數(shù)為:

其中茂嗓,u為位置參數(shù)餐茵,b>0是尺度參數(shù)。與正態(tài)分布相比述吸,正態(tài)分布是用相對于u平均值的差的平方來表示忿族,而拉普拉斯概率密度用相對于差的絕對值來表示。因此蝌矛,拉普拉斯的尾部比正態(tài)分布更加平坦道批。拉普拉斯分布的圖像如下圖所示:

正態(tài)分布
想必大家對正態(tài)分布已經(jīng)很熟悉了,因此這里我只做一個簡單的介紹入撒,正態(tài)分布又稱為高斯分布隆豹,其概率密度函數(shù)如下圖:

正態(tài)分布的圖像如下圖:

4、極大似然法求線性回歸

4.1 線性回歸回顧

4.2 從極大似然法求解線性回歸

可以看到茅逮,第一項與Θ無關(guān)而且是常數(shù)璃赡,我們不用考慮簿煌,因此想要使上面的式子最大化,我們只需要下面的式子最小化即可鉴吹,后面的操作就是導(dǎo)數(shù)為0啦姨伟。因此我們就用極大似然法求解了多元線性回歸。

5豆励、貝葉斯角度看L1和L2

兜兜轉(zhuǎn)轉(zhuǎn)這么多夺荒,終于到了我們的正題了,打起精神來良蒸,革命尚未成功技扼,各位還需努力!

前面提到了嫩痰,貝葉斯派認為我們要求解的參數(shù)是一個隨機變量剿吻,服從一個概率分布,問題求解變成了在樣本已知的情況下串纺,后驗概率最大化丽旅,即參數(shù)Θ最可能的取值,即:

因此上面的式子就變成了:

與上面的方法相比纺棺,我們要求解的式子只是多了一個P(Θ)榄笙,即參數(shù)Θ的先驗概率分布。

上面的式子可以進一步的化簡:

對于第一部分祷蝌,我們根據(jù)剛才利用極大似然求解多元線性回歸的思路:

對于第二部分茅撞,根據(jù)參數(shù)Θ的先驗概率分布的不同,我們有以下兩種情況:

5.1 先驗是正態(tài)分布

可以看到巨朦,如果參數(shù)Θ的先驗概率分布是正態(tài)分布的話米丘,我們可以得到類似于加入L2正則化的多元線性回歸的損失函數(shù)。

5.2 先驗是拉普拉斯分布

可以看到糊啡,如果參數(shù)Θ的先驗概率分布是拉普拉斯分布的話拄查,我們可以得到類似于加入L1正則化的多元線性回歸的損失函數(shù)。

6悔橄、延伸閱讀-參數(shù)的均值和方差

我們這里來求解一下當Θ的先驗概率分布是正態(tài)分布時靶累,Θ后驗概率分布的均值方差。

6.1 均值

參數(shù)的均值即使損失函數(shù)最小的Θ的值:

6.2 方差

方差即中間的一項:

這塊還沒有搞懂癣疟。挣柬。。歡迎大佬們留言睛挚!

參考文章

https://blog.csdn.net/haolexiao/article/details/70243292
https://blog.csdn.net/Cerisier/article/details/78016486

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末邪蛔,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子扎狱,更是在濱河造成了極大的恐慌侧到,老刑警劉巖勃教,帶你破解...
    沈念sama閱讀 221,198評論 6 514
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異匠抗,居然都是意外死亡故源,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,334評論 3 398
  • 文/潘曉璐 我一進店門汞贸,熙熙樓的掌柜王于貴愁眉苦臉地迎上來绳军,“玉大人,你說我怎么就攤上這事矢腻∶偶荩” “怎么了?”我有些...
    開封第一講書人閱讀 167,643評論 0 360
  • 文/不壞的土叔 我叫張陵多柑,是天一觀的道長奶是。 經(jīng)常有香客問我,道長竣灌,這世上最難降的妖魔是什么聂沙? 我笑而不...
    開封第一講書人閱讀 59,495評論 1 296
  • 正文 為了忘掉前任,我火速辦了婚禮帐偎,結(jié)果婚禮上逐纬,老公的妹妹穿的比我還像新娘。我一直安慰自己削樊,他們只是感情好,可當我...
    茶點故事閱讀 68,502評論 6 397
  • 文/花漫 我一把揭開白布兔毒。 她就那樣靜靜地躺著漫贞,像睡著了一般。 火紅的嫁衣襯著肌膚如雪育叁。 梳的紋絲不亂的頭發(fā)上迅脐,一...
    開封第一講書人閱讀 52,156評論 1 308
  • 那天,我揣著相機與錄音豪嗽,去河邊找鬼谴蔑。 笑死,一個胖子當著我的面吹牛龟梦,可吹牛的內(nèi)容都是我干的隐锭。 我是一名探鬼主播,決...
    沈念sama閱讀 40,743評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼计贰,長吁一口氣:“原來是場噩夢啊……” “哼钦睡!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起躁倒,我...
    開封第一講書人閱讀 39,659評論 0 276
  • 序言:老撾萬榮一對情侶失蹤荞怒,失蹤者是張志新(化名)和其女友劉穎洒琢,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體褐桌,經(jīng)...
    沈念sama閱讀 46,200評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡衰抑,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,282評論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了荧嵌。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片呛踊。...
    茶點故事閱讀 40,424評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖完丽,靈堂內(nèi)的尸體忽然破棺而出恋技,到底是詐尸還是另有隱情,我是刑警寧澤逻族,帶...
    沈念sama閱讀 36,107評論 5 349
  • 正文 年R本政府宣布蜻底,位于F島的核電站,受9級特大地震影響聘鳞,放射性物質(zhì)發(fā)生泄漏薄辅。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,789評論 3 333
  • 文/蒙蒙 一抠璃、第九天 我趴在偏房一處隱蔽的房頂上張望站楚。 院中可真熱鬧,春花似錦搏嗡、人聲如沸窿春。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,264評論 0 23
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽旧乞。三九已至,卻和暖如春磅氨,著一層夾襖步出監(jiān)牢的瞬間尺栖,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,390評論 1 271
  • 我被黑心中介騙來泰國打工烦租, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留延赌,地道東北人。 一個月前我還...
    沈念sama閱讀 48,798評論 3 376
  • 正文 我出身青樓叉橱,卻偏偏與公主長得像挫以,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子赏迟,可洞房花燭夜當晚...
    茶點故事閱讀 45,435評論 2 359

推薦閱讀更多精彩內(nèi)容