L1鸽捻、L2正則化

正則化(Regularization)是機(jī)器學(xué)習(xí)中一種常用的技術(shù)呼巴,其主要目的是控制模型復(fù)雜度,減小過(guò)擬合御蒲。最基本的正則化方法是在原目標(biāo)(代價(jià))函數(shù) 中添加懲罰項(xiàng)衣赶,對(duì)復(fù)雜度高的模型進(jìn)行“懲罰”。其數(shù)學(xué)表達(dá)形式為:
L(w;X;y) = L'(w;X;y) + \alpha \Omega(w)
其中厚满,X, y為訓(xùn)練樣本以及標(biāo)簽屑埋,L()為目標(biāo)函數(shù),w為權(quán)重系數(shù)向量痰滋,\Omega(w)為懲罰項(xiàng)摘能,\alpha為懲罰因子。不同的\Omega(w)對(duì)權(quán)重w的最優(yōu)解有不同的偏好敲街,因而會(huì)產(chǎn)生不同的正則化效果团搞。最常用的是l_1范數(shù)和l_2范數(shù),相應(yīng)稱之為l_1正則和l_2正則多艇。

l1: \Omega(w) = ||w||_1 = \sum_i {|w_i|}
l2: \Omega(w) = ||w||_2 = \sum_i {w_i^2}

1. 為什么L1逻恐、L2正則化可以防止過(guò)擬合?

深入理解L1峻黍、L2正則化從帶約束條件的優(yōu)化求解和最大后驗(yàn)概率兩種思路對(duì)L1复隆、L2正則化給出了分析。本文從只說(shuō)下帶約束條件的優(yōu)化求解(因?yàn)槟壳拔抑荒芾斫膺@種思路姆涩。挽拂。。)
我們知道骨饿,模型的復(fù)雜度可用VC維來(lái)衡量亏栈。通常情況下,模型VC維與系數(shù)w的個(gè)數(shù)成線性關(guān)系:即w數(shù)量越多宏赘,VC維越大绒北,模型越復(fù)雜。因此察署,為了限制模型的復(fù)雜度闷游,很自然的思路是減少系數(shù)w的個(gè)數(shù),即讓w向量中一些元素為0或者說(shuō)限制w中非零元素的個(gè)數(shù)。為此脐往,我們可在原優(yōu)化問(wèn)題中加入一個(gè)約束條件:
\min_w J(w; X,y) s.t. ||w||_0 <= C
||w||_0范數(shù)表示向量中非零元素的個(gè)數(shù)俱济。但由于該問(wèn)題是一個(gè)NP問(wèn)題,不易求解钙勃,為此我們需要稍微“放松”一下約束條件蛛碌。為了達(dá)到近似效果,我們不嚴(yán)格要求某些權(quán)重w為0辖源,而是要求權(quán)重w應(yīng)接近于0蔚携,即盡量小。從而可用l_1范數(shù)和l_2范數(shù)來(lái)近似l_0克饶,即:
\min_w J(w; X,y) s.t. ||w||_1 <= C
\min_w J(w; X,y) s.t. ||w||_2 <= C
利用拉格朗日算子法酝蜒,我們可將上述帶約束條件的最優(yōu)化問(wèn)題轉(zhuǎn)換為不帶約束項(xiàng)的優(yōu)化問(wèn)題,構(gòu)造拉格朗日函數(shù):
L(w,\alpha) = J(w; X,y) +\alpha(||w||_1 -C)
L(w,\alpha) = J(w; X,y) +\alpha(||w||^2_2 -C)

綜上所述矾湃,l_1正則和l_2正則是通過(guò)將某些w為0或者接近于0亡脑,降低模型復(fù)雜度,防止過(guò)擬合邀跃。

《深度學(xué)習(xí)》第7章
image.png

2. L1霉咨、L2正則化為什么可以將某些w為0或者接近于0?

當(dāng)w為1維的時(shí)候拍屑,l_1l_2的函數(shù)圖像如下:

y=|x|
y=x^2

l_1l_2途戒,w會(huì)向0的方向優(yōu)化;區(qū)別在于僵驰,l_1w=0將不會(huì)再變化喷斋,而l_2是接近于0但不會(huì)等于0(個(gè)人想法)。

公式推導(dǎo)

《深度學(xué)習(xí)》第七章(7.1--7.2)有公式推導(dǎo)蒜茴,有時(shí)間可以再好好看看星爪,初看沒(méi)看懂。

L2: w_i = \frac{H_{i,i}}{H_{i,i}+\alpha} w_i^*
L1: w_i = sign(w*) \max (|w_i^*| - \frac{\alpha}{H_{i,i}}, 0)

L2推導(dǎo)

L1推導(dǎo)

參考資料

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末顽腾,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子毡鉴,更是在濱河造成了極大的恐慌崔泵,老刑警劉巖秒赤,帶你破解...
    沈念sama閱讀 207,248評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件猪瞬,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡入篮,警方通過(guò)查閱死者的電腦和手機(jī)陈瘦,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,681評(píng)論 2 381
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)潮售,“玉大人痊项,你說(shuō)我怎么就攤上這事锅风。” “怎么了鞍泉?”我有些...
    開(kāi)封第一講書(shū)人閱讀 153,443評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵皱埠,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我咖驮,道長(zhǎng)边器,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 55,475評(píng)論 1 279
  • 正文 為了忘掉前任托修,我火速辦了婚禮忘巧,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘睦刃。我一直安慰自己砚嘴,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,458評(píng)論 5 374
  • 文/花漫 我一把揭開(kāi)白布涩拙。 她就那樣靜靜地躺著际长,像睡著了一般。 火紅的嫁衣襯著肌膚如雪兴泥。 梳的紋絲不亂的頭發(fā)上也颤,一...
    開(kāi)封第一講書(shū)人閱讀 49,185評(píng)論 1 284
  • 那天,我揣著相機(jī)與錄音郁轻,去河邊找鬼翅娶。 笑死,一個(gè)胖子當(dāng)著我的面吹牛好唯,可吹牛的內(nèi)容都是我干的竭沫。 我是一名探鬼主播,決...
    沈念sama閱讀 38,451評(píng)論 3 401
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼骑篙,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼蜕提!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起靶端,我...
    開(kāi)封第一講書(shū)人閱讀 37,112評(píng)論 0 261
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤谎势,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后杨名,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體脏榆,經(jīng)...
    沈念sama閱讀 43,609評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,083評(píng)論 2 325
  • 正文 我和宋清朗相戀三年台谍,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了须喂。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,163評(píng)論 1 334
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖坞生,靈堂內(nèi)的尸體忽然破棺而出仔役,到底是詐尸還是另有隱情,我是刑警寧澤是己,帶...
    沈念sama閱讀 33,803評(píng)論 4 323
  • 正文 年R本政府宣布又兵,位于F島的核電站,受9級(jí)特大地震影響卒废,放射性物質(zhì)發(fā)生泄漏寒波。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,357評(píng)論 3 307
  • 文/蒙蒙 一升熊、第九天 我趴在偏房一處隱蔽的房頂上張望俄烁。 院中可真熱鬧,春花似錦级野、人聲如沸页屠。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,357評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)辰企。三九已至,卻和暖如春况鸣,著一層夾襖步出監(jiān)牢的瞬間牢贸,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,590評(píng)論 1 261
  • 我被黑心中介騙來(lái)泰國(guó)打工镐捧, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留潜索,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,636評(píng)論 2 355
  • 正文 我出身青樓懂酱,卻偏偏與公主長(zhǎng)得像竹习,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子列牺,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,925評(píng)論 2 344

推薦閱讀更多精彩內(nèi)容

  • 過(guò)擬合 過(guò)擬合問(wèn)題在機(jī)器學(xué)習(xí)中是一個(gè)經(jīng)常遇到的問(wèn)題,所謂過(guò)擬合九默,即模型過(guò)度地?cái)M合了訓(xùn)練數(shù)據(jù)震放,從而導(dǎo)致模型在訓(xùn)練數(shù)據(jù)...
    Jarkata閱讀 2,974評(píng)論 0 1
  • 正則化是一種回歸的形式澜搅,它將系數(shù)估計(jì)(coefficient estimate)朝零的方向進(jìn)行約束伍俘、調(diào)整或縮小邪锌。也...
    suwi閱讀 56,954評(píng)論 0 20
  • 文章內(nèi)容來(lái)源:CSDN 需要正則化的原因: 監(jiān)督機(jī)器學(xué)習(xí)問(wèn)題無(wú)非就是“minimize your error wh...
    Even_Wang閱讀 1,471評(píng)論 0 1
  • 本期作業(yè)主要涉及深度學(xué)習(xí)中的幾個(gè)技巧:L1, L2正則化以及dropout觅丰。 1. L1, L2正則化 1.1 正...
    小新_XX閱讀 3,597評(píng)論 0 0
  • 機(jī)器學(xué)習(xí)監(jiān)督算法的基本思路是 讓擬合的模型盡量接近真實(shí)數(shù)據(jù)饵溅, 換句更通俗的話, 要讓我們的模型盡量簡(jiǎn)單又能很好的反...
    wujustin閱讀 26,350評(píng)論 2 33