機(jī)器學(xué)習(xí):L1與L2正則化項(xiàng)

題目

關(guān)于支持向量機(jī)SVM,下列說法錯(cuò)誤的是()

A. L2正則項(xiàng)隐孽,作用是最大化分類間隔是晨,使得分類器擁有更強(qiáng)的泛化能力

B. Hinge 損失函數(shù)婚夫,作用是最小化經(jīng)驗(yàn)分類錯(cuò)誤

C. 分類間隔為1/||w||,||w||代表向量的模

D. 當(dāng)參數(shù)C越小時(shí)署鸡,分類間隔越大,分類錯(cuò)誤越多限嫌,趨于欠學(xué)習(xí)(錯(cuò)誤)

在Logistic Regression 中,如果同時(shí)加入L1和L2范數(shù),會(huì)產(chǎn)生什么效果()

A. 可以做特征選擇,并在一定程度上防止過擬合

B. 能解決維度災(zāi)難問題

C. 能加快計(jì)算速度

D. 可以獲得更準(zhǔn)確的結(jié)果(正確答案)


L1正則化和L2正則化

正則化項(xiàng)即罰函數(shù)靴庆,該項(xiàng)對(duì)模型向量進(jìn)行“懲罰”,從而避免單純最小二乘問題的過擬合問題怒医。訓(xùn)練的目的是最小化目標(biāo)函數(shù)炉抒,則C越小,意味著懲罰越小稚叹,分類間隔也就越小焰薄,分類錯(cuò)誤也就越少。

正則化項(xiàng)本質(zhì)上是一種先驗(yàn)信息扒袖,整個(gè)最優(yōu)化問題從貝葉斯觀點(diǎn)來看是一種貝葉斯最大后驗(yàn)估計(jì)塞茅,其中正則化項(xiàng)對(duì)應(yīng)后驗(yàn)估計(jì)中的先驗(yàn)信息,損失函數(shù)對(duì)應(yīng)后驗(yàn)估計(jì)中的似然函數(shù)季率,兩者的乘積即對(duì)應(yīng)貝葉斯最大后驗(yàn)估計(jì)的形式野瘦,如果你將這個(gè)貝葉斯最大后驗(yàn)估計(jì)的形式取對(duì)數(shù),即進(jìn)行極大似然估計(jì)飒泻,你就會(huì)發(fā)現(xiàn)問題立馬變成了損失函數(shù)+正則化項(xiàng)的最優(yōu)化問題形式鞭光。

(1) 避免出現(xiàn)過擬合(over-fitting)。經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化 + 正則化項(xiàng) = 結(jié)構(gòu)風(fēng)險(xiǎn)最小化泞遗。

(2) 從模型求解上看惰许,正則化提供了一種唯一解的可能。光用最小二乘擬合可能出現(xiàn)無數(shù)組解史辙,加個(gè)L1或L2正則化項(xiàng)能有唯一解汹买。

**L1范數(shù)是指向量中各個(gè)元素絕對(duì)值之和,用于特征選擇; **

L2范數(shù) 是指向量各元素的平方和然后求平方根髓霞,用于 防止過擬合卦睹,提升模型的泛化能力

L1與L2區(qū)別:使用L1可以得到稀疏的權(quán)值;用L2可以得到平滑的權(quán)值

L1 regularization(往0方向靠)

在原始的代價(jià)函數(shù)后面加上一個(gè)L1正則化項(xiàng)方库,即所有權(quán)重w的絕對(duì)值的和结序,乘以λ/n(這里不像L2正則化項(xiàng)那樣,需要再乘以1/2纵潦,具體原因上面已經(jīng)說過徐鹤。)

(http://upload-images.jianshu.io/upload_images/12361572-d3e3bf93420c5072.jpg?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

同樣先計(jì)算導(dǎo)數(shù):

(http://upload-images.jianshu.io/upload_images/12361572-489f89af2b91addd.jpg?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

上式中sgn(w)表示w的符號(hào)垃环。那么權(quán)重w的更新規(guī)則為:

(http://upload-images.jianshu.io/upload_images/12361572-c06ceec2622a5a8c.jpg?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

比原始的更新規(guī)則多出了η * λ * sgn(w)/n這一項(xiàng)。當(dāng)w為正時(shí)返敬,更新后的w變小遂庄。當(dāng)w為負(fù)時(shí),更新后的w變大

因此它的效果就是讓w往0靠劲赠,使網(wǎng)絡(luò)中的權(quán)重盡可能為0涛目,也就相當(dāng)于減小了網(wǎng)絡(luò)復(fù)雜度,防止過擬合凛澎。

L2 regularization(權(quán)重衰減)

L2正則化就是在代價(jià)函數(shù)后面再加上一個(gè)正則化項(xiàng):

(http://upload-images.jianshu.io/upload_images/12361572-e37df8d9154d1c1b.jpg?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

C0代表原始的代價(jià)函數(shù)霹肝,后面那一項(xiàng)就是L2正則化項(xiàng),它是這樣來的:所有參數(shù)w的平方的和塑煎,除以訓(xùn)練集的樣本大小n沫换。λ就是正則項(xiàng)系數(shù),權(quán)衡正則項(xiàng)與C0項(xiàng)的比重最铁。另外還有一個(gè)系數(shù)1/2讯赏,1/2經(jīng)常會(huì)看到,主要是為了后面求導(dǎo)的結(jié)果方便冷尉,后面那一項(xiàng)求導(dǎo)會(huì)產(chǎn)生一個(gè)2漱挎,與1/2相乘剛好湊整。

L2正則化項(xiàng)是怎么避免overfitting的呢网严?我們推導(dǎo)一下看看识樱,先求導(dǎo):

(http://upload-images.jianshu.io/upload_images/12361572-2bf75547ac668384.jpg?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

可以發(fā)現(xiàn)L2正則化項(xiàng)對(duì)b的更新沒有影響,但是對(duì)于w的更新有影響.

(http://upload-images.jianshu.io/upload_images/12361572-731466c5b596e0ab.jpg?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末震束,一起剝皮案震驚了整個(gè)濱河市怜庸,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌垢村,老刑警劉巖割疾,帶你破解...
    沈念sama閱讀 218,204評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異嘉栓,居然都是意外死亡宏榕,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,091評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門侵佃,熙熙樓的掌柜王于貴愁眉苦臉地迎上來麻昼,“玉大人,你說我怎么就攤上這事馋辈「” “怎么了?”我有些...
    開封第一講書人閱讀 164,548評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)叉抡。 經(jīng)常有香客問我尔崔,道長(zhǎng),這世上最難降的妖魔是什么褥民? 我笑而不...
    開封第一講書人閱讀 58,657評(píng)論 1 293
  • 正文 為了忘掉前任季春,我火速辦了婚禮,結(jié)果婚禮上消返,老公的妹妹穿的比我還像新娘载弄。我一直安慰自己,他們只是感情好撵颊,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,689評(píng)論 6 392
  • 文/花漫 我一把揭開白布侦锯。 她就那樣靜靜地躺著,像睡著了一般秦驯。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上挣棕,一...
    開封第一講書人閱讀 51,554評(píng)論 1 305
  • 那天译隘,我揣著相機(jī)與錄音,去河邊找鬼洛心。 笑死固耘,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的词身。 我是一名探鬼主播厅目,決...
    沈念sama閱讀 40,302評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼法严!你這毒婦竟也來了损敷?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,216評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤深啤,失蹤者是張志新(化名)和其女友劉穎拗馒,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體溯街,經(jīng)...
    沈念sama閱讀 45,661評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡诱桂,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,851評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了呈昔。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片挥等。...
    茶點(diǎn)故事閱讀 39,977評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖堤尾,靈堂內(nèi)的尸體忽然破棺而出肝劲,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 35,697評(píng)論 5 347
  • 正文 年R本政府宣布涡相,位于F島的核電站哲泊,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏催蝗。R本人自食惡果不足惜切威,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,306評(píng)論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望丙号。 院中可真熱鬧先朦,春花似錦、人聲如沸犬缨。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,898評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽怀薛。三九已至刺彩,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間枝恋,已是汗流浹背创倔。 一陣腳步聲響...
    開封第一講書人閱讀 33,019評(píng)論 1 270
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留焚碌,地道東北人畦攘。 一個(gè)月前我還...
    沈念sama閱讀 48,138評(píng)論 3 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像十电,于是被迫代替她去往敵國(guó)和親知押。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,927評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容