機(jī)器學(xué)習(xí)基礎(chǔ)理論-1 正則化

為解決過擬合問題枚碗,加入正則化項(xiàng)或者規(guī)則項(xiàng),對(duì)模型的復(fù)雜程度進(jìn)行懲罰铸本,讓模型更加簡(jiǎn)單肮雨。


正則化

規(guī)則化函數(shù)Ω(w)通常可以選擇L1箱玷、L2范數(shù)怨规。

?λ 在這里我們稱做正則化參數(shù)。它是用來平衡擬合訓(xùn)練的目標(biāo)和保持參數(shù)值較小的目標(biāo)锡足。一方面我們想要訓(xùn)練的模型能更好地?cái)M合訓(xùn)練數(shù)據(jù)波丰,希望模型能夠很好的適應(yīng)訓(xùn)練集;另一方面是我們想要保持參數(shù)值較小舶得,模型較為簡(jiǎn)單掰烟。


規(guī)則項(xiàng)/正則化項(xiàng)

L0范數(shù):非零元素的個(gè)數(shù)。在實(shí)際應(yīng)用中沐批,由于L0范數(shù)本身不容易有一個(gè)好的數(shù)學(xué)表示形式纫骑,給出上面問題的形式化表示是一個(gè)很難的問題,所以在實(shí)際情況中九孩,L0的最優(yōu)問題會(huì)被放寬到L1或L2下的最優(yōu)化先馆。

L1范數(shù):非零元素的絕對(duì)值之和左敌,對(duì)應(yīng)的是常說的曼哈頓距離羽戒、最小絕對(duì)誤差等终蒂。線性回歸的L1范數(shù)正則化對(duì)應(yīng)的是Lasso回歸蜈垮。L1范數(shù)可以使得一些系數(shù)變小憎蛤,甚至還是一些絕對(duì)值較小的系數(shù)直接變?yōu)?库快,因此特別適用于參數(shù)數(shù)目縮減與參數(shù)的選擇产阱。

L2范數(shù):向量元素的平方和再開平方渠退,對(duì)應(yīng)的是常說的歐氏距離江解。線性回歸的L2范數(shù)正則化對(duì)應(yīng)的是Ridge回歸(嶺回歸设预。)Ridge回歸在不拋棄任何一個(gè)特征的情況下,縮小了回歸系數(shù)犁河,使得模型相對(duì)而言比較的穩(wěn)定鳖枕,但和Lasso回歸比魄梯,這會(huì)使得模型的特征留的特別多,模型解釋性差宾符。

總結(jié):

L1范數(shù)和L0范數(shù)可以實(shí)現(xiàn)稀疏酿秸,L1因具有比L0更好的優(yōu)化求解特性而被廣泛應(yīng)用。L1魏烫、L2都可以防止過擬合辣苏,只不過手段不同:L1是舍棄掉一些不重要的特征,L2是控制所有特征的權(quán)重哄褒。

之所以要實(shí)現(xiàn)稀疏稀蟋,是因?yàn)橐环矫嬉サ裟切]有較大影響的特征,起到特征選擇的作用呐赡;另一方面也是為了讓模型更加容易解釋退客。


另,正則化還可以解決特征數(shù)量大于樣本數(shù)量的問題链嘀。

如果你只有較少的樣本萌狂,導(dǎo)致特征數(shù)量大于樣本數(shù)量,那么矩陣 XTX 將是不可逆矩陣或奇異(singluar)矩陣怀泊,或者用另一種說法是這個(gè)矩陣是退化(degenerate)的粥脚,那么我們就沒有辦法使用正規(guī)方程來求出 θ 。

幸運(yùn)的是包个,正規(guī)化也為我們解決了這個(gè)問題刷允,具體的說只要正則參數(shù)是嚴(yán)格大于零,實(shí)際上碧囊,可以證明如下矩陣:

將是可逆的树灶。因此,使用正則還可以照顧任何 XTX 不可逆的問題糯而。




參考文獻(xiàn):

機(jī)器學(xué)習(xí)中的范數(shù)規(guī)則化

機(jī)器學(xué)習(xí)之正則化

機(jī)器學(xué)習(xí)中常常提到的正則化到底是什么意思天通? - 知乎

幾種范數(shù)的簡(jiǎn)單介紹 - CSDN博客

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市熄驼,隨后出現(xiàn)的幾起案子像寒,更是在濱河造成了極大的恐慌,老刑警劉巖瓜贾,帶你破解...
    沈念sama閱讀 218,546評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件诺祸,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡祭芦,警方通過查閱死者的電腦和手機(jī)筷笨,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,224評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人胃夏,你說我怎么就攤上這事轴或。” “怎么了仰禀?”我有些...
    開封第一講書人閱讀 164,911評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵照雁,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我答恶,道長(zhǎng)饺蚊,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,737評(píng)論 1 294
  • 正文 為了忘掉前任亥宿,我火速辦了婚禮卸勺,結(jié)果婚禮上砂沛,老公的妹妹穿的比我還像新娘烫扼。我一直安慰自己,他們只是感情好碍庵,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,753評(píng)論 6 392
  • 文/花漫 我一把揭開白布映企。 她就那樣靜靜地躺著,像睡著了一般静浴。 火紅的嫁衣襯著肌膚如雪堰氓。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,598評(píng)論 1 305
  • 那天苹享,我揣著相機(jī)與錄音双絮,去河邊找鬼。 笑死得问,一個(gè)胖子當(dāng)著我的面吹牛囤攀,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播宫纬,決...
    沈念sama閱讀 40,338評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼焚挠,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了漓骚?” 一聲冷哼從身側(cè)響起蝌衔,我...
    開封第一講書人閱讀 39,249評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎蝌蹂,沒想到半個(gè)月后噩斟,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,696評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡孤个,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,888評(píng)論 3 336
  • 正文 我和宋清朗相戀三年亩冬,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,013評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡硅急,死狀恐怖覆享,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情营袜,我是刑警寧澤撒顿,帶...
    沈念sama閱讀 35,731評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站荚板,受9級(jí)特大地震影響凤壁,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜跪另,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,348評(píng)論 3 330
  • 文/蒙蒙 一拧抖、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧免绿,春花似錦唧席、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,929評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至辽故,卻和暖如春徒仓,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背誊垢。 一陣腳步聲響...
    開封第一講書人閱讀 33,048評(píng)論 1 270
  • 我被黑心中介騙來泰國(guó)打工掉弛, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人喂走。 一個(gè)月前我還...
    沈念sama閱讀 48,203評(píng)論 3 370
  • 正文 我出身青樓殃饿,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親缴啡。 傳聞我的和親對(duì)象是個(gè)殘疾皇子壁晒,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,960評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容