SVM如何防止過擬合

SVM如何避免過擬合

過擬合(Overfitting)表現(xiàn)為在訓(xùn)練數(shù)據(jù)上模型的預(yù)測(cè)很準(zhǔn)阱高,在未知數(shù)據(jù)上預(yù)測(cè)很差。過擬合主要是因?yàn)橛?xùn)練數(shù)據(jù)中的異常點(diǎn),這些點(diǎn)嚴(yán)重偏離正常位置。我們知道宠哄,決定SVM最優(yōu)分類超平面的恰恰是那些占少數(shù)的支持向量巧骚,如果支持向量中碰巧存在異常點(diǎn)脊框,那么我們傻傻地讓SVM去擬合這樣的數(shù)據(jù)润樱,最后的超平面就不是最優(yōu)的。

如圖1所示爸舒,深紅色線表示我們希望訓(xùn)練得到的最優(yōu)分類超平面蟋字,黑色虛線表示由于過擬合得到的較差的分類面。這是由于藍(lán)色數(shù)據(jù)中有一個(gè)異常點(diǎn)扭勉,即圖中的那個(gè)黑圈藍(lán)點(diǎn)鹊奖,使得我們的SVM去將就配合它,導(dǎo)致最后得到的分類面(粗黑色虛線)不盡如人意涂炎。從間隔可以看出忠聚,黑色虛線兩邊的間隔要比紅色線兩邊的間隔要狹窄,也就是黑色虛線的分類效果比較差唱捣。


圖1 異常點(diǎn)導(dǎo)致SVM過擬合

解決過擬合的辦法是為SVM引入了松弛變量ξ(slack variable)两蟀,將SVM公式的約束條件改為:

從圖2可以看到,引入松弛變量使SVM能夠容忍異常點(diǎn)的存在震缭。為什么赂毯?因?yàn)橐胨沙谧兞亢螅悬c(diǎn)到超平面的距離約束不需要大于等于1了,而是大于0.8就行了(如果ξ=0.2的話)党涕,那么異常點(diǎn)就可以不是支持向量了烦感,它就作為一個(gè)普通的點(diǎn)存在,我們的支持向量和超平面都不會(huì)受到它的影響膛堤。


圖 2 松弛變量的作用


我們知道手趣,事物都有兩面性,對(duì)異常點(diǎn)太容忍會(huì)導(dǎo)致任意超平面都可以是“最優(yōu)”超平面骑祟,SVM就失去意義了。因此SVM公示中的目標(biāo)函數(shù)也需要相應(yīng)修改气笙,我們加上松弛變量的平方和次企,并求最小值潜圃。這樣就達(dá)到一個(gè)平衡:既希望松弛變量存在以解決異常點(diǎn)問題,又不希望松弛變量太大導(dǎo)致分類解決太差谭期。



SVM如何避免過擬合


最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市隧出,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌胀瞪,老刑警劉巖针余,帶你破解...
    沈念sama閱讀 218,122評(píng)論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件圆雁,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡帆谍,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,070評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門汛蝙,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人窖剑,你說我怎么就攤上這事跃脊】林ǎ” “怎么了?”我有些...
    開封第一講書人閱讀 164,491評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)绘雁。 經(jīng)常有香客問我橡疼,道長(zhǎng),這世上最難降的妖魔是什么庐舟? 我笑而不...
    開封第一講書人閱讀 58,636評(píng)論 1 293
  • 正文 為了忘掉前任欣除,我火速辦了婚禮,結(jié)果婚禮上挪略,老公的妹妹穿的比我還像新娘历帚。我一直安慰自己,他們只是感情好杠娱,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,676評(píng)論 6 392
  • 文/花漫 我一把揭開白布挽牢。 她就那樣靜靜地躺著,像睡著了一般摊求。 火紅的嫁衣襯著肌膚如雪禽拔。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,541評(píng)論 1 305
  • 那天室叉,我揣著相機(jī)與錄音睹栖,去河邊找鬼。 笑死茧痕,一個(gè)胖子當(dāng)著我的面吹牛野来,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播踪旷,決...
    沈念sama閱讀 40,292評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼梁只,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了埃脏?” 一聲冷哼從身側(cè)響起搪锣,我...
    開封第一講書人閱讀 39,211評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎彩掐,沒想到半個(gè)月后构舟,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,655評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡堵幽,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,846評(píng)論 3 336
  • 正文 我和宋清朗相戀三年狗超,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片朴下。...
    茶點(diǎn)故事閱讀 39,965評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡努咐,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出殴胧,到底是詐尸還是另有隱情渗稍,我是刑警寧澤佩迟,帶...
    沈念sama閱讀 35,684評(píng)論 5 347
  • 正文 年R本政府宣布,位于F島的核電站竿屹,受9級(jí)特大地震影響报强,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜拱燃,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,295評(píng)論 3 329
  • 文/蒙蒙 一秉溉、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧碗誉,春花似錦召嘶、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,894評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽碟绑。三九已至茎匠,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間诵冒,已是汗流浹背谊惭。 一陣腳步聲響...
    開封第一講書人閱讀 33,012評(píng)論 1 269
  • 我被黑心中介騙來泰國(guó)打工圈盔, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人驱敲。 一個(gè)月前我還...
    沈念sama閱讀 48,126評(píng)論 3 370
  • 正文 我出身青樓众眨,卻偏偏與公主長(zhǎng)得像握牧,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子沿腰,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,914評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • 注:題中所指的『機(jī)器學(xué)習(xí)』不包括『深度學(xué)習(xí)』颂龙。本篇文章以理論推導(dǎo)為主,不涉及代碼實(shí)現(xiàn)厘托。 前些日子定下了未來三年左右...
    我偏笑_NSNirvana閱讀 39,980評(píng)論 12 145
  • 機(jī)器學(xué)習(xí)是做NLP和計(jì)算機(jī)視覺這類應(yīng)用算法的基礎(chǔ)铅匹,雖然現(xiàn)在深度學(xué)習(xí)模型大行其道,但是懂一些傳統(tǒng)算法的原理和它們之間...
    在河之簡(jiǎn)閱讀 20,507評(píng)論 4 65
  • 最近的這段時(shí)間感悟良多流礁。上午在辦公室里,大家都在討論像我們這種小年輕罗丰,隨便打扮一下就特別漂亮特別顯嫩(我除外),說...
    瀟湘妃子ing閱讀 137評(píng)論 0 0
  • 臨摹找御,顏色有區(qū)別绍填,肉眼把握不了霎桅,不過畫完自我還是挺滿意滔驶。
    張鹿鹿閱讀 290評(píng)論 3 2
  • 今天洗澡的時(shí)候突然想到一個(gè)詞,就是硬通貨揭糕,那么今天就跟你說說,我希望你未來能夠成為未來世界的硬通貨著角。 首先要界定一...
    丁曉磊閱讀 719評(píng)論 0 3