機(jī)器學(xué)習(xí):支持向量機(jī)4

本文來自同步博客审磁。

P.S. 不知道簡書怎么顯示數(shù)學(xué)公式以及更好的排版內(nèi)容谈飒。所以如果覺得文章下面格式亂的話請自行跳轉(zhuǎn)到上述鏈接。后續(xù)我將不再對(duì)數(shù)學(xué)公式進(jìn)行截圖态蒂,畢竟行內(nèi)公式截圖的話排版會(huì)很亂杭措。看原博客地址會(huì)有更好的體驗(yàn)钾恢。

前面介紹的SVM手素,無論是線性可分還是非線性可分,稱為Hard Margin SVM瘩蚪,都要求對(duì)輸入數(shù)據(jù)進(jìn)行精確劃分泉懦。我們不難想到這類SVM存在過擬合這個(gè)問題。如果輸入數(shù)據(jù)本身就存在誤差疹瘦,精確劃分反而是沒意義的崩哩。本篇文章就如何處理過擬合問題,介紹即所謂的Soft Margin SVM言沐。

數(shù)學(xué)推導(dǎo)

引入衡量誤差的變量 -\xi\_i-邓嘹。-\xi\_i-表示不能被正確分類的樣本點(diǎn)距離正確一側(cè)邊界的距離,距離越大表示錯(cuò)誤越大呢灶,即-\xi\_i-越大吴超。如果樣本點(diǎn)能被正確分類,則-\xi\_i = 0-鸯乃。故有-\xi\_i \ge 0-鲸阻。

那么,原來能通過求解函數(shù)-\frac{1}{2}\vec{w}^{2}-在最小化下的參數(shù)-\vec{\alpha}-缨睡,如今需要增加能夠體現(xiàn)誤差的約束條件再求解鸟悴。

可以如下構(gòu)造函數(shù)來描述誤差:
\frac{1}{2}\vec{w}^{2} + C\sum_{i}^{n}{\xi\_i}

這個(gè)函數(shù)把所有輸入數(shù)據(jù)的誤差疊加在一起,即-\sum_{i}^{n}{\xi\_i}-奖年。然后用參數(shù)C來控制所有誤差的權(quán)重细诸。如果C很大,表示即使有很小的誤差出現(xiàn)都會(huì)嚴(yán)重影響目標(biāo)函數(shù)陋守。

結(jié)合之前文章提到的知識(shí)震贵,可以構(gòu)造拉格朗日方程:

L(\vec{w}, b, \vec{\xi}, \vec{\alpha}, \vec{\beta}) = \frac{1}{2}\vec{w}^{T}\vec{w} + C\sum_{i}^{n}{\xi\_i} - \sum\_{i}^{n}{\alpha\_i[y\_i(\vec{w}^{T}\vec{x\_i}+b)-1+\xi\_i]} - \sum\_{i}^{n}\beta\_i\xi\_i
其中利赋,
\alpha\_i \ge 0, \beta\_i \ge 0, i = 1,2...n

然后利用對(duì)偶思想求解-\vec{w}, b, \xi-的導(dǎo)數(shù),并讓他們等于0猩系。如下:

\begin{array}{lcl} \frac{\partial L}{\partial \vec{w}} = \vec{w} - \sum\_{i}^{n}\alpha\_{i} y\_{i} \vec{x}\_i = 0 \\\\ \frac{\partial L}{\partial b} = - \sum\_{i}^{n}\alpha\_{i} y\_{i} = 0 \\\\ \frac{\partial L}{\partial \xi\_{i}} = C - \alpha\_{i} - \beta\_{i} = 0 \end{array}

代入上面的拉格朗日方程媚送,可以得到二項(xiàng)規(guī)劃方程。最后求解-\vec{\alpha}-寇甸,可得-\vec{w}--b-塘偎。二項(xiàng)規(guī)劃方程如下:
F(\alpha) = \frac{1}{2}\sum\_{i}^{n}\sum\_{j}^{m}y\_{i}y\_{j}\alpha\_{i}\alpha\_{j}\vec{x}\_{i}^{T}\vec{x}\_{j} - \sum\_{i}^{n} \alpha\_i, C \ge \alpha\_i \ge 0, i = 1,...,n

其中-\vec{w}-如下:
\vec{w} = \sum\_{i}^{n}\alpha\_{i}y\_{i}\vec{x}\_{i}

-b-可利用落于邊界上的支持向量求解拿霉。

比較

看到二項(xiàng)規(guī)劃那一步吟秩,我們可以發(fā)現(xiàn)Hard Margin SVMSoft Margin SVM的差別僅僅是-\alpha\_i-的取值范圍上有差異。Hard Margin SVM的約束條件是-\alpha\_i \ge 0-绽淘;Soft Margin SVM的約束條件是-C \ge \alpha\_i \ge 0-涵防。

我們知道-\alpha\_{i}-僅在-\vec{x}-為支持向量時(shí)值大于零。而在這里沪铭,-\alpha\_{i}-多了一個(gè)上限C武学。因?yàn)?span id="mqmiqto" class="math-inline">-C = \alpha\_{i} + \beta\_{i}-,所以有下面結(jié)論:

如果-\alpha\_{i} = 0-伦意,表示該點(diǎn)為非支持向量。

如果- 0 \lt \alpha\_{i} \lt C-硼补,則-\beta\_{i} \gt 0-驮肉,對(duì)應(yīng)的-\xi\_{i} = 0-,表示該點(diǎn)為邊界支持向量已骇。如下圖:

image.png

如果-\alpha\_{i} = C-离钝,則-\beta\_{i} = 0-,對(duì)應(yīng)的-\xi\_{i} \gt 0-褪储,表示該點(diǎn)違反了最大邊界的原則卵渴,屬于噪聲點(diǎn)。

image.png

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末鲤竹,一起剝皮案震驚了整個(gè)濱河市浪读,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌辛藻,老刑警劉巖碘橘,帶你破解...
    沈念sama閱讀 221,198評(píng)論 6 514
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異吱肌,居然都是意外死亡痘拆,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,334評(píng)論 3 398
  • 文/潘曉璐 我一進(jìn)店門氮墨,熙熙樓的掌柜王于貴愁眉苦臉地迎上來纺蛆,“玉大人吐葵,你說我怎么就攤上這事∏攀希” “怎么了温峭?”我有些...
    開封第一講書人閱讀 167,643評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長识颊。 經(jīng)常有香客問我诚镰,道長,這世上最難降的妖魔是什么祥款? 我笑而不...
    開封第一講書人閱讀 59,495評(píng)論 1 296
  • 正文 為了忘掉前任清笨,我火速辦了婚禮,結(jié)果婚禮上刃跛,老公的妹妹穿的比我還像新娘抠艾。我一直安慰自己,他們只是感情好桨昙,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,502評(píng)論 6 397
  • 文/花漫 我一把揭開白布检号。 她就那樣靜靜地躺著,像睡著了一般蛙酪。 火紅的嫁衣襯著肌膚如雪齐苛。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,156評(píng)論 1 308
  • 那天桂塞,我揣著相機(jī)與錄音凹蜂,去河邊找鬼。 笑死阁危,一個(gè)胖子當(dāng)著我的面吹牛玛痊,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播狂打,決...
    沈念sama閱讀 40,743評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼擂煞,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了趴乡?” 一聲冷哼從身側(cè)響起对省,我...
    開封第一講書人閱讀 39,659評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎浙宜,沒想到半個(gè)月后官辽,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,200評(píng)論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡粟瞬,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,282評(píng)論 3 340
  • 正文 我和宋清朗相戀三年同仆,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片裙品。...
    茶點(diǎn)故事閱讀 40,424評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡俗批,死狀恐怖俗或,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情岁忘,我是刑警寧澤辛慰,帶...
    沈念sama閱讀 36,107評(píng)論 5 349
  • 正文 年R本政府宣布,位于F島的核電站干像,受9級(jí)特大地震影響帅腌,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜麻汰,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,789評(píng)論 3 333
  • 文/蒙蒙 一速客、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧五鲫,春花似錦溺职、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,264評(píng)論 0 23
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至塑崖,卻和暖如春七冲,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背规婆。 一陣腳步聲響...
    開封第一講書人閱讀 33,390評(píng)論 1 271
  • 我被黑心中介騙來泰國打工癞埠, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人聋呢。 一個(gè)月前我還...
    沈念sama閱讀 48,798評(píng)論 3 376
  • 正文 我出身青樓,卻偏偏與公主長得像颠区,于是被迫代替她去往敵國和親削锰。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,435評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容