SVM推導(dǎo)

SVM推導(dǎo)

參考鏈接回右。

問(wèn)題分析:給定一個(gè)標(biāo)注的數(shù)據(jù)集(x_{i},y_{i}), i=1,2,3,4……N斤蔓,其中x_{i}\in R^fx1ki2k, y_{i}\in\{1,-1\}植酥,我們希望找到一個(gè)分類(lèi)器或者說(shuō)分類(lèi)平面f(x_{i})使得以下的判別成立:

f\left( x_{i}\right) \begin{cases}\geq 0,y_{i}=1\\ <0,y_{i}=-1\end{cases}

也就是對(duì)于正確分類(lèi)的話應(yīng)該有y_{i}f(x_{i})>0成立

正負(fù)樣本

線性可分與線性不可分

線性可分與線性不可分

對(duì)于線性可分的情況,分類(lèi)平面以f(x)=\omega^Tx+b表示弦牡,其中\omega^T是權(quán)重向量友驮,b是偏差。在二維的坐標(biāo)里面喇伯,分類(lèi)平面就是一條直線喊儡。在三維空間就是一個(gè)分類(lèi)平面。訓(xùn)練集是為了學(xué)習(xí)到\omega^T

二維分類(lèi)平面
三維空間的SVM

最優(yōu)的\omega

通過(guò)訓(xùn)練集可以更新\omega來(lái)得到最終的決策平面稻据。有個(gè)問(wèn)題是艾猜,滿足劃分正確的決策平面有無(wú)數(shù)多個(gè),怎么樣的\omega才是最優(yōu)的捻悯?最好的決策平面應(yīng)該是距離兩種類(lèi)別的點(diǎn)都是最遠(yuǎn)的匆赃,也就是間隔要最大化,這樣在新的數(shù)據(jù)點(diǎn)進(jìn)入的時(shí)候今缚,才能有比較大的抗干擾能力算柳。

什么是最優(yōu)的omega

因?yàn)闆Q策平面2(\omega^Tx+b)=0\omega^Tx+b=0是一回事,因此我們總是能夠調(diào)整調(diào)整權(quán)重值和偏差值姓言,使得最終支持向量所在的間隔為下圖的形式所示瞬项。

這個(gè)時(shí)候蔗蹋,我們求兩個(gè)邊界之間的間隔也就是:

\omega^Tx+b=1\omega^Tx+b=-1之間的距離在\omega方向上面的投影。

margin=\frac{\omega}{\left\| w\right\|}(x_{+}-x_{-})=\frac{\omega^T}{\left\| w\right\|}(x_{+}-x_{-})=\frac{2}{\left\| w\right\|}囱淋,其中\frac{\omega}{\left\| w\right\|}\omega方向上面的單位向量猪杭,

推導(dǎo)
最大化間隔的示意圖

因此我們要最大化的間隔,也就是我們的目標(biāo)函數(shù)是Margin=\frac{2}{\left\| w\right\|}, s.t.y_{i}(\omega^Tx_{i}+b)\geq1, i=1,2,3……N

也就是在滿足線性約束條件y_{i}(\omega^Tx_{i}+b)\geq1, i=1,2,3……N的前提下妥衣,求Margin的最大值皂吮,等價(jià)于求argmin_{\omega}\frac{1}{2}{\left\| w\right\|}^2, s.t.y_{i}(\omega^Tx_{i}+b)\geq1, i=1,2,3……N

這是一個(gè)滿足線性限制條件的二次優(yōu)化問(wèn)題,有唯一的最小值税手。

軟間隔

最優(yōu)的omega

在一些問(wèn)題上我們需要對(duì)誤差和間隔最大化做一些妥協(xié)和讓步蜂筹,比如上面兩幅圖當(dāng)中,為了把很靠近紅色正樣本的那個(gè)藍(lán)色點(diǎn)正確劃分芦倒,極大地扭曲了決策平面艺挪。因此我們需要調(diào)整決策平面使得它能夠容忍一定的誤差。

引入一個(gè)弛豫變量\xi

弛豫變量

在這里弛豫變量\xi可以認(rèn)為是偏離正確分類(lèi)邊界的y方向的距離(也可以認(rèn)為是等式右邊的偏差)熙暴,比如以負(fù)樣本的劃分為例子闺属,恰好在劃分邊界上面的點(diǎn)\xi=0慌盯,而再往上去一點(diǎn)周霉,0<\xi<1,因?yàn)辄c(diǎn)還沒(méi)有到中間的分類(lèi)平面亚皂,中間的分類(lèi)平面到下面的負(fù)樣本的邊界函數(shù)距離為1俱箱,在法向量方向上的投影為\frac{1}{\left\| \omega \right\|},當(dāng)負(fù)樣本的點(diǎn)在決策平面以上之后灭必,\xi>1狞谱,是錯(cuò)分點(diǎn),其在法向量上面的投影\frac{\xi_{i}}{\left\| \omega \right\|}>\frac{1}{\left\| \omega \right\|}禁漓。

軟間隔優(yōu)化方法

在優(yōu)化的目標(biāo)函數(shù)里面引入誤差項(xiàng)跟衅,變成了min_{\omega}\frac{1}{2}\left\|\omega\right\|+C\sum_{i=1}^{N}\xi_{i}, s.t. y_{i}(\omega^Tx+b)\geq1-\xi_{i},i=1,2,3……,目標(biāo)函數(shù)變成了這個(gè)播歼。

C就是正則化項(xiàng)伶跷,其值越大對(duì)誤差的懲罰就越大。1-\xi_{i}相當(dāng)于降低了標(biāo)準(zhǔn)秘狞,可以允許在間隔內(nèi)叭莫。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市烁试,隨后出現(xiàn)的幾起案子雇初,更是在濱河造成了極大的恐慌,老刑警劉巖减响,帶你破解...
    沈念sama閱讀 216,496評(píng)論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件靖诗,死亡現(xiàn)場(chǎng)離奇詭異郭怪,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)刊橘,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,407評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門(mén)移盆,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人伤为,你說(shuō)我怎么就攤上這事咒循。” “怎么了绞愚?”我有些...
    開(kāi)封第一講書(shū)人閱讀 162,632評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵叙甸,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我位衩,道長(zhǎng)裆蒸,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,180評(píng)論 1 292
  • 正文 為了忘掉前任糖驴,我火速辦了婚禮僚祷,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘贮缕。我一直安慰自己辙谜,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,198評(píng)論 6 388
  • 文/花漫 我一把揭開(kāi)白布感昼。 她就那樣靜靜地躺著装哆,像睡著了一般。 火紅的嫁衣襯著肌膚如雪定嗓。 梳的紋絲不亂的頭發(fā)上蜕琴,一...
    開(kāi)封第一講書(shū)人閱讀 51,165評(píng)論 1 299
  • 那天,我揣著相機(jī)與錄音宵溅,去河邊找鬼凌简。 笑死,一個(gè)胖子當(dāng)著我的面吹牛恃逻,可吹牛的內(nèi)容都是我干的雏搂。 我是一名探鬼主播,決...
    沈念sama閱讀 40,052評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼辛块,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼畔派!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起润绵,我...
    開(kāi)封第一講書(shū)人閱讀 38,910評(píng)論 0 274
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤线椰,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后尘盼,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體憨愉,經(jīng)...
    沈念sama閱讀 45,324評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡烦绳,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,542評(píng)論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了配紫。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片径密。...
    茶點(diǎn)故事閱讀 39,711評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖躺孝,靈堂內(nèi)的尸體忽然破棺而出享扔,到底是詐尸還是另有隱情,我是刑警寧澤植袍,帶...
    沈念sama閱讀 35,424評(píng)論 5 343
  • 正文 年R本政府宣布惧眠,位于F島的核電站,受9級(jí)特大地震影響于个,放射性物質(zhì)發(fā)生泄漏氛魁。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,017評(píng)論 3 326
  • 文/蒙蒙 一厅篓、第九天 我趴在偏房一處隱蔽的房頂上張望秀存。 院中可真熱鬧,春花似錦羽氮、人聲如沸或链。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,668評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)株扛。三九已至尤筐,卻和暖如春汇荐,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背盆繁。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,823評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工掀淘, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人油昂。 一個(gè)月前我還...
    沈念sama閱讀 47,722評(píng)論 2 368
  • 正文 我出身青樓革娄,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親冕碟。 傳聞我的和親對(duì)象是個(gè)殘疾皇子拦惋,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,611評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容

  • 1、線性可分SVM與硬間隔最大化 《統(tǒng)計(jì)學(xué)習(xí)方法》關(guān)于SVM的第一節(jié)標(biāo)題如上安寺,其實(shí)這個(gè)標(biāo)題的意思是Hard-Mar...
    單調(diào)不減閱讀 2,159評(píng)論 0 0
  • SVM(Support Vector Machine厕妖,支持向量機(jī))是最經(jīng)典的分類(lèi)算法,本文主要整理(為了應(yīng)付考試)...
    Xuang123閱讀 3,936評(píng)論 1 1
  • 以西瓜書(shū)為主線挑庶,以其他書(shū)籍作為參考進(jìn)行補(bǔ)充言秸,例如《統(tǒng)計(jì)學(xué)習(xí)方法》软能,《PRML》等 第一章 緒論 1.2 基本術(shù)語(yǔ) ...
    danielAck閱讀 4,515評(píng)論 0 6
  • 考試說(shuō)明 注重基礎(chǔ)知識(shí)和概念的理解,因此解題中的計(jì)算過(guò)程不會(huì)很復(fù)雜举畸,但是會(huì)有推公式的過(guò)程查排。本課程的重點(diǎn)知識(shí)包括:貝...
    城市中迷途小書(shū)童閱讀 1,183評(píng)論 0 0
  • 什么是 SVM 算法 二元線性分類(lèi)問(wèn)題(簡(jiǎn)單)可分問(wèn)題什么樣線性方程是最好線性的方程,離這條子線最近那些點(diǎn)離這條線...
    zidea閱讀 246評(píng)論 0 3