V 支持向量機

以下內(nèi)容參考《機器學(xué)習(xí)》周志華(西瓜書)以及《機器學(xué)習(xí)公式詳解》datawhale(南瓜書)

支持向量

給定訓(xùn)練樣本D赛糟,分類學(xué)習(xí)最基本的想法就是基于訓(xùn)練集D鞍恢,在樣本空間中找到一個劃分超平面腊敲,將不同類別的樣本分開缅疟。

問題在于:選擇什么樣的超平面捍靠?

直觀上墓臭,中間的超平面魯棒性最強

超平面可以表示為:

w^Tx+b = 0, 其中w為法向量,b為位移項(超平面與原點之間的距離)核芽。

樣本空間中任意點x到超平面(w,b)的距離可以寫為:r=\frac{|w^T+b|}{\|w\|}.

如果超平面能夠?qū)颖菊_分類囚戚,y值為正負(fù)1,對于正樣本有w^Tx_i+b > 0轧简,負(fù)樣本w^Tx_i+b < 0?, 所以存在縮放弯淘,成立:

\left\{  
             \begin{array}{**r**}  
             w^Tx_i+b\geq+1, y_i=+1  \\  
             w^Tx_i+b\leq -1, y_i=-1    
             \end{array}  
\right.

使的等式成立的樣本稱為支持向量,兩個異類支持向量到超平面的距離:\gamma = \frac{2}{\|w\|},稱為間隔吉懊。

支持向量與間隔

于是庐橙,找到最大間隔,也即:

\max_{w,b} \frac{2}{\|w\|},\\s.t.\qquad y_i(w^Tx_i+b)\geq1,i=1,2,...,m

等價于

\min_{w,b} \frac{1}{2}\|w\|^2
\\s.t.\qquad y_i(w^Tx_i+b)\geq1,i=1,2,...,m

稱為SVM的基本型借嗽。

對偶問題

對于上式使用拉格朗日乘子法态鳖,得到

L(w,b,\alpha) = \frac{1}{2}\|w\|^2+\sum_{i=1}^m\alpha_i(1-y_i(w^Tx_i+b)),\alpha_i\geq0

令L對w,b的偏導(dǎo)數(shù)為0,可轉(zhuǎn)化為:

\max_{\alpha}\sum_{I=1}^m\alpha_i-\frac{1}{2}\sum_{i=1}^m\sum_{j=1}^m\alpha_i\alpha_jy_iy_jx_i^Tx_j \\
s.t. \qquad \sum_{i=1}^m\alpha_iy_i=0, \\\alpha_i\geq0,i=1,2,...,m

解出\alpha即可求出w,b恶导,進(jìn)而獲取模型浆竭。

求解方法:SMO算法,避開問題規(guī)模正比于訓(xùn)練樣本數(shù)的障礙惨寿。不斷執(zhí)行如下步驟直至收斂邦泄。

* 選取一對需要更新的變量\alpha_i、\alpha_j

* 固定之外的參數(shù)裂垦,求解目標(biāo)函數(shù)獲得更新后的\alpha_i顺囊、\alpha_j

由于KKT條件:

\left\{  
             \begin{array}{**l**}  
             \alpha_i\geq0;  \\  
            y_if(x_i)-1\geq0;\\
            \alpha_i(y_if(x_i)-1)=0.
             \end{array}  
\right.

于是,對于任意的訓(xùn)練樣本有:\alpha_i =0 或y_if(x_i)=1,前者對f沒有影響蕉拢,后者代表支持向量特碳。

SMO算法:選擇兩變量對應(yīng)樣本之間的間隔最大,這樣更新后能夠?qū)δ繕?biāo)函數(shù)值帶來更大的變化晕换。

求出\alpha后可以獲取w午乓,利用支持向量的平均值可以獲取b

b=\frac{1}{S}\sum_{s\in S}(y_s-\sum_{i\in S}\alpha_iy_ix_i^Tx_s)

核函數(shù)

對于線性不可分的問題,可以將樣本從原始空間映射到一個更高維的特征空間闸准,使得樣本在這個特征空間線性可分益愈。利用\Phi(x)作為映射,超平面可以記為:f(x)=w^T\Phi(x)+b.

類似未做映射的SVM夷家,可以得知計算w蒸其,b 需要\Phi(x_i)^T\Phi(x_j),設(shè)想函數(shù)\kappa(x_i,x_j) = <\Phi(x_i),\Phi(x_j)>=\Phi(x_i)^T \Phi(x_j),

于是可以得到f(x) = \sum_{i=1}^m\alpha_iy_i\kappa(x,x_i)+b

\kappa即核函數(shù)或辖。

什么樣的函數(shù)可以做核函數(shù)?

一個對稱函數(shù)枣接,對應(yīng)的核矩陣半正定,就能作為核函數(shù)使用缺谴。

注意但惶,核函數(shù)可以通過組合得到:

1. 若\kappa_1、\kappa_2為核函數(shù)湿蛔,任意正數(shù)\gamma_1膀曾、\gamma_2,線性組合\gamma_1\kappa_1+\gamma_2\kappa_1為核函數(shù)阳啥;

2. 若\kappa_1添谊、\kappa_2為核函數(shù),直積\kappa_1\otimes \kappa_2(x,z) = \kappa_1(x,z)\kappa_2(x,z)為核函數(shù)察迟;

2. 若\kappa_1為核函數(shù)斩狱,對于任意g(x),\kappa(x,z) = g(x)\kappa_1(x,z)g(z)是核函數(shù)。

軟間隔

允許支持向量機在一些樣本上出錯扎瓶,也就是不滿足約束所踊。由于希望不滿足約束的樣本盡可能少,于是優(yōu)化目標(biāo)為:

\min_{w,b} \frac{1}{2}\|w\|^2+C\sum_{i=1}^ml_{0/1}(y_i(w^Tx_i+b)-1),其中l(wèi)_{0/1}是0/1損失函數(shù)概荷,小于0為1秕岛,否則0。

由于l的連續(xù)性與凸不好误证,有替代損失函數(shù)继薛,如:

hinge損失:l_{hinge} = max(0,1-z)

指數(shù)損失:l_{exp}(z)=exp(-z)

對數(shù)損失:l_{log}=log(1+exp(-z))

損失函數(shù)

引入松弛變量,模型變?yōu)?/p>

\min_{w,b} \frac{1}{2}\|w\|^2+C\sum_{i=1}^m\xi _i
\\s.t.\qquad y_i(w^Tx_i+b)\geq1-\xi_i,i=1,2,...,m \\
\xi_i \geq 0,i=1,2,...,m

即軟間隔支持向量機愈捅。類似的遏考,拉格朗日獲得對偶問題求解。

支持向量回歸

簡稱SVR蓝谨,以f為中心構(gòu)建了一個間隔帶诈皿,若訓(xùn)練樣本落入間隔帶,被認(rèn)為預(yù)測正確像棘。

核方法

一系列基于核函數(shù)的學(xué)習(xí)方法稽亏,常見的是核化將線性學(xué)習(xí)器擴(kuò)展為非線性學(xué)習(xí)器。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末缕题,一起剝皮案震驚了整個濱河市截歉,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌烟零,老刑警劉巖瘪松,帶你破解...
    沈念sama閱讀 211,348評論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件咸作,死亡現(xiàn)場離奇詭異,居然都是意外死亡宵睦,警方通過查閱死者的電腦和手機记罚,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,122評論 2 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來壳嚎,“玉大人桐智,你說我怎么就攤上這事⊙滔冢” “怎么了说庭?”我有些...
    開封第一講書人閱讀 156,936評論 0 347
  • 文/不壞的土叔 我叫張陵,是天一觀的道長郑趁。 經(jīng)常有香客問我刊驴,道長,這世上最難降的妖魔是什么寡润? 我笑而不...
    開封第一講書人閱讀 56,427評論 1 283
  • 正文 為了忘掉前任捆憎,我火速辦了婚禮,結(jié)果婚禮上梭纹,老公的妹妹穿的比我還像新娘攻礼。我一直安慰自己,他們只是感情好栗柒,可當(dāng)我...
    茶點故事閱讀 65,467評論 6 385
  • 文/花漫 我一把揭開白布礁扮。 她就那樣靜靜地躺著,像睡著了一般瞬沦。 火紅的嫁衣襯著肌膚如雪太伊。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,785評論 1 290
  • 那天逛钻,我揣著相機與錄音僚焦,去河邊找鬼。 笑死曙痘,一個胖子當(dāng)著我的面吹牛芳悲,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播边坤,決...
    沈念sama閱讀 38,931評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼名扛,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了茧痒?” 一聲冷哼從身側(cè)響起肮韧,我...
    開封第一講書人閱讀 37,696評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后弄企,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體超燃,經(jīng)...
    沈念sama閱讀 44,141評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,483評論 2 327
  • 正文 我和宋清朗相戀三年拘领,在試婚紗的時候發(fā)現(xiàn)自己被綠了意乓。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,625評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡约素,死狀恐怖届良,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情业汰,我是刑警寧澤菩颖,帶...
    沈念sama閱讀 34,291評論 4 329
  • 正文 年R本政府宣布样漆,位于F島的核電站,受9級特大地震影響晦闰,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜跪妥,卻給世界環(huán)境...
    茶點故事閱讀 39,892評論 3 312
  • 文/蒙蒙 一眉撵、第九天 我趴在偏房一處隱蔽的房頂上張望落塑。 院中可真熱鬧憾赁,春花似錦蟆肆、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,741評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至毁涉,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間其屏,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,977評論 1 265
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留妙真,地道東北人。 一個月前我還...
    沈念sama閱讀 46,324評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像缩功,于是被迫代替她去往敵國和親嫡锌。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,492評論 2 348

推薦閱讀更多精彩內(nèi)容

  • 間隔與支持向量 給定訓(xùn)練樣本集,分類學(xué)習(xí)最基本的想法就是基于訓(xùn)練集在樣本空間中找到一個劃分超平面溯壶,將不同類別的樣本...
    乘瓠散人閱讀 398評論 0 0
  • 支持向量機 原理 《機器學(xué)習(xí)》周志華 6.1 間隔與支持向量 給定訓(xùn)練樣本集 D验烧,分類學(xué)習(xí)最基本的想法就是基于訓(xùn)練...
    hxiaom閱讀 836評論 0 0
  • 支持向量機基本模型 支持向量機的基本思想是,在如下的樣本集中: 基于訓(xùn)練集D在樣本空間中找到一個劃分超平面,將不同...
    超級超級小天才閱讀 865評論 0 2
  • 原理 分類學(xué)習(xí)最基本的思想就是基于訓(xùn)練集在樣本空間中找到一個劃分超平面弧满,將不同類別的樣本區(qū)分開庭呜。但是事實上郊供,能將訓(xùn)...
    TOMOCAT閱讀 463評論 0 2
  • 支持向量機(SVM) 目錄 ·簡介 ·凸二次規(guī)劃 ·拉格朗日乘數(shù)法與KKT條件 ·拉格朗日對偶問題 ·支持向量機(...
    丁想閱讀 752評論 0 2