支持向量機(jī)SVM

什么是支持向量機(jī)

支持向量機(jī)(SVM)是一種二分類(lèi)模型,它的基礎(chǔ)模型時(shí)定義在特征空間上的間隔最大的線性分類(lèi)器掐隐。如下圖:

簡(jiǎn)單支持向量機(jī)模型

支持向量機(jī)當(dāng)訓(xùn)練模型線性可分時(shí)狗热,可以通過(guò)硬間隔最大化,學(xué)習(xí)一個(gè)線性的模型虑省,上圖就是一個(gè)硬間隔最大化的模型匿刮。當(dāng)訓(xùn)練數(shù)據(jù)近似線性不可分時(shí),使用軟間隔支持向量機(jī)探颈。當(dāng)線性不可分時(shí)熟丸,使用核函數(shù)和軟間隔最大化來(lái)學(xué)習(xí)。本文主要講述硬間隔支持向量機(jī)的推導(dǎo)過(guò)程伪节。

硬間隔支持向量機(jī)

對(duì)于一個(gè)線性可分的數(shù)據(jù)集T = \left\{ (x_{1}, y_{1} ), (x_{2}, y_{2}), …, (x_{n}, y_{n}) \right\} 光羞,劃分平面有很多绩鸣,我們需要找到一個(gè)最具魯棒性的平面,即超平面纱兑,來(lái)劃分?jǐn)?shù)據(jù)集呀闻。什么才是最具魯棒性,我們將在后面講解潜慎。

首先定義超平面的線性方程,w和b就是需要求解:

w^TX + b = 0

i點(diǎn)到超平面的距離幾何間隔(即距離)為:

\gamma_{i} =y_{i}(\frac{ w^TX_{i} +b  }{\vert \vert w\vert \vert } )

對(duì)于\gamma _i存在最小值捡多,即距離平面最近的點(diǎn):

\gamma =\min\gamma_{i}

這里就要提到上面的最具魯棒性,需要最具魯棒性就需要將\gamma最大化铐炫,簡(jiǎn)單來(lái)說(shuō)垒手,就是要找到距離超平面最近的點(diǎn),同時(shí)這些點(diǎn)距離超平面的間隔要近可能的大倒信,這些點(diǎn)我們稱(chēng)之為支持向量科贬,也就是我們需要保留的點(diǎn)。我們寫(xiě)成數(shù)學(xué)公式:

\max \limits_{W,b} \gamma\\

s.t. y_{i}(\frac{w^TX+b}{||w||} ) \geq \gamma, i=1,2,3,…,n\\

\gamma定義為\frac{\hat{\gamma} }{||w||} ,于是上面的式子可以寫(xiě)成:

\max \limits_{w,b} \frac{\hat{\gamma} }{||w||} \\

s.t. y_{i}(w^TX+b) \geq \hat{\gamma}, i=1,2,3,…,n\\

對(duì)面上面式子鳖悠,我們可以用\hat{\gamma}=1,代替榜掌,相對(duì)于對(duì)數(shù)據(jù)點(diǎn)進(jìn)行了等比例縮放,不影響求解的w和b乘综。同時(shí)最大化\frac{1 }{||w||} 和最小化\frac{1}{2}||w||^2等價(jià)唐责,再次化簡(jiǎn):

\min \limits_{w,b} \frac{1}{2}||w||^2 \\

s.t. y_{i}(w^TX+b)-1 \geq 0, i=1,2,3,…,n\\

這就是最終要求解的最優(yōu)化問(wèn)題。

求解方程瘾带,對(duì)偶問(wèn)題

對(duì)于求解線性可分支持向量機(jī)的最優(yōu)化問(wèn)題鼠哥,需要應(yīng)用到拉格朗日對(duì)偶問(wèn)題(PS.請(qǐng)自行查閱)。

首先構(gòu)建拉格朗日函數(shù):

L(w,b,\alpha ) = \frac{1}{2} ||w||^2-\sum_{i=1}^n\alpha_{i}y_i(w^Tx_i+b) +\sum_{i=1}^n\alpha_i\\s.t.\alpha_i\geq 0,i=1,2,3…,n


根據(jù)拉格朗日對(duì)偶問(wèn)題看政,原始問(wèn)題的對(duì)偶問(wèn)題就是

\max \limits_{\alpha}\min\limits_{w,t}L(w,b, \alpha)

先求解\min\limits_{w,t}L(w,b, \alpha)朴恳,分別對(duì)w和b的偏導(dǎo)為0,可得到:

w=\sum_{i=1}^n\alpha_iy_ix_i\\0=\sum_{i=1}^n\alpha_iy_i

將上述式子帶入L(w,b,\alpha)中:

\max\limits_{\alpha}\sum_{I=1}^n\alpha_i-\frac{1}{2} \sum_{i=1}^n\sum_{i=1}^n\alpha_i\alpha_jy_iy_jX_i^TX_j\\s.t. \sum_{i=1}^n\alpha_iy_i=0,\\\alpha_i\geq 0, I =1,2,…,n.

如何求解\alpha允蚣,需要用到SMO算法于颖,這個(gè)算法比較復(fù)雜,簡(jiǎn)單來(lái)說(shuō)就是選取兩個(gè)參數(shù)\alpha_i\alpha_j,固定\alpha_i\alpha_j以為的參數(shù),然后求解式子嚷兔,更新兩個(gè)參數(shù)森渐。最后求出\alpha,通過(guò)\alpha和KKT條件求出w,b求解為某個(gè)支持向量帶入得到的解:

w=\sum_{i=1}^n\alpha_iy_iX_i\\b=1-w^TX^j

KKT條件:

w-\sum_{i=1}^n\alpha_iy_iX_i=0\\-\sum_{i=1}^n\alpha_iy_i=0\\\alpha_{I}(y_i(w^TX_i+b)-1)=0,i=1,2,…,n\\y_i(wX_i+b)-1\geq 0, i=1,2,…,n\\\alpha_i\geq 0,i=1,2,…,n\\

軟間隔支持向量機(jī)

在上面的基礎(chǔ)上約束條件,其實(shí)就是表示有些點(diǎn)可以跨過(guò)超平面冒晰,獲得更加寬松的條件:

y_i(w^TX_i+b)\geq 1-\xi _i

對(duì)于每個(gè)松弛變量同衣,支付一個(gè)代價(jià),于是目標(biāo)函數(shù)變成了:

\min \limits_{w,b} \frac{1}{2}||w||^2 +C\sum_{i=1}^n\xi _i\\s.t. y_{i}(w^TX+b)\geq 1-\xi _i, i=1,2,3,…,n\\\xi _i\geq 0,i=1,2,…,N

核函數(shù)

對(duì)于線性不可分的數(shù)據(jù)集壶运,可以把數(shù)據(jù)集映射到高緯度空間耐齐,實(shí)現(xiàn)線性可分。


1 線性核函數(shù)

線性?xún)?nèi)核是最簡(jiǎn)單的內(nèi)核函數(shù)。 它由內(nèi)積<x埠况,y>加上可選的常數(shù)c給出耸携。 使用線性?xún)?nèi)核的內(nèi)核算法通常等于它們的非內(nèi)核對(duì)應(yīng)物,即具有線性?xún)?nèi)核的KPCA與標(biāo)準(zhǔn)PCA相同辕翰。表達(dá)式 :

k(x,y)=x^Ty+c

2 多項(xiàng)式核函數(shù)

多項(xiàng)式核是非固定內(nèi)核夺衍。 多項(xiàng)式內(nèi)核非常適合于所有訓(xùn)練數(shù)據(jù)都?xì)w一化的問(wèn)題。

這是我做的筆記:

表達(dá)式:

k(x,y)=(ax^Ty+c)^d

3 高斯核可調(diào)參數(shù)是斜率α喜命,常數(shù)項(xiàng)c和多項(xiàng)式度d刷后。

高斯核是徑向基函數(shù)核的一個(gè)例子。

k(x,y)=exp(-\frac{||x-y||^2}{2\sigma ^2} )

或者渊抄,它也可以使用來(lái)實(shí)現(xiàn)

k(x,y)=exp(-\gamma ||x-y||^2)

可調(diào)參數(shù)sigma在內(nèi)核的性能中起著主要作用,并且應(yīng)該仔細(xì)地調(diào)整到手頭的問(wèn)題丧裁。 如果過(guò)高估計(jì)护桦,指數(shù)將幾乎呈線性,高維投影將開(kāi)始失去其非線性功率煎娇。 另一方面二庵,如果低估,該函數(shù)將缺乏正則化缓呛,并且決策邊界將對(duì)訓(xùn)練數(shù)據(jù)中的噪聲高度敏感催享。

4指數(shù)的內(nèi)核

指數(shù)核與高斯核密切相關(guān),只有正態(tài)的平方被忽略哟绊。 它也是一個(gè)徑向基函數(shù)內(nèi)核因妙。

表達(dá)式:

key(x,y)=exp(-\frac{||x-y||}{2\sigma^2 } )

5 拉普拉斯算子核

拉普拉斯核心完全等同于指數(shù)內(nèi)核,除了對(duì)sigma參數(shù)的變化不那么敏感票髓。 作為等價(jià)的攀涵,它也是一個(gè)徑向基函數(shù)內(nèi)核。

表達(dá)式:

k(x,y)=exp(-\frac{||x-y||}{\sigma } )

重要的是注意洽沟,關(guān)于高斯內(nèi)核的σ參數(shù)的觀察也適用于指數(shù)和拉普拉斯內(nèi)核以故。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市裆操,隨后出現(xiàn)的幾起案子怒详,更是在濱河造成了極大的恐慌,老刑警劉巖踪区,帶你破解...
    沈念sama閱讀 217,406評(píng)論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件昆烁,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡缎岗,警方通過(guò)查閱死者的電腦和手機(jī)善玫,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,732評(píng)論 3 393
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人茅郎,你說(shuō)我怎么就攤上這事蜗元。” “怎么了系冗?”我有些...
    開(kāi)封第一講書(shū)人閱讀 163,711評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵奕扣,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我掌敬,道長(zhǎng)惯豆,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,380評(píng)論 1 293
  • 正文 為了忘掉前任奔害,我火速辦了婚禮楷兽,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘华临。我一直安慰自己芯杀,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,432評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布雅潭。 她就那樣靜靜地躺著揭厚,像睡著了一般。 火紅的嫁衣襯著肌膚如雪扶供。 梳的紋絲不亂的頭發(fā)上筛圆,一...
    開(kāi)封第一講書(shū)人閱讀 51,301評(píng)論 1 301
  • 那天,我揣著相機(jī)與錄音椿浓,去河邊找鬼太援。 笑死,一個(gè)胖子當(dāng)著我的面吹牛扳碍,可吹牛的內(nèi)容都是我干的粉寞。 我是一名探鬼主播,決...
    沈念sama閱讀 40,145評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼左腔,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼唧垦!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起液样,我...
    開(kāi)封第一講書(shū)人閱讀 39,008評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤振亮,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后鞭莽,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體坊秸,經(jīng)...
    沈念sama閱讀 45,443評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,649評(píng)論 3 334
  • 正文 我和宋清朗相戀三年澎怒,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了褒搔。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,795評(píng)論 1 347
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖星瘾,靈堂內(nèi)的尸體忽然破棺而出走孽,到底是詐尸還是另有隱情,我是刑警寧澤琳状,帶...
    沈念sama閱讀 35,501評(píng)論 5 345
  • 正文 年R本政府宣布磕瓷,位于F島的核電站,受9級(jí)特大地震影響念逞,放射性物質(zhì)發(fā)生泄漏困食。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,119評(píng)論 3 328
  • 文/蒙蒙 一翎承、第九天 我趴在偏房一處隱蔽的房頂上張望硕盹。 院中可真熱鬧,春花似錦叨咖、人聲如沸瘩例。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,731評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至创淡,卻和暖如春痴晦,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背琳彩。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,865評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工誊酌, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人露乏。 一個(gè)月前我還...
    沈念sama閱讀 47,899評(píng)論 2 370
  • 正文 我出身青樓碧浊,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親瘟仿。 傳聞我的和親對(duì)象是個(gè)殘疾皇子箱锐,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,724評(píng)論 2 354