支持向量機(jī)-算法概述

? 我的微信公眾號: s406205391; 歡迎大家一起學(xué)習(xí)恩急,一起進(jìn)步!J摇!

? 有些人認(rèn)為腾夯,支持向量機(jī)(SVM)是最好的現(xiàn)成的分類器颊埃,這里說的“現(xiàn)成”指的是分類器不加修改即可直接使用。同時蝶俱,這就意味著在數(shù)據(jù)上應(yīng)用基本形式的SVM分類器就可以得到低錯誤率的結(jié)果竟秫。SVM能夠?qū)τ?xùn)練集之外的數(shù)據(jù)點(diǎn)做出很好的分類決策。

?

距離的定義:基于最大間隔分隔數(shù)據(jù)

? 假設(shè)在一個平面上有如下兩組數(shù)據(jù)跷乐,我們可以用如下一條直線將兩組數(shù)據(jù)分隔開(我們將上述可以把數(shù)據(jù)集分隔開的直線稱為分隔超平面)肥败。圖左和圖右兩條直線均可有效的將數(shù)據(jù)分隔開。那么愕提,哪一條直線的分隔效果更好呢馒稍?很明顯圖右的直線分隔效果更好,因為它距離兩組數(shù)據(jù)的距離相對于圖左直線更遠(yuǎn)浅侨。支持向量就是離分隔超平面最近的那些點(diǎn)纽谒。

image

? 那么,我們在設(shè)計分類器之前如输,就先得學(xué)會如何計算支持向量到分隔超平面之間的距離鼓黔。假設(shè)由圖點(diǎn)x是分隔超平面的支持向量央勒,w是超平面上的法向量,w'和w''是超平面上的兩個點(diǎn)澳化。我們定義超平面方程為wTx+b=0崔步。那么我們可以得到兩個等式:

  • w'和w''在超平面上:wTx' = -b; WTx'' = -b

  • 法向量與w'和w''的向量垂直:[w^T (x^{''} - x^{'})] = 0

    ? 我們要求點(diǎn)到直線的距離,其實也就是求向量(x - x’)與法向量w的單位向量的投影(內(nèi)積)缎谷。那么公式即為:distance(x, b, w) = |\frac{w^{T}}{||w||}(x-x^{'})| = \frac{1}{||w||}|w^{T}x+b| 因為w'是隨機(jī)找的一個點(diǎn)井濒,因此必然可以約分,將w'約分完之后列林,即可得到最終的表達(dá)式瑞你。

image

優(yōu)化目標(biāo): 找到一條線(w和b),是的離該線最近的點(diǎn)能夠最遠(yuǎn)

? 有了距離公式,那么也有了我們機(jī)器學(xué)習(xí)的優(yōu)化方向:讓支持向量與超平面的距離最遠(yuǎn)希痴。在做SVM機(jī)器學(xué)習(xí)的時候者甲,我們首先需要定義標(biāo)簽,即將我們的訓(xùn)練數(shù)據(jù)進(jìn)行分類砌创。在這里虏缸,為了后期計算方便,我們將數(shù)據(jù)分類兩類纺铭,分別用1和-1表示刀疙。那么就有了如下的決策方程:

y(x)=w^{T}\phi(x)+b \Rightarrow \begin{aligned}y(x_{i})>0 &\Leftrightarrow y_{i}=+1\\ y(x_{i})<0&\Leftrightarrow y_{i}=-1\end{aligned} \Rightarrow y(i) \cdot y(x_{i})>0 這里的φ(x)我們可以先暫時理解為x

將距離公式帶入到?jīng)Q策方程,可得:\frac{y_{i} \cdot (w^{T} \cdot \phi(x_{i}) + b)}{||w||} (由于y_{i} \cdot y(x_{i})>0, 所有將絕對值展開谦秧,公式依舊成立。)

對于該決策方程疚鲤,我們設(shè)計優(yōu)化目標(biāo),找到一條離支持向量的點(diǎn)最遠(yuǎn)的直線集歇,優(yōu)化目標(biāo)如下:

目標(biāo)函數(shù): argmax_{w,b}\left\{ \frac{1}{||w||} min[y_{i} \cdot (w^{T} \cdot \phi(x_{i} + b))] \right \}

求解目標(biāo)函數(shù)

? 上述的目標(biāo)函數(shù)看起來很復(fù)雜,通俗的將诲宇,大括號內(nèi)的意思即為,找到在整個樣本中姑蓝,距離決策邊界距離最小的樣本。大括號外面即纺荧,找到與這些這些樣本距離最大的線旭愧。

放縮變換

? 對于決策方程颅筋,不太好求解,我們這里可以做一下變換输枯。我們通過放縮變換使得:對于決策方程(w,b),其結(jié)果|y|>=1 \Rightarrow y_{i} \cdot (w^{T} \cdot \phi(x_{i}) + b) >= 1 (之前我們認(rèn)為恒大于0议泵,現(xiàn)在更嚴(yán)格了一些)

由于y_{i} \cdot (w^{T} \cdot \phi(x_{i}) + b) >= 1 , 那么,其最小值就為1用押,那么肢簿,我們只需要考慮argmax_{w,b} \frac{1}{||w||}

當(dāng)前目標(biāo)max_{w,b} \frac{1}{||w||}蜻拨,約束條件:y_{i} \cdot (w^{T} \cdot \phi(x_{i}) + b) >= 1

函數(shù)變換

? 對于上述目標(biāo)函數(shù)池充,我們適當(dāng)轉(zhuǎn)換一下,方便求解缎讼。我們可以將上述函數(shù)的求最大值問題收夸,改為求極小值問題:

轉(zhuǎn)換函數(shù) \Rightarrow min_{w,b} \frac{1}{2}w^{2}

? 轉(zhuǎn)換思路為:先將\frac{1}{||w||}轉(zhuǎn)換成其倒數(shù),再取其平方血崭,再添加一個常規(guī)項1/2卧惜。雖然做了如下操作之后,最后得到的點(diǎn)的值會發(fā)生變換夹纫,但是咽瓷,取到的點(diǎn)是不變的

對于這個函數(shù)舰讹,我們可以用拉格朗日乘子法求解茅姜。

求解拉格朗日乘子法

? 拉格朗日乘子法是專門用來求解帶約束條件的問題的。他的基本公式為:

? min L(x, \lambda,w)=f_{0}(x) + \Sigma{\lambda_{i}f_{i}(x)} + \Sigma{v_{i}h_{i}(x)}

? 把我們的方程代入月匣,即得:

? L(w,b,\alpha)= \frac{1}{2}||w||^{2} - \Sigma{\alpha_{i}(y_{i}(w^{T} \cdot \phi(x_i) +b)-1)} 約束條件:{y_i(w^T \cdot \Phi(x_i) + b)>=1}

? 上式有三個未知量钻洒,w, α,b。如果我們能求得這三個變量之間的關(guān)系锄开,即可得到方程的解素标。我們分別對w和b求偏導(dǎo),得:

? 對w求偏導(dǎo):\frac{\partial L}{\partial w}=0 \Rightarrow w=\sum\limits_{1-n} {\alpha_{i}y_{i}\Phi(x_n)}

? 對b求偏導(dǎo):\frac{\partial L}{\partial b}=0 \Rightarrow 0=\sum\limits_{1-n}{\alpha_{i}y_{i}}

? 我們帶入原式即得:

? L(w,b,\alpha)= \frac{1}{2}||w||^{2} - \Sigma{\alpha_{i}(y_{i}(w^{T} \cdot \phi(x_i) +b)-1)}

? 其中:w=\sum\limits_{1-n} {\alpha_{i}y_{i}\Phi(x_n)}; 0=\sum\limits_{1-n}{\alpha_{i}y_{i}}

? =\frac{1}{2}w^{T}w-w^{T}\sum\limits_{i=1}\limits^{n}\alpha_{i}y_{i}\Phi(x_{i}) - b\sum\limits_{i=1}\limits^{n}\alpha_{i}y_{i} + \sum\limits_{i=1}\limits^{n}\alpha_{i}

? =\sum\limits_{i=1}\limits^{n}\alpha_{i} - \frac{1}{2}(\sum\limits_{i=1}\limits^{n}\alpha_{i}y_{i}\Phi(x_{i})^T\sum\limits_{i=1}\limits^{n}\alpha_{i}y_{i}\Phi(x_{i}) 完成了第一步求解minL(w,b,α)

? =\sum\limits_{i=1}\limits^{n}\alpha_{i} - \frac{1}{2}\sum\limits_{i=1,j=1}\limits^{n}\alpha_{i}\alpha_{j}y_i y_j \Phi^T(x_i)\Phi^T(x_j) 求解該式的極值

繼續(xù)求解

? 我們需要求解上式的極大值萍悴,添加一個符號头遭,我們轉(zhuǎn)換為求解該式的極小值。

即: \frac{1}{2}\sum\limits_{i=1,j=1}\limits^{n}\alpha_{i}\alpha_{j}y_i y_j \Phi^T(x_i)\Phi^T(x_j) - \sum\limits_{i=1}\limits^{n}\alpha_{i}; 條件:\sum\limits_{i=1}\limits^n \alpha_i yi = 0; \alpha_i >= 0

實例求解

我們現(xiàn)在以一個實例癣诱,求解上述方程。

image

? 我們將上面數(shù)據(jù)代入即可得:


image

對α1和α2求偏導(dǎo)即可得: \alpha_1 = 1.5; \alpha_2 = -1

這里享潜,α2小于0嗅蔬,不滿足約束條件疾就,所以應(yīng)該在邊界上猬腰。此時α1=0或者α2=0.

image

將α結(jié)果代入求解:w=\sum\limits_{i=1}\limits^n \alpha_i y_i |Phi(x_n); 平面方程為:0.5x_1 + 0.5x_2 -2 = 0

軟間隔問題

在這里插入圖片描述

核函數(shù)

? 核函數(shù)即為了解決低維不可分問題姑荷,通過核函數(shù)將我們的數(shù)據(jù)轉(zhuǎn)換到高維的層面缩擂,這里就不多介紹了。我們最常用的一個核函數(shù)即為高斯核函數(shù)懈费。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末憎乙,一起剝皮案震驚了整個濱河市叉趣,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌阵谚,老刑警劉巖乡数,帶你破解...
    沈念sama閱讀 219,490評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件净赴,死亡現(xiàn)場離奇詭異罩润,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)割以,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,581評論 3 395
  • 文/潘曉璐 我一進(jìn)店門严沥,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人跟伏,你說我怎么就攤上這事∈馨猓” “怎么了?”我有些...
    開封第一講書人閱讀 165,830評論 0 356
  • 文/不壞的土叔 我叫張陵峡蟋,是天一觀的道長蕊蝗。 經(jīng)常有香客問我立美,道長,這世上最難降的妖魔是什么建蹄? 我笑而不...
    開封第一講書人閱讀 58,957評論 1 295
  • 正文 為了忘掉前任洞慎,我火速辦了婚禮,結(jié)果婚禮上旭绒,老公的妹妹穿的比我還像新娘焦人。我一直安慰自己,他們只是感情好忽匈,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,974評論 6 393
  • 文/花漫 我一把揭開白布矿辽。 她就那樣靜靜地躺著,像睡著了一般雕蔽。 火紅的嫁衣襯著肌膚如雪宾娜。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,754評論 1 307
  • 那天嚣艇,我揣著相機(jī)與錄音,去河邊找鬼巷懈。 笑死慌洪,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的冈爹。 我是一名探鬼主播,決...
    沈念sama閱讀 40,464評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼恳谎,長吁一口氣:“原來是場噩夢啊……” “哼因痛!你這毒婦竟也來了岸更?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,357評論 0 276
  • 序言:老撾萬榮一對情侶失蹤谭企,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后债查,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體瓜挽,經(jīng)...
    沈念sama閱讀 45,847評論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡秸抚,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,995評論 3 338
  • 正文 我和宋清朗相戀三年剥汤,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片吭敢。...
    茶點(diǎn)故事閱讀 40,137評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡鹿驼,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出畜晰,到底是詐尸還是另有隱情,我是刑警寧澤腊瑟,帶...
    沈念sama閱讀 35,819評論 5 346
  • 正文 年R本政府宣布块蚌,位于F島的核電站,受9級特大地震影響财松,放射性物質(zhì)發(fā)生泄漏纱控。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,482評論 3 331
  • 文/蒙蒙 一胚迫、第九天 我趴在偏房一處隱蔽的房頂上張望唾那。 院中可真熱鬧,春花似錦期犬、人聲如沸避诽。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,023評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽拱雏。三九已至,卻和暖如春铸抑,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背蒲赂。 一陣腳步聲響...
    開封第一講書人閱讀 33,149評論 1 272
  • 我被黑心中介騙來泰國打工滥嘴, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人若皱。 一個月前我還...
    沈念sama閱讀 48,409評論 3 373
  • 正文 我出身青樓是尖,卻偏偏與公主長得像,于是被迫代替她去往敵國和親饺汹。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,086評論 2 355

推薦閱讀更多精彩內(nèi)容