機(jī)器學(xué)習(xí)代碼實(shí)現(xiàn) SVM (5)

Paste_Image.png

一.什么是支持向量機(jī)


1、支持向量機(jī)(Support Vector Machine,常簡(jiǎn)稱為SVM)是一種 監(jiān)督式學(xué)習(xí)的方法列荔,可廣泛地應(yīng)用于統(tǒng)計(jì)分類以及回歸分析。支持向量機(jī)屬于一般化線性分類器枚尼,這族分類器的特點(diǎn)是他們能夠同時(shí)最小化經(jīng)驗(yàn)誤差與最大化幾何邊緣區(qū)贴浙,因此支持向量機(jī)也被稱為最大邊緣區(qū)分類器

2署恍、支持向量機(jī)將向量映射到一個(gè)更高維的空間里崎溃,在這個(gè)空間里建立有一個(gè)最大間隔超平面。在分開(kāi)數(shù)據(jù)的超平面的兩邊建有兩個(gè)互相平行的超平面盯质,分隔超平面使兩個(gè)平行超平面的距離最大化袁串。假定平行超平面間的距離或差距越大,分類器的總誤差越小呼巷。

3囱修、假設(shè)給定一些分屬于兩類的2維點(diǎn),這些點(diǎn)可以通過(guò)直線分割王悍, 我們要找到一條最優(yōu)的分割線破镰,如何來(lái)界定一個(gè)超平面是不是最優(yōu)的呢?

Paste_Image.png

二、求解過(guò)程


最優(yōu)超平面可以有無(wú)數(shù)種表達(dá)方式压储,即通過(guò)任意的縮放 w 和 b 鲜漩。 習(xí)慣上我們使用以下方式來(lái)表達(dá)最優(yōu)超平面。

Paste_Image.png

我們令兩類的點(diǎn)分別為+1, -1集惋,所以當(dāng)有一個(gè)新的點(diǎn)x需要預(yù)測(cè)屬于哪個(gè)分類的時(shí)候宇整,我們用sgn(f(x)),就可以預(yù)測(cè)了芋膘,sgn表示符號(hào)函數(shù)鳞青,當(dāng)f(x) > 0的時(shí)候霸饲,sgn(f(x)) = +1, 當(dāng)f(x) < 0的時(shí)候sgn(f(x)) = –1

通過(guò)幾何學(xué)的知識(shí)臂拓,我們知道點(diǎn) x 到超平面 的距離為:

Paste_Image.png

對(duì)于超平面, 表達(dá)式中的分子為1,
Paste_Image.png

然后得到目標(biāo)函數(shù)

Paste_Image.png

這是一個(gè)拉格朗日優(yōu)化問(wèn)題厚脉,可以通過(guò)拉格朗日乘數(shù)法得到最優(yōu)超平面的權(quán)重向量W和偏置b

Paste_Image.png

三、拉格朗日對(duì)偶


如何確定w和b呢胶惰?
答案是尋找兩條邊界端或極端劃分直線中間的最大間隔(之所以要尋最大間隔是為了能更好的劃分不同類的點(diǎn)傻工,下文你將看到:為尋最大間隔,導(dǎo)出1/2||w||^2孵滞,繼而引入拉格朗日函數(shù)和對(duì)偶變量a中捆,化為對(duì)單一因數(shù)對(duì)偶變量a的求解),從而確定最終的最大間隔分類超平面hyper plane和分類函數(shù)坊饶;

拉格朗日對(duì)偶的原理

Paste_Image.png

上述式子有兩個(gè)條件(等式條件和不等式條件)由此我們定義一般化的拉格朗日公式

Paste_Image.png

由此我們定義一般化的拉格朗日公式

Paste_Image.png

這里的P代表primal泄伪。我們?cè)O(shè)如下約束條件(primal constraints):

Paste_Image.png

如果條件不全部滿足的話,我們總可以調(diào)整αβ使最大值出現(xiàn)正無(wú)窮匿级,即會(huì)出現(xiàn)下面情況(這里比較重要蟋滴,說(shuō)明了為什么要求最大)

Paste_Image.png

因此我們可以得出如下式子:

Paste_Image.png

這樣我們?cè)瓉?lái)要求的min f(w)可以轉(zhuǎn)換成求了

Paste_Image.png

這個(gè)問(wèn)題就是原問(wèn)題的對(duì)偶問(wèn)題,相對(duì)于原問(wèn)題只是更換了min和max的順序痘绎,而一般更換順序的結(jié)果是Max Min(X) <= Min Max(X)津函。然而在這里兩者相等。由此我們可以設(shè)如下

Paste_Image.png
Paste_Image.png

四孤页、最優(yōu)間隔分類器求解(求解過(guò)程尔苦,上兩步是鋪墊)**


在之前為了尋找最有分類器,我們提出了如下優(yōu)化問(wèn)題

Paste_Image.png

在這里我們可以把約束條件改寫(xiě)成如下:

Paste_Image.png
Paste_Image.png

很顯然我們可以看出實(shí)線是最大間隔超平面行施,假設(shè)×號(hào)的是正例蕉堰,圓圈的是負(fù)例。在虛線上的點(diǎn)和在實(shí)線上面的兩個(gè)一共這三個(gè)點(diǎn)稱作支持向量”辏現(xiàn)在我們結(jié)合KKT條件分析下這個(gè)圖。

Paste_Image.png

這個(gè)也就說(shuō)明[圖片上傳中個(gè)gi(w)時(shí)冰寻,w處于可行域的邊界上须教,這時(shí)才是起作用的約束。

1斩芭、那我們現(xiàn)在可以構(gòu)造拉格朗日函數(shù)如下:
Paste_Image.png
2轻腺、接下來(lái)我們對(duì)w和b分別求偏導(dǎo)數(shù)
Paste_Image.png
3、將上式帶回到拉格朗日函數(shù)中得到:
Paste_Image.png
4.優(yōu)化等式
Paste_Image.png
Paste_Image.png
6.最終問(wèn)題
Paste_Image.png

五划乖、核函數(shù) ——高維空間映射贬养,在低維時(shí)空里解決


如下所示,無(wú)法線性標(biāo)示進(jìn)行分割琴庵,但是可以用二次函數(shù)簡(jiǎn)單分割


Paste_Image.png

映射到高維空間误算,可以很容易進(jìn)行分割

Paste_Image.png

在計(jì)算的時(shí)候仰美,它可以讓x和z不用通過(guò)H()映射到高維空間再計(jì)算內(nèi)積,而是直接在低維空間里計(jì)算了儿礼。
我們用K()表示核函數(shù)咖杂,那么核函數(shù)作用就是:K(x,z)=
避開(kāi)了X映射到H(X),Y映射到H(Y)這么一個(gè)過(guò)程

Paste_Image.png

線性核:

Paste_Image.png

高斯核:
通過(guò)調(diào)控參數(shù)σ蚊夫,高斯核具有相當(dāng)?shù)撵`活性
Paste_Image.png

六诉字、SMO算法求解α


Paste_Image.png

要解決的是在參數(shù){α1, α2,...α3}上求最大值W(α)的問(wèn)題,至于xi,yi都是已知數(shù)知纷。C由我們預(yù)先設(shè)定壤圃,也是已知數(shù)。

按照坐標(biāo)上升的思路琅轧,我們首先固定除α1 以外的所有參數(shù)伍绳,然后在α2上求極值。等一下鹰晨,這個(gè)思路有問(wèn)題墨叛,因?yàn)槿绻潭?code>α1以外的所有參數(shù),那么α2 將不再是變量(可以由其他值推出)

Paste_Image.png

SMO的主要步驟如下:

  • 1.選擇連個(gè)α模蜡, 如α1漠趁、α2,選取方法使用啟發(fā)式方法忍疾,固定其他參數(shù)
  • 2.確定極值W闯传,αiαj表示

假設(shè)確定了α1α2卤妒,則:

Paste_Image.png

{α1, α2,...α3}都是已知固定值甥绿,因此為了方便,可將等式右邊標(biāo)記成實(shí)數(shù)值

Paste_Image.png

當(dāng)y(i),y(j) 異號(hào)時(shí)则披,也就是一個(gè)為1共缕,一個(gè)為-1時(shí),他們可以表示成一條直線士复,斜率為1图谷。如下圖:

Paste_Image.png
Paste_Image.png

當(dāng)y(i),y(j) 同號(hào)時(shí)

Paste_Image.png

然后我們打算將α1α2表示:

Paste_Image.png
Paste_Image.png

α2滿足以下條件:

Paste_Image.png

wb求解公式

Paste_Image.png

啟發(fā)式搜索的方法和求b值的公式

Paste_Image.png

[1] http://www.tuicool.com/articles/2aYryeV
[2] https://wizardforcel.gitbooks.io/dm-algo-top10/content/svm-1.html

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末阱洪,一起剝皮案震驚了整個(gè)濱河市便贵,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌冗荸,老刑警劉巖承璃,帶你破解...
    沈念sama閱讀 218,546評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異蚌本,居然都是意外死亡盔粹,警方通過(guò)查閱死者的電腦和手機(jī)隘梨,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,224評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)玻佩,“玉大人出嘹,你說(shuō)我怎么就攤上這事∫Т蓿” “怎么了税稼?”我有些...
    開(kāi)封第一講書(shū)人閱讀 164,911評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)垮斯。 經(jīng)常有香客問(wèn)我郎仆,道長(zhǎng),這世上最難降的妖魔是什么兜蠕? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,737評(píng)論 1 294
  • 正文 為了忘掉前任扰肌,我火速辦了婚禮,結(jié)果婚禮上熊杨,老公的妹妹穿的比我還像新娘曙旭。我一直安慰自己,他們只是感情好晶府,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,753評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布桂躏。 她就那樣靜靜地躺著,像睡著了一般川陆。 火紅的嫁衣襯著肌膚如雪剂习。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 51,598評(píng)論 1 305
  • 那天较沪,我揣著相機(jī)與錄音鳞绕,去河邊找鬼。 笑死尸曼,一個(gè)胖子當(dāng)著我的面吹牛们何,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播控轿,決...
    沈念sama閱讀 40,338評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼冤竹,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了解幽?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 39,249評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤烘苹,失蹤者是張志新(化名)和其女友劉穎躲株,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體镣衡,經(jīng)...
    沈念sama閱讀 45,696評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡霜定,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,888評(píng)論 3 336
  • 正文 我和宋清朗相戀三年档悠,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片望浩。...
    茶點(diǎn)故事閱讀 40,013評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡辖所,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出磨德,到底是詐尸還是另有隱情缘回,我是刑警寧澤,帶...
    沈念sama閱讀 35,731評(píng)論 5 346
  • 正文 年R本政府宣布典挑,位于F島的核電站酥宴,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏您觉。R本人自食惡果不足惜拙寡,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,348評(píng)論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望琳水。 院中可真熱鬧肆糕,春花似錦、人聲如沸在孝。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,929評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)浑玛。三九已至绍申,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間顾彰,已是汗流浹背极阅。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,048評(píng)論 1 270
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留涨享,地道東北人筋搏。 一個(gè)月前我還...
    沈念sama閱讀 48,203評(píng)論 3 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像厕隧,于是被迫代替她去往敵國(guó)和親奔脐。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,960評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容