支持向量機(一)——線性可分支持向量機導(dǎo)出

〇、說明

支持向量機(Support Vector Machine,SVM)是監(jiān)督學(xué)習(xí)中非常經(jīng)典的算法快耿。筆者主要參考學(xué)習(xí)的是李航老師《統(tǒng)計學(xué)習(xí)方法(第二版)》[1]和周志華老師的西瓜書《機器學(xué)習(xí)》[2]。

如有錯誤疏漏仪媒,煩請指正迫像。如要轉(zhuǎn)載,請聯(lián)系筆者疫铜,hpfhepf@gmail.com。

一双谆、問題描述

提前說明一下壳咕,為什么把看起來這么簡單的東西,專門寫一篇筆記顽馋,因為我覺得這個很重要谓厘,相當(dāng)于理解支持向量機的一把鑰匙,只有理解了支持向量機是怎么來的寸谜,才有可能理解后面更復(fù)雜的內(nèi)容竟稳。

考慮一個二類問題。給定一個特征空間上的訓(xùn)練數(shù)據(jù)集

 T=\{(x_{1},y_{1}),(x_{2},y_{2}),…(x_{N},y_{N})\}

其中程帕,x_{i}\in \mathcal X = \mathbb{R}^n住练,y_{i}\in \mathcal{Y}=\{+1,-1\}地啰,i=1,2,\cdot \cdot \cdot ,N愁拭。x_{i}為第i個特征向量,也稱為實例亏吝,y_{i}x_{i}的類標(biāo)記岭埠。當(dāng)y_{i}=+1時,稱x_{i}為正例;當(dāng)y_{i}=-1時惜论,稱x_{i}為負例许赃。(x_{i},y_{i})稱為樣本點。

假設(shè)訓(xùn)練數(shù)據(jù)集是線性可分的馆类。

學(xué)習(xí)的目標(biāo)是在特征空間找到一個分類超平面混聊,能將實例分到不同的類。分離超平面對應(yīng)于方程w \cdot x+b=0乾巧,它由法向量w和截距b決定句喜,可用(w,b)表示。分離超平面將特征空間劃分為兩部分沟于,一部分是正類咳胃,一部分是負類。法向量指向的一側(cè)為正類旷太,另一側(cè)為負類展懈。

對于線性可分的訓(xùn)練數(shù)據(jù)集,存在無窮多個符合條件的分類超平面供璧,那到底哪一個是最好的呢存崖?

二、線性可分支持向量機

對于無窮多個分類超平面睡毒,直觀上來說金句,位于兩類樣本中間的那個超平面可能就是最好的超平面,如圖1中粗線條表示的分類超平面吕嘀。

圖1[2]

樣本點x_{i} 到分類超平面(w,b)的距離為r=\frac{1}{||w||} |w\cdot x_{i} +b|违寞。因此可以定義求取此最優(yōu)超平面的問題為如下的最優(yōu)化問題

優(yōu)化問題一:

\begin{split}&\mathop{max}\limits_{w,b}  \quad & \gamma \\&s.t. & \frac{1}{||w||}(w\cdot x_{i}+b) \geq \gamma ,\ \ i=1,2,\dots,N\end{split} \tag{1}

這樣的優(yōu)化問題比較直觀,但不容易求解偶房。

對于如上所述的訓(xùn)練數(shù)據(jù)集趁曼,我們可以構(gòu)造分類超平面(w,b),使得

\begin{cases}    w\cdot x_{i}+b> 0,       & \quad y_{i}=+1\\    w\cdot x_{i}+b</p><p>進一步棕洋,<img class=

進一步挡闰,\exists \varsigma >0,使得

\begin{cases}    w\cdot x_{i}+b\geq \varsigma ,       & \quad y_{i}=+1\\    w\cdot x_{i}+b\leq -\varsigma ,       & \quad y_{i}=-1  \end{cases}\tag{3}

這是推導(dǎo)過程中的關(guān)鍵一步掰盘,在周志華老師《機器學(xué)習(xí)》[2]書中的側(cè)邊欄給出摄悯,但不夠清晰。

(3)式中愧捕,兩個不等式兩邊同時除以\varsigma 奢驯,縮放后的系數(shù)仍然用w,b表示次绘,則有

\begin{cases}    w\cdot x_{i}+b\geq 1 ,       & \quad y_{i}=+1\\    w\cdot x_{i}+b\leq -1 ,       & \quad y_{i}=-1  \end{cases}\tag{4}

如圖2所示瘪阁,距離超平面最近的幾個訓(xùn)練樣本使得(4)式中等號成立撒遣,這些樣本被稱為“支持向量”。兩個不同類的支持向量到分類超平面的距離之和為\gamma =\frac{2}{||w||} 管跺,稱之為“間隔”义黎。

圖2[2]

此時,優(yōu)化問題一(式(1))等價于

優(yōu)化問題二:

\begin{split}&\mathop{max}\limits_{w,b}  \quad & \frac{2}{||w||} \\&s.t. & y_{i}(w\cdot x_{i}+b) \geq 1,\ \ i=1,2,\dots,N\end{split} \tag{5}

等價于

優(yōu)化問題三:

\begin{split}&\mathop{min}\limits_{w,b}  \quad & \frac{1}{2} ||w||^2 \\&s.t. & y_{i}(w\cdot x_{i}+b) \geq 1,\ \ i=1,2,\dots,N\end{split} \tag{6}

這是支持向量機的基本型豁跑。

求得優(yōu)化問題三(式(6))的最優(yōu)解(w^*,b^* )廉涕,就得到最優(yōu)分類超平面

w^*\cdot x+b^* =0 \tag{7}

?對應(yīng)的分類決策函數(shù)為

f(x)=sign(w^* \cdot x +b^*) \tag{8}

以上推導(dǎo)過程參考周志華老師《機器學(xué)習(xí)》的思路。李航老師《統(tǒng)計學(xué)習(xí)方法(第二版)》使用的是函數(shù)間隔和幾何間隔的思路來推導(dǎo)的艇拍。

三火的、附錄

A、參考

[1]淑倾、《統(tǒng)計學(xué)習(xí)方法(第二版)》馏鹤,李航著,清華大學(xué)出版社

[2]娇哆、《機器學(xué)習(xí)》湃累,周志華著,清華大學(xué)出版社

B碍讨、相關(guān)目錄

[a]治力、支持向量機(一)——線性可分支持向量機導(dǎo)出

[b]、支持向量機(二)——線性可分支持向量機求解

[c]勃黍、支持向量機(三)——線性支持向量機

[d]宵统、支持向量機(四)——核方法

[e]、支持向量機(五)——SMO算法

C覆获、時間線

2020-05-27 第一次發(fā)布

2020-06-06 修改問題描述和圖片來源

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末马澈,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子弄息,更是在濱河造成了極大的恐慌痊班,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,402評論 6 499
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件摹量,死亡現(xiàn)場離奇詭異涤伐,居然都是意外死亡,警方通過查閱死者的電腦和手機缨称,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,377評論 3 392
  • 文/潘曉璐 我一進店門凝果,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人睦尽,你說我怎么就攤上這事器净。” “怎么了骂删?”我有些...
    開封第一講書人閱讀 162,483評論 0 353
  • 文/不壞的土叔 我叫張陵掌动,是天一觀的道長。 經(jīng)常有香客問我宁玫,道長粗恢,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,165評論 1 292
  • 正文 為了忘掉前任欧瘪,我火速辦了婚禮眷射,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘佛掖。我一直安慰自己妖碉,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,176評論 6 388
  • 文/花漫 我一把揭開白布芥被。 她就那樣靜靜地躺著欧宜,像睡著了一般。 火紅的嫁衣襯著肌膚如雪拴魄。 梳的紋絲不亂的頭發(fā)上冗茸,一...
    開封第一講書人閱讀 51,146評論 1 297
  • 那天,我揣著相機與錄音匹中,去河邊找鬼夏漱。 笑死,一個胖子當(dāng)著我的面吹牛顶捷,可吹牛的內(nèi)容都是我干的挂绰。 我是一名探鬼主播,決...
    沈念sama閱讀 40,032評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼服赎,長吁一口氣:“原來是場噩夢啊……” “哼葵蒂!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起重虑,我...
    開封第一講書人閱讀 38,896評論 0 274
  • 序言:老撾萬榮一對情侶失蹤刹勃,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后嚎尤,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體荔仁,經(jīng)...
    沈念sama閱讀 45,311評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,536評論 2 332
  • 正文 我和宋清朗相戀三年芽死,在試婚紗的時候發(fā)現(xiàn)自己被綠了乏梁。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,696評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡关贵,死狀恐怖遇骑,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情揖曾,我是刑警寧澤落萎,帶...
    沈念sama閱讀 35,413評論 5 343
  • 正文 年R本政府宣布亥啦,位于F島的核電站,受9級特大地震影響练链,放射性物質(zhì)發(fā)生泄漏翔脱。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,008評論 3 325
  • 文/蒙蒙 一媒鼓、第九天 我趴在偏房一處隱蔽的房頂上張望届吁。 院中可真熱鬧,春花似錦绿鸣、人聲如沸疚沐。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽亮蛔。三九已至,卻和暖如春擎厢,著一層夾襖步出監(jiān)牢的瞬間尔邓,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,815評論 1 269
  • 我被黑心中介騙來泰國打工锉矢, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留梯嗽,地道東北人。 一個月前我還...
    沈念sama閱讀 47,698評論 2 368
  • 正文 我出身青樓沽损,卻偏偏與公主長得像灯节,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子绵估,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,592評論 2 353