SVM(2) 之 線性可分支持向量機(jī)學(xué)習(xí)方法

上一篇大概講了一下拉格朗日對(duì)偶法以及KKT條件卵迂,這一篇推導(dǎo)一下SVM的公式。下一篇舉個(gè)例子绒净,差不多就結(jié)束了见咒。


線性可分支持向量機(jī)

首先,考慮一下原始問題


我們其實(shí)是想找出一個(gè)分割面來疯溺,把兩個(gè)空間的元素一一分開论颅。
假設(shè),這個(gè)分割面為:
w^*·x+b^* = 0

間隔

間隔分為兩種囱嫩,函數(shù)間隔和幾何間隔恃疯。

預(yù)備知識(shí)

設(shè)直線 L 的方程為 Ax+By+C=0,點(diǎn) P 的坐標(biāo)為(X_0,Y_0)墨闲,則點(diǎn) P 到直線 L 的距離為

接下來的很多地方會(huì)看到這個(gè)式子的影子今妄。

函數(shù)間隔

  • 前提
    一般來說,一個(gè)點(diǎn)距離分離超平面的遠(yuǎn)近可以表示分類預(yù)測(cè)的確定成都鸳碧,即距離越遠(yuǎn)盾鳞,越確定,距離越近瞻离,越不確定腾仅。
  • 距離
    給定分割平面: w·x+b = 0 ,那么把點(diǎn) x 代入 |w·x+b| 其實(shí)就是點(diǎn)x距離超平面的距離套利。(回憶一下預(yù)備知識(shí)上邊那個(gè)式子)
  • 概念
    w·x+b 與 標(biāo)記y的符號(hào)是否一致推励,表示分類是否正確鹤耍。所以可以使用 y(w·x+b)表示分類正確性及確信度。

對(duì)于一個(gè)訓(xùn)練樣本(x^{(i)}, y^{(i)}), 我們定義它到超平面(w,b)的函數(shù)間隔為:
\hat{\gamma}_i=y_{i}(w^Tx_{i}+b)
超平面的定義验辞,其實(shí)只需要最核心部分的向量稿黄,就是被稱作支持向量的點(diǎn)。
\hat{\gamma}_i=\min_i\hat{\gamma}_{i}.

幾何間隔

\gamma_{i}=y_{i}(\frac{w^T}{\Vert w\Vert}x_{i}+\frac跌造{\Vert w\Vert})
同樣的
\gamma=\min_i\gamma_{i}

那么幾何間隔與函數(shù)間隔是什么關(guān)系呢?
\gamma^{(i)}=\frac{\hat{\gamma}^{(i)}}{\Vert w\Vert} 增加了一個(gè)||w|| 保證函數(shù)間隔不會(huì)亂跑

間隔最大化

原始約束最優(yōu)化問題

  • 最大間隔超平面
    我們的目標(biāo)是求得一個(gè)幾何間隔最大的超平面杆怕,即最大間隔超平面。

\begin{align} \max_{w,b} &\quad \gamma \\ \\ s.t. &\quad y_{i}(\frac{w}{\Vert w\Vert}\cdot x_i+ \frac壳贪{\Vert w\Vert})\ge\gamma, \quad i=1,2,…,N \\ \end{align}

  • 幾何間隔 換成 函數(shù)間隔

因?yàn)閹缀伍g隔太復(fù)雜 ( 其實(shí)就是為了一會(huì)推公式方便
\begin{align} \max_{w,b} &\quad \frac{\hat{\gamma}}{\Vert w\Vert} \\ \\ s.t. &\quad y_{i}({w}\cdot x_i+ 陵珍)\ge\hat{\gamma}, \quad i=1,2,…,N \\ \end{align}

  • \hat{\gamma}=1
    因?yàn)楹瘮?shù)間隔取多少,并不影響該 最優(yōu)化問題撑碴,又由于最大化\frac{1}{\Vert w\Vert} 與最小化 \frac{1}{2}\Vert w\Vert^2 是等價(jià)的撑教,于是可獲得
    \begin{align} \min_{w,b} &\quad {\frac12}||w||^2 \\ \\ s.t. &\quad y_{i}(w\cdot x_{i}+b)-1\ge 0 \end{align}

為什么要搞這么多次變換,因?yàn)槔窭嗜粘俗臃ǖ慕Y(jié)構(gòu)限制醉拓,詳情見SVM(1) 之 拉格朗日乘子法和KKT條件

需要注意的一點(diǎn)是這里是\ge伟姐,使用拉格朗日算子法的時(shí)候留意。

對(duì)偶算法

拉格朗日函數(shù)

首先構(gòu)造拉格朗日函數(shù)

\mathcal{L}(w, b, \alpha)=\frac12||w||^2-\sum_{i=1}^m\alpha_i[y^{(i)}(w^Tx^{(i)}+b)-1].

這里負(fù)號(hào)和注意 有關(guān)

\min_{w,b}\mathcal{L}(w,b,\alpha)

\frac{\partial\mathcal{L}}{\partial w}=w-\sum_{i=1}^m\alpha_iy^{(i)}x^{(i)}=0, \\ \frac{\partial\mathcal{L}}{\partial b}=0-\sum_{i=1}^m\alpha_iy^{(i)}=0

w=\sum_{i=1}^m\alpha_iy^{(i)}x^{(i)}, \\ \sum_{i=1}^m\alpha_iy^{(i)}=0

再將求得的w帶回\mathcal{L}(w,b,\alpha)可得到\mathop\min_{w,b}\mathcal{L}(w,b,\alpha)
\begin{align} & \mathop\min_{w,b}\mathcal{L}(w,b,\alpha) \\ & =\frac12(\sum_i^m\alpha_iy_ix_i)(\sum_j^m\alpha_jy_jx_j) - (\sum_i^m\alpha_iy_ix_i)(\sum_j^m\alpha_jy_jx_j)+(\sum_i^m\alpha_iy_ib) + \sum_i^m\alpha_i \\ & = -\frac12(\sum_i^m\alpha_iy_ix_i)(\sum_j^m\alpha_jy_jx_j) + b\sum_i^m\alpha_iy_i + \sum_i^m\alpha_i \\ & = \sum_i^m\alpha_i - \frac12\sum_i^m\sum_j^m\alpha_i\alpha_jy_iy_jx_i^Tx_j \\ & = \sum_i^m\alpha_i - \frac12\sum_i^m\sum_j^m\alpha_i\alpha_jy_iy_j\langle x_i,x_j\rangle \end{align}

\max_{\alpha}\min_{w,b}\mathcal{L}(w,b,\alpha)

\left \{ \begin{split} \max \limits_{\alpha} & -\frac{1}{2} \sum_{i=1}^N \sum_{j=1}^N \alpha_i \alpha_j y_i y_j(x_i \cdot x_j) + \sum_{i=1}^N \alpha_i \\ s.t. & \sum_{i=1}^N \alpha_i y_i = 0 \\ & \alpha_i \ge 0, i = 1,2,\cdots,N \end{split} \right.
將極大轉(zhuǎn)換成極小亿卤,得到下面與之等價(jià)的對(duì)偶最優(yōu)化問題:
\begin{equation} \left \{ \begin{split} \min \limits_{\alpha} & \frac{1}{2}\sum_{i=1}^N \sum_{j=1}^N \alpha_i \alpha_j y_i y_j(x_i \cdot x_j) - \sum_{i=1}^N \alpha_i \\ s.t. & \sum_{i=1}^N \alpha_i y_i = 0 \\ & \alpha_i \ge 0, i = 1,2,\cdots,N \end{split} \right. \end{equation}

原始問題對(duì)w求導(dǎo)的時(shí)候得到了 第一個(gè)式子愤兵,把第一個(gè)式子帶回wx+b=y得到第二個(gè)式子
\begin{equation} \left \{ \begin{split} w^{*} &= \sum_{i=1}^N \alpha_i^{*} y_i x_i \\ b^{*} &= y_j - \sum_{i=1}^N \alpha_i^{*} y_i (x_i \cdot x_j) \end{split} \right. \end{equation}

綜上所述,對(duì)于給定的線性可分訓(xùn)練數(shù)據(jù)集排吴,可以首先求對(duì)偶問題(2)的解\alpha^{*}秆乳;再利用上式求得原始問題的解w^{*},b^{*};從而得到分離超平面及分類決策函數(shù)钻哩。這種算法稱為線性可分支持向量機(jī)的對(duì)偶學(xué)習(xí)算法屹堰,是線性可分支持向量機(jī)學(xué)習(xí)的基本算法。

小結(jié):線性可分支持向量機(jī)對(duì)偶學(xué)習(xí)算法

輸入:線性可分訓(xùn)練數(shù)據(jù)集
T = \{(x_1,y_1),(x_2,y_2),\cdots,(x_N,y_N) \}
其中街氢,x_i \in R^n, y_i \in \{+1,-1\}, i = 1,2,\cdots, N 扯键。

輸出:最大間隔分離超平面和分類決策函數(shù)。

(1) 構(gòu)造并求解約束最優(yōu)化問題:
\left \{ \begin{split} \min \limits_{\alpha} & \frac{1}{2} \sum_{i=1}^N \sum_{j=1}^N \alpha_i \alpha_j y_i y_j(x_i \cdot x_j) - \sum_{i=1}^N \alpha_i \\ s.t. & \sum_{i=1}^N \alpha_i y_i = 0 \\ & \alpha_i \ge 0, i = 1,2,\cdots,N \end{split} \right.
用SMO算法求 \alpha^{*}=(\alpha_1^{*},\alpha_2^{*},\cdots,\alpha_N^{*})^T

(2 )計(jì)算
w^{*} = \sum_{i=1}^N \alpha_i^{*} y_i x_i
b^{*} = y_j - \sum_{i=1}^N \alpha_i^{*} y_i (x_i \cdot x_j)

(3) 求得分離超平面
w^{*} \cdot x + b^{*} = 0
分類決策函數(shù):
f(x) = sign(w^{*} \cdot x + b^{*})

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末珊肃,一起剝皮案震驚了整個(gè)濱河市荣刑,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌伦乔,老刑警劉巖厉亏,帶你破解...
    沈念sama閱讀 211,639評(píng)論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異烈和,居然都是意外死亡爱只,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,277評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門招刹,熙熙樓的掌柜王于貴愁眉苦臉地迎上來恬试,“玉大人沥匈,你說我怎么就攤上這事⊥妫” “怎么了?”我有些...
    開封第一講書人閱讀 157,221評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵缰儿,是天一觀的道長(zhǎng)畦粮。 經(jīng)常有香客問我,道長(zhǎng)乖阵,這世上最難降的妖魔是什么宣赔? 我笑而不...
    開封第一講書人閱讀 56,474評(píng)論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮瞪浸,結(jié)果婚禮上儒将,老公的妹妹穿的比我還像新娘。我一直安慰自己对蒲,他們只是感情好钩蚊,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,570評(píng)論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著蹈矮,像睡著了一般砰逻。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上泛鸟,一...
    開封第一講書人閱讀 49,816評(píng)論 1 290
  • 那天蝠咆,我揣著相機(jī)與錄音,去河邊找鬼北滥。 笑死刚操,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的再芋。 我是一名探鬼主播菊霜,決...
    沈念sama閱讀 38,957評(píng)論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼祝闻!你這毒婦竟也來了占卧?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,718評(píng)論 0 266
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤联喘,失蹤者是張志新(化名)和其女友劉穎华蜒,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體豁遭,經(jīng)...
    沈念sama閱讀 44,176評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡叭喜,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,511評(píng)論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了蓖谢。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片捂蕴。...
    茶點(diǎn)故事閱讀 38,646評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡譬涡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出啥辨,到底是詐尸還是另有隱情涡匀,我是刑警寧澤,帶...
    沈念sama閱讀 34,322評(píng)論 4 330
  • 正文 年R本政府宣布溉知,位于F島的核電站陨瘩,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏级乍。R本人自食惡果不足惜舌劳,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,934評(píng)論 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望玫荣。 院中可真熱鬧甚淡,春花似錦、人聲如沸捅厂。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,755評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)恒傻。三九已至脸侥,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間盈厘,已是汗流浹背睁枕。 一陣腳步聲響...
    開封第一講書人閱讀 31,987評(píng)論 1 266
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留沸手,地道東北人外遇。 一個(gè)月前我還...
    沈念sama閱讀 46,358評(píng)論 2 360
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像契吉,于是被迫代替她去往敵國(guó)和親跳仿。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,514評(píng)論 2 348