統(tǒng)計(jì)機(jī)器學(xué)習(xí)-線性支持向量機(jī)與軟間隔最大化

假設(shè)給定一個(gè)特征空間上的訓(xùn)練數(shù)據(jù)集
T= \{(x_1,y_1),(x_2,y_2),\cdots,(x_N,y_N)\}
其中榄檬,x_i\in\mathcal X=\textbf R^n切威,y_i\in\mathcal Y=\{+1,-1 \}i=1,2,\cdots,N丙号,x_i為第i個(gè)特征向量先朦,也稱為實(shí)例,y_ix_i的類標(biāo)記犬缨,當(dāng)y_i=+1時(shí)喳魏,稱x_i為正例;當(dāng)y_i=-1時(shí)怀薛,稱x_i為負(fù)例刺彩,(x_i,y_i)稱為樣本點(diǎn)。再假設(shè)訓(xùn)練數(shù)據(jù)集不是線性可分的枝恋。通常情況是创倔,訓(xùn)練數(shù)據(jù)中有一些特異點(diǎn),將這些特異點(diǎn)除去后焚碌,剩下大部分的樣本點(diǎn)組成的集合是線性可分的畦攘。

線性不可分意味著某些樣本點(diǎn)(x_i,y_i)不能滿足函數(shù)間隔大于等于1的約束條件。為了解決這個(gè)問題十电,可以對每個(gè)樣本點(diǎn)(x_i,y_i)引進(jìn)一個(gè)松弛變量\xi_i\geq0知押,使函數(shù)間隔加上松弛變量大于等于1。這樣鹃骂,約束條件變?yōu)?br> 1-\xi_i-y_i(w\cdot x_i+b)\leq0
目標(biāo)函數(shù)由原來的最小化\frac12||w||^2變成最小化
\frac12||w||^2+C\sum_{i=1}^N\xi_i
C是對誤分類的懲罰台盯,C越大,對誤分類懲罰越大畏线。相對于線性可分支持向量機(jī)的硬間隔最大化静盅,這叫做軟間隔最大化。

于是線性不可分支持向量機(jī)的學(xué)習(xí)的原始問題為凸二次規(guī)劃問題:
\min_{w,b,\xi}\frac12||w||^2+C\sum_{i=1}^N\xi_i\tag1

\mathrm{s.t.}\ \ 1-\xi_i-y_i(w\cdot x_i+b)\leq0,\ \ i=1,2,\cdots,N\tag2

-\xi_i\leq0,\ \ i=1,2,\cdots,N\tag3

可以證明w的解是唯一的寝殴,但b的解可能不唯一蒿叠,而是存在于一個(gè)區(qū)間。證明略杯矩。

假如w^*栈虚,b^*是最優(yōu)化問題(1)-(3)的解,則得到的超平面為
w^*\cdot x+b^*=0\tag4
分類決策函數(shù)為
f(x)=\mathrm{sign}(w^*\cdot x+b^*)\tag5
稱為線性支持向量機(jī)史隆。

對偶的學(xué)習(xí)算法

由原始問題(1)-(3)魂务,首先構(gòu)建拉格朗日函數(shù)
L(w,b,\xi,\alpha,\mu)=\frac12||w||^2+C\sum_{i=1}^N\xi_i+\sum_{i=1}^N\alpha_i(1-\xi_i-y_i(w\cdot x_i+b))-\sum_{i=1}^N\mu_i\xi_i\tag6
其中\alpha_i\geq0\mu_i\geq0泌射,于是原始問題可以寫成
\min_{w,b,\xi}\max_{\alpha,\mu}L(w,b,\xi,\alpha,\mu)
則對偶問題為
\max_{\alpha,\mu}\min_{w,b,\xi}L(w,b,\xi,\alpha,\mu)
首先求解內(nèi)部極小化問題粘姜,求L(w,b,\xi,\alpha,\mu)wb熔酷,\xi的偏導(dǎo)并使其等于0:
\nabla_wL(w,b,\xi,\alpha,\mu)=w-\sum_{i=1}^N\alpha_iy_ix_i=0

\nabla_bL(w,b,\xi,\alpha,\mu)=-\sum_{i=1}^N\alpha_iy_i=0

\nabla_{\xi_i}=C-\alpha_i-\mu_i=0


w=\sum_{i=1}^N\alpha_iy_ix_i\tag7

\sum_{i=1}^N\alpha_iy_i=0\tag8

C-\alpha_i-\mu_i=0\tag9

將公式(7)-(9)代入(6)得到
L(w,b,\xi,\alpha,\mu)=-\frac12\sum_{i=1}^N\sum_{j=1}^N\alpha_i\alpha_jy_iy_j(x_i\cdot x_j)+\sum_{i=1}^N\alpha_i
于是原始的問題(1)-(3)的對偶問題可以寫成
\max_{\alpha}-\frac12\sum_{i=1}^N\sum_{j=1}^N\alpha_i\alpha_jy_iy_j(x_i\cdot x_j)+\sum_{i=1}^N\alpha_i \tag{10}

\mathrm{s.t.}\ \ \sum_{i=1}^N\alpha_iy_i=0\tag{11}

C-\alpha_i-\mu_i=0\tag{12}

\alpha_i\geq0\tag{13}

\mu_i\geq0,\ \ i=1,2,\cdots,N\tag{14}

對其進(jìn)一步改寫孤紧,由公式(12)得
\mu_i=C-\alpha_i
代入公式(14)得
\alpha_i\leq C
所以公式(12)-(14)可以簡寫為
0\leq\alpha_i\leq C,\ \ i=1,2,\cdots,N
再對目標(biāo)函數(shù)取相反數(shù)染突,得到對偶問題
\min_{\alpha}\frac12\sum_{i=1}^N\sum_{j=1}^N\alpha_i\alpha_jy_iy_j(x_i\cdot x_j)-\sum_{i=1}^N\alpha_i \tag{15}

\mathrm{s.t.}\ \ \sum_{i=1}^N\alpha_iy_i=0\tag{16}

0\leq\alpha_i\leq C,\ \ i=1,2,\cdots,N\tag{17}

定理

設(shè)\alpha^*=(\alpha_1^*,\alpha_2^*,\cdots,\alpha_N^*)是對偶問題(15)-(17)的一個(gè)解知给,若存在\alpha^*的一個(gè)分量\alpha_j^*双霍,0\lt\alpha_j^*\lt C鹦倚,則原始問題(1)-(3)的解w^*,b^*可按下式得到:
w^*=\sum_{i=1}^N\alpha_i^*y_ix_i\tag{18}

b^*=y_j-\sum_{i=1}^Ny_i\alpha_i^*(x_i\cdot x_j)\tag{19}

證明略。

于是分離超平面可以寫成
\sum_{i=1}^N\alpha_i^*y_i(x\cdot x_i)+b^*=0
分類決策函數(shù)
f(x)=\mathrm{sign}\bigg(\sum_{i=1}^N\alpha_i^*y(x\cdot x_i)+b^*\bigg)

線性支持向量機(jī)學(xué)習(xí)算法

輸入:訓(xùn)練數(shù)據(jù)集T= \{(x_1,y_1),(x_2,y_2),\cdots,(x_N,y_N) \}押蚤,其中蔑歌,x_i\in\mathcal X=\textbf R^ny_i\in\mathcal Y=\{-1,+1\}揽碘,i=1,2,\cdots,N次屠;

輸出:分離超平面和分類決策函數(shù)。

(1)選擇懲罰參數(shù)C\gt0雳刺,構(gòu)造并求解凸二次規(guī)劃問題
\min_{\alpha}\frac12\sum_{i=1}^N\sum_{j=1}^N\alpha_i\alpha_jy_iy_j(x_i\cdot x_j)-\sum_{i=1}^N\alpha_i

\mathrm{s.t.}\ \ \sum_{i=1}^N\alpha_iy_i=0

0\leq\alpha_i\leq C,\ \ i=1,2,\cdots,N

求的最優(yōu)解\alpha^*=(\alpha_1^*,\alpha_2^*,\cdots,\alpha_N^*)劫灶。

(2)計(jì)算w^*=\sum_{i=1}^N\alpha_iy_ix_i

選擇\alpha^*的一個(gè)分量\alpha_j^*適合條件0\lt\alpha_j^*\lt C,計(jì)算
b^*=y_j-\sum_{i=1}^Ny_i\alpha_i^*(x_i\cdot x_j)
(3)求得分離超平面
w^*\cdot x+b^*=0
分類決策函數(shù):
f(x)=\mathrm{sign}(w^*\cdot x)+b^*

支持向量

由公式
w^*=\sum_{i=1}^N\alpha_i^*y_ix_i
得知\alpha_i^*\neq0的樣本點(diǎn)x_i能夠影響支持向量機(jī)的參數(shù)掖桦。而0\leq\alpha_i^*\leq C本昏,所以支持向量為0\lt\alpha_i^*\leq C的樣本點(diǎn)x_i。這些支持向量分布在間隔邊界上滞详、間隔邊界與分離超平面之間或者在分離超平面誤分一側(cè)凛俱。若\alpha_i^*\lt C,則\xi_i=0(由KKT條件可以推出料饥,由于\xi^*的結(jié)果不影響分離超平面蒲犬,所以一般也不去算,其計(jì)算過程略)岸啡,支持向量恰好落在間隔邊界上原叮;若\alpha_i^*=C0\lt\xi_i\lt1巡蘸,則分類正確奋隶,支持向量在間隔邊界與分離超平面之間;若\alpha_i^*=C悦荒,\xi_i=1唯欣,則x_i在分離超平面上;若\alpha_i^*=C搬味,\xi_i\gt1境氢,則x_i在分離超平面誤分一側(cè)。

合頁損失函數(shù)

線性支持向量機(jī)的學(xué)習(xí)還等價(jià)于最小化以下目標(biāo)函數(shù):
\min_{w,b}\sum_{i=1}^N[1-y_i(w\cdot x_i+b)]_++\lambda||w||^2\tag{20}
證明過程略碰纬。其中目標(biāo)函數(shù)的第一項(xiàng)是經(jīng)驗(yàn)損失或經(jīng)驗(yàn)風(fēng)險(xiǎn)萍聊,第二項(xiàng)是正則化項(xiàng)。函數(shù)
L(y(w\cdot x+b))=[1-y(w\cdot x+b)]_+
稱為合頁損失函數(shù)悦析。下標(biāo)"+"表示ReLU函數(shù)寿桨,由于函數(shù)形狀像一個(gè)合頁,故名合頁損失函數(shù)强戴。合頁損失函數(shù)相比感知機(jī)的0-1損失亭螟,不僅要求分類正確挡鞍,還要求確信度足夠高時(shí)(函數(shù)間隔大于等于1)損失才是0,所以支持向量機(jī)的學(xué)習(xí)比感知機(jī)有更高的要求媒佣。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末匕累,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子默伍,更是在濱河造成了極大的恐慌,老刑警劉巖衰琐,帶你破解...
    沈念sama閱讀 211,376評論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件也糊,死亡現(xiàn)場離奇詭異,居然都是意外死亡羡宙,警方通過查閱死者的電腦和手機(jī)狸剃,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,126評論 2 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來狗热,“玉大人钞馁,你說我怎么就攤上這事∧涔危” “怎么了僧凰?”我有些...
    開封第一講書人閱讀 156,966評論 0 347
  • 文/不壞的土叔 我叫張陵,是天一觀的道長熟丸。 經(jīng)常有香客問我训措,道長,這世上最難降的妖魔是什么光羞? 我笑而不...
    開封第一講書人閱讀 56,432評論 1 283
  • 正文 為了忘掉前任绩鸣,我火速辦了婚禮,結(jié)果婚禮上纱兑,老公的妹妹穿的比我還像新娘呀闻。我一直安慰自己,他們只是感情好潜慎,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,519評論 6 385
  • 文/花漫 我一把揭開白布捡多。 她就那樣靜靜地躺著,像睡著了一般勘纯。 火紅的嫁衣襯著肌膚如雪局服。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,792評論 1 290
  • 那天驳遵,我揣著相機(jī)與錄音淫奔,去河邊找鬼。 笑死堤结,一個(gè)胖子當(dāng)著我的面吹牛唆迁,可吹牛的內(nèi)容都是我干的鸭丛。 我是一名探鬼主播,決...
    沈念sama閱讀 38,933評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼唐责,長吁一口氣:“原來是場噩夢啊……” “哼鳞溉!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起鼠哥,我...
    開封第一講書人閱讀 37,701評論 0 266
  • 序言:老撾萬榮一對情侶失蹤熟菲,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后朴恳,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體抄罕,經(jīng)...
    沈念sama閱讀 44,143評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,488評論 2 327
  • 正文 我和宋清朗相戀三年于颖,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了呆贿。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,626評論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡森渐,死狀恐怖做入,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情同衣,我是刑警寧澤竟块,帶...
    沈念sama閱讀 34,292評論 4 329
  • 正文 年R本政府宣布,位于F島的核電站乳怎,受9級特大地震影響彩郊,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜蚪缀,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,896評論 3 313
  • 文/蒙蒙 一秫逝、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧询枚,春花似錦违帆、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,742評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至渊抄,卻和暖如春尝胆,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背护桦。 一陣腳步聲響...
    開封第一講書人閱讀 31,977評論 1 265
  • 我被黑心中介騙來泰國打工含衔, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,324評論 2 360
  • 正文 我出身青樓贪染,卻偏偏與公主長得像缓呛,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子杭隙,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,494評論 2 348