【機(jī)器學(xué)習(xí)】(六)支持向量機(jī)

支持向量機(jī)基本模型

支持向量機(jī)的基本思想是,在如下的樣本集中:


image

基于訓(xùn)練集D在樣本空間中找到一個(gè)劃分超平面,將不同類別的樣本分開

劃分超平面可以表示成如下的線性方程:


image

其中w為法向量,b為位移項(xiàng)瞭郑,空間內(nèi)任意一點(diǎn)到以上超平面的距離為:


image

則有
image

距離超平面最近的幾個(gè)訓(xùn)練樣本點(diǎn)使得上式的等號(hào)成立勿锅,它們被稱為支持向量(support vector),兩個(gè)異類支持向量到超平面的距離之和為:

image

稱之為間隔(margin)

image

支持向量機(jī)的目的即找到最大間隔(maximum margin)的劃分超平面切厘,即解如下的不等式約束的凸優(yōu)化問題:

image

等價(jià)于:

image

上述模型即支持向量機(jī)(Support Vector Machine,SVM)的基本模型

SMO算法

對(duì)偶問題求解

支持向量機(jī)的基本模型是一個(gè)凸二次規(guī)劃(convex quadratic programming)問題懊缺,可以使用拉格朗日乘子得到其對(duì)偶問題(dual problem)從而求解

對(duì)于式子:


image

對(duì)每一條約束增加拉格朗日乘子疫稿,得到該問題的拉格朗日函數(shù):


image

從而得到對(duì)偶問題為:
image

上述過程的KKT(Karush-Kuhn-Tucker)方程為:


image

可以求解支持向量機(jī)的模型

支持向量機(jī)有一個(gè)重要性質(zhì):訓(xùn)練完成后,大部分的訓(xùn)練樣本都不需保留鹃两,最終模型僅與支持向量有關(guān)

SMO算法

為了求解該對(duì)偶問題遗座,SMO(Sequential Minimal Optimization)算法是一個(gè)很高效的算法,其基本思路是俊扳,先固定 ai 之外的所有參數(shù)途蒋,然后求 ai 上的極值。由于存在約束 Σaiyi=0 馋记,若固定 ai 之外的其他變量号坡,則 ai 可由其他變量導(dǎo)出。于是梯醒,SMO每次選擇兩個(gè)變量 ai 和 aj 宽堆,并固定其他參數(shù)。在參數(shù)初始化后冤馏,SMO不斷執(zhí)行如下兩個(gè)步驟直至收斂:

  • 選取一對(duì)需更新的變量 ai 和 aj
  • 固定 ai 和 aj 以外的參數(shù)日麸,求解對(duì)偶問題獲得更新后的 ai 和 aj

支持向量機(jī)的超平面中的偏移量 b 的求算方式為:


image

軟間隔與正則化

軟間隔支持向量機(jī)

并不是每一組訓(xùn)練集在特種空間內(nèi)都是線性可分的,為了緩解該問題逮光,在有些時(shí)候可以允許支持向量機(jī)在一些樣本上出錯(cuò)代箭,使用軟間隔(soft margin)的方式:

image

軟間隔指允許某些樣本不滿足如下的約束條件:


image

但在最大化間隔的同時(shí)也使得不滿足約束的樣本應(yīng)該盡可能的少,于是優(yōu)化目標(biāo)可以寫為:


image

其中涕刚,C>0嗡综,為常數(shù),C為無窮大時(shí)杜漠,上式要求所有樣本均滿足約束條件极景,C取有限值時(shí)察净,上式允許一些樣本不滿足約束條件。

l0/1是“0/1損失函數(shù)”:


image

一些替代損失(surrogate loss)如下:

image

圖像如下:

image

引入松弛變量(slack variables)可以改寫式子成為:

image

解以上的二次規(guī)劃問題盼樟,依然使用對(duì)偶函數(shù)法氢卡,得到其拉格朗日函數(shù)為:


image

對(duì)偶問題為:


image

KKT方程為:
image

優(yōu)化目標(biāo)的一般形式

優(yōu)化目標(biāo)的一般形式為:第一項(xiàng)用來描述劃分超平面的間隔大小,另一項(xiàng)用來表述訓(xùn)練集上的誤差:


image
  • 第一項(xiàng)稱為結(jié)構(gòu)風(fēng)險(xiǎn)(structural risk)晨缴,用于描述模型的某些性質(zhì)
  • 第二項(xiàng)稱為經(jīng)驗(yàn)風(fēng)險(xiǎn)(empirical risk)译秦,用于描述模型與訓(xùn)練數(shù)據(jù)的契合程度
  • C用于對(duì)二者進(jìn)行折中

支持向量回歸

考慮回歸問題,給定樣本


image

希望得到一個(gè)回歸模型:


image

使得y和f(x)盡可能接近击碗,w和b是待定參數(shù)

支持向量回歸(Support Vector Rrgression筑悴,SVR)假設(shè)能容忍f(x)和y之間有一個(gè)偏差,當(dāng)f(x)和y之間的差別大于該偏差的時(shí)候才計(jì)算損失稍途,相當(dāng)于以f(x)為中心構(gòu)建了一個(gè)寬度為兩倍偏差的間隔帶阁吝,若訓(xùn)練樣本落入此間隔帶則認(rèn)為模型預(yù)測(cè)正確

image

SVR問題可以表示為:


image

其中的l為不敏感損失函數(shù)(insensitive loss function)


image

引入松弛變量后可以重寫為:
image

依然可以使用對(duì)偶問題求解

全文參考:周志華 著 《機(jī)器學(xué)習(xí)》


轉(zhuǎn)載請(qǐng)注明出處,本文永久更新鏈接:小天才的雜貨鋪-個(gè)人博客

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末械拍,一起剝皮案震驚了整個(gè)濱河市突勇,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌殊者,老刑警劉巖与境,帶你破解...
    沈念sama閱讀 212,599評(píng)論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異猖吴,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)挥转,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,629評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門海蔽,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人绑谣,你說我怎么就攤上這事党窜。” “怎么了借宵?”我有些...
    開封第一講書人閱讀 158,084評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵幌衣,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我壤玫,道長(zhǎng)豁护,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,708評(píng)論 1 284
  • 正文 為了忘掉前任欲间,我火速辦了婚禮楚里,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘猎贴。我一直安慰自己班缎,他們只是感情好蝴光,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,813評(píng)論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著达址,像睡著了一般蔑祟。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上沉唠,一...
    開封第一講書人閱讀 50,021評(píng)論 1 291
  • 那天疆虚,我揣著相機(jī)與錄音,去河邊找鬼右冻。 笑死装蓬,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的纱扭。 我是一名探鬼主播牍帚,決...
    沈念sama閱讀 39,120評(píng)論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼乳蛾!你這毒婦竟也來了暗赶?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,866評(píng)論 0 268
  • 序言:老撾萬榮一對(duì)情侶失蹤肃叶,失蹤者是張志新(化名)和其女友劉穎蹂随,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體因惭,經(jīng)...
    沈念sama閱讀 44,308評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡岳锁,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,633評(píng)論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了蹦魔。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片激率。...
    茶點(diǎn)故事閱讀 38,768評(píng)論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖勿决,靈堂內(nèi)的尸體忽然破棺而出乒躺,到底是詐尸還是另有隱情,我是刑警寧澤低缩,帶...
    沈念sama閱讀 34,461評(píng)論 4 333
  • 正文 年R本政府宣布嘉冒,位于F島的核電站,受9級(jí)特大地震影響咆繁,放射性物質(zhì)發(fā)生泄漏讳推。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,094評(píng)論 3 317
  • 文/蒙蒙 一么介、第九天 我趴在偏房一處隱蔽的房頂上張望娜遵。 院中可真熱鬧,春花似錦壤短、人聲如沸设拟。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,850評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽纳胧。三九已至镰吆,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間跑慕,已是汗流浹背万皿。 一陣腳步聲響...
    開封第一講書人閱讀 32,082評(píng)論 1 267
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留核行,地道東北人牢硅。 一個(gè)月前我還...
    沈念sama閱讀 46,571評(píng)論 2 362
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像芝雪,于是被迫代替她去往敵國和親减余。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,666評(píng)論 2 350

推薦閱讀更多精彩內(nèi)容