〇枝缔、說(shuō)明
支持向量機(jī)(Support Vector Machine,SVM)是監(jiān)督學(xué)習(xí)中非常經(jīng)典的算法开仰。筆者主要參考學(xué)習(xí)的是李航老師《統(tǒng)計(jì)學(xué)習(xí)方法(第二版)》[1]和周志華老師的西瓜書(shū)《機(jī)器學(xué)習(xí)》[2]役电。
如有錯(cuò)誤疏漏惊科,煩請(qǐng)指正科阎。如要轉(zhuǎn)載闯两,請(qǐng)聯(lián)系筆者俘枫,hpfhepf@gmail.com腥沽。
一、問(wèn)題引出
一方面鸠蚪,線性可分支持向量機(jī)只適用于線性可分的訓(xùn)練數(shù)據(jù)集今阳,對(duì)于線性不可分的訓(xùn)練數(shù)據(jù)集則是無(wú)能為力的师溅。
另一方面,即使訓(xùn)練數(shù)據(jù)集線性可分盾舌,線性可分支持向量機(jī)強(qiáng)依賴于離分類超平面最近的樣本[3]墓臭,過(guò)擬合的風(fēng)險(xiǎn)很大。
這時(shí)候就需要有一定容錯(cuò)能力的分類模型妖谴,線性支持向量機(jī)窿锉,或者叫軟間隔支持向量機(jī),就可以做到這樣的容錯(cuò)性膝舅。
二嗡载、模型描述
這里我采用周志華老師西瓜書(shū)[2]的思路來(lái)整理這部分。
對(duì)于線性可分支持向量機(jī)仍稀,要求所有樣本滿足以下約束
而軟間隔則允許某些樣本不滿足這樣的約束洼滚。
在最大化間隔的同時(shí),不滿足約束的樣本要盡量少技潘。此時(shí)遥巴,優(yōu)化目標(biāo)可以寫(xiě)為
其中,是一般化的損失函數(shù)享幽,
被稱作懲罰參數(shù)铲掐,調(diào)節(jié)間隔最大化和參數(shù)懲罰這二者關(guān)系。
我們先看懲罰參數(shù)值桩。當(dāng)
值較大時(shí)對(duì)誤分類懲罰較大摆霉,特別地,當(dāng)C取無(wú)窮大時(shí)颠毙,所有樣本都要滿足式
約束斯入,模型等價(jià)于線性可分支持向量機(jī)[3];當(dāng)
取有限值時(shí)蛀蜜,模型允許一些樣本不滿足約束。
接下來(lái)討論損失函數(shù)增蹭。當(dāng)
使用不同的損失函數(shù)時(shí)的模型狀態(tài)滴某,周志華老師的西瓜書(shū)[2]有簡(jiǎn)單討論。當(dāng)
是合頁(yè)損失函數(shù)時(shí)滋迈,模型就是線性支持向量機(jī)霎奢。李航老師《統(tǒng)計(jì)學(xué)習(xí)方法(第二版)》[1]的相關(guān)章節(jié)證明了線性支持向量機(jī)和基于合頁(yè)損失函數(shù)的優(yōu)化問(wèn)題的等價(jià)性。合頁(yè)損失函數(shù)如下
圖1[2]
當(dāng)時(shí)饼灿,式
可重寫(xiě)為
引入松弛變量幕侠,將上式再重寫(xiě)為
優(yōu)化問(wèn)題一:
三、拉格朗日對(duì)偶問(wèn)題推導(dǎo)
與線性可分支持向量機(jī)類似碍彭,線性支持向量機(jī)(式)的拉格朗日對(duì)偶函數(shù)如下
原問(wèn)題(式)是凸優(yōu)化問(wèn)題晤硕,則優(yōu)化問(wèn)題
與原問(wèn)題等價(jià)悼潭。
第一步,求對(duì)
的極小值舞箍。
得
將式代入式
舰褪,可得
第二步,求對(duì)
的極大值疏橄,即得對(duì)偶問(wèn)題占拍。
這里需要注意,式等號(hào)右邊表達(dá)式?jīng)]有
捎迫,直接求解對(duì)
的極大值即可晃酒。對(duì)偶問(wèn)題如下
上式中,因?yàn)?img class="math-inline" src="https://math.jianshu.com/math?formula=%5Cmu" alt="\mu" mathimg="1">不在最優(yōu)化表達(dá)式中窄绒,可以利用等式約束消去掖疮,簡(jiǎn)化約束。再把求極大轉(zhuǎn)換成求極小颗祝,得到對(duì)偶問(wèn)題如下
優(yōu)化問(wèn)題二:
第三步浊闪,求解分類超平面和分類模型。
對(duì)于已求解出優(yōu)化問(wèn)題二(式)的最優(yōu)解
螺戳,則類似于線性可分支持向量機(jī)[3]的推導(dǎo)過(guò)程搁宾。
原問(wèn)題(式)是凸優(yōu)化問(wèn)題,則滿足KKT條件的點(diǎn)是原問(wèn)題和對(duì)偶問(wèn)題的最優(yōu)解(具體請(qǐng)參見(jiàn)[4])
根據(jù)式可得
觀察式倔幼、
和
盖腿,先看式
,當(dāng)
時(shí)损同,有
再看式翩腐,當(dāng)
時(shí),有?
此時(shí)再看式膏燃,當(dāng)
時(shí)茂卦,必有
,綜上討論组哩,當(dāng)
時(shí)等龙,有
再將式代入上式,并于式
聯(lián)立伶贰,可得線性支持向量機(jī)的最優(yōu)分類超平面參數(shù)為
這里需要注意黍衙,在李航老師《統(tǒng)計(jì)學(xué)習(xí)方法(第二版)》[1]相關(guān)章節(jié)中泥畅,和式相同表達(dá)的式子是不嚴(yán)謹(jǐn)?shù)模绻麤](méi)看到這一段琅翻,這句話略過(guò)位仁。
四柑贞、支持向量
線性支持向量機(jī)的支持向量會(huì)復(fù)雜一些。如下圖
首先障癌,定義的樣本點(diǎn)
為支持向量凌外。
其次,每個(gè)支持向量到其對(duì)應(yīng)的間隔邊界的距離為
涛浙。推導(dǎo)過(guò)程如下康辑。
點(diǎn)到超平面的距離公式為:
先看正類,正類的間隔邊界超平面為:轿亮,對(duì)應(yīng)的點(diǎn)到間隔邊界超平面的距離公式為:
疮薇。對(duì)于正例的支持向量,有
我注,根據(jù)式
按咒,有
,代入距離公式但骨,即可到結(jié)論励七。
負(fù)類推導(dǎo)過(guò)程類似。
再次奔缠,根據(jù)以上結(jié)論掠抬,分析支持向量。
根據(jù)上面式和
校哎,消去
两波,則有
第一種情況,當(dāng)時(shí)闷哆,則
腰奋,則此支持向量到對(duì)應(yīng)間隔邊界的距離
,即此支持向量在間隔邊界超平面上抱怔。
第二種情況劣坊,當(dāng)且
時(shí),此支持向量到對(duì)應(yīng)間隔邊界的距離
野蝇,此支持向量分類正確讼稚,在間隔邊界與分離超平面之間冤今。
第三種情況扒寄,當(dāng)且
時(shí)掖鱼,此支持向量到對(duì)應(yīng)間隔邊界的距離
,此支持向量在分離超平面上乍狐。
第四種情況,當(dāng)且
時(shí)固逗,此支持向量到對(duì)應(yīng)間隔邊界的距離
浅蚪,此支持向量分類錯(cuò)誤藕帜。
這里需要注意,有沒(méi)有和
同時(shí)成立的點(diǎn)惜傲,這里沒(méi)有找到確定或否定的證據(jù)洽故。如果誰(shuí)有這方面的資料,還煩請(qǐng)告知筆者盗誊,先行謝過(guò)时甚,聯(lián)系郵箱:hpfhepf@gmail.com。
五哈踱、附錄
A荒适、參考
[1]、《統(tǒng)計(jì)學(xué)習(xí)方法(第二版)》开镣,李航著刀诬,清華大學(xué)出版社
[2]、《機(jī)器學(xué)習(xí)》邪财,周志華著陕壹,清華大學(xué)出版社
[3]、《支持向量機(jī)(一)——線性可分支持向量機(jī)導(dǎo)出》
[4]树埠、《凸優(yōu)化(八)——Lagrange對(duì)偶問(wèn)題》
B糠馆、相關(guān)目錄
[a]、支持向量機(jī)(一)——線性可分支持向量機(jī)導(dǎo)出
[b]弥奸、支持向量機(jī)(二)——線性可分支持向量機(jī)求解
[c]榨惠、支持向量機(jī)(三)——線性支持向量機(jī)
[e]盛霎、支持向量機(jī)(五)——SMO算法