考慮一個(gè)二分類問(wèn)題湘今。假設(shè)輸入空間與特征空間為兩個(gè)不同的空間已球。輸入空間為歐氏空間或離散集合宽菜,特征空間為歐式空間或希爾伯特空間。線性可分支持向量機(jī)净神、線性支持向量機(jī)假設(shè)這兩個(gè)空間的元素一一對(duì)應(yīng),并將輸入空間中的輸入映射為特征空間中的特征向量溉委。非線性支持向量機(jī)利用一個(gè)從輸入空間到特征空間的非線性映射將輸入映射為特征向量(核技巧)鹃唯。支持向量機(jī)的學(xué)習(xí)是在特征空間進(jìn)行的。
輸入空間:輸入空間是輸入的所有可能取值的集合瓣喊。
特征空間:特征空間是所有特征向量存在的空間坡慌,特征向量的每一維代表一個(gè)特征,通常與輸入空間一一對(duì)應(yīng)藻三,但也可以通過(guò)映射函數(shù)從輸入空間映射得到特征空間洪橘。
歐氏空間:內(nèi)積空間+完備性+有限維跪者。
希爾伯特空間:內(nèi)積空間+完備性,可以看做歐式空間在無(wú)限維的情形熄求。
線性可分支持向量機(jī)渣玲、線性支持向量機(jī)處理的樣本在輸入空間上就通過(guò)線性劃分,所以輸入空間和特征空間一一對(duì)應(yīng)弟晚。非線性支持向量機(jī)處理的樣本在輸入空間上不可以線性劃分忘衍,所以需要通過(guò)映射函數(shù)從輸入空間映射到特征空間使其在特征空間上可以線性劃分,最終轉(zhuǎn)化成線性可分支持向量機(jī)卿城、線性支持向量機(jī)的形式枚钓。
問(wèn)題
假設(shè)給定一個(gè)特征空間上的訓(xùn)練數(shù)據(jù)集
其中,瑟押,
搀捷,
,
為第
個(gè)特征向量多望,也稱為實(shí)例嫩舟,
為
的類標(biāo)記,當(dāng)
時(shí)便斥,稱
為正例至壤;當(dāng)
時(shí),稱
為負(fù)例枢纠,
稱為樣本點(diǎn)像街。再假設(shè)訓(xùn)練數(shù)據(jù)集是線性可分的。
線性可分:用一個(gè)超平面可以將正負(fù)例完全正確的劃分在超平面兩側(cè)晋渺。
學(xué)習(xí)的目的是找到一個(gè)超平面:
對(duì)于一個(gè)新的輸入的分類決策函數(shù)為:
滿足條件的這樣的超平面可能有很多個(gè)镰绎,但是支持向量機(jī)通過(guò)幾何間隔在超平面的選擇上加上了約束,即最大化幾何間隔木西,使最后得到的超平面是唯一的畴栖。
函數(shù)間隔和幾何間隔
函數(shù)間隔
一般來(lái)說(shuō),一個(gè)樣本點(diǎn)到超平面的距離代表了支持向量機(jī)對(duì)這個(gè)樣本分類的確信程度八千。由于當(dāng)超平面確定吗讶,點(diǎn)到平面的距離公式
的分母為一個(gè)常量,所以確信程度的大小由分子決定恋捆。于是定義樣本點(diǎn)
的函數(shù)間隔:
對(duì)于中所有樣本的函數(shù)間隔:
當(dāng)超平面能夠完全分類正確時(shí)照皆,所以函數(shù)間隔代表確信程度最小樣本的確信程度,最大化函數(shù)間隔就等于最大化支持向量機(jī)對(duì)樣本分類的確信程度沸停。在線性可分支持向量機(jī)中膜毁,這也稱為硬間隔最大化。
幾何間隔
由于對(duì)參數(shù)和
成比例縮放,就可以改變函數(shù)間隔
的大小瘟滨,但這仍然表示同一個(gè)超平面候醒。所以提出幾何間隔
對(duì)
規(guī)范化:
代表
的
范數(shù)。
重新定義問(wèn)題
學(xué)習(xí)一個(gè)超平面:
超平面的參數(shù)和
需要滿足條件
根據(jù)公式(4)將(5)-(6)轉(zhuǎn)化為關(guān)于函數(shù)間隔的表述方式:
由于函數(shù)間隔的取值不會(huì)影響最優(yōu)化問(wèn)題的解(參數(shù)
和
成比例縮放)倒淫,所以取
。而最大化
等價(jià)于最小化
胧沫,所以支持向量機(jī)最終可以表示成最優(yōu)化問(wèn)題:
這是一個(gè)凸二次規(guī)劃問(wèn)題昌简,即目標(biāo)函數(shù)是二次函數(shù),且約束函數(shù)
是仿射函數(shù)绒怨。
線性可分支持向量機(jī)學(xué)習(xí)算法--最大間隔法
輸入:線性可分訓(xùn)練數(shù)據(jù)集纯赎,其中
,
南蹂,
犬金;
輸出:最大間隔分離超平面和分類決策函數(shù)。
(1)構(gòu)造并求解約束最優(yōu)化問(wèn)題:
求得最優(yōu)解六剥,
晚顷。
(2)由此得到分離超平面:
分類決策函數(shù):
這樣的超平面存在且唯一,證明略疗疟。
支持向量和間隔邊界
支持向量是使約束條件公式(10)等號(hào)成立的點(diǎn)该默,即
對(duì)于正例,支持向量在超平面
對(duì)于負(fù)例策彤,支持向量在超平面
如圖所示
落在和
上的實(shí)例點(diǎn)稱為支持向量栓袖,
和
之間的距離稱為間隔,
和
稱為間隔邊界店诗。在決定超平面時(shí)裹刮,只有支持向量起作用,所以這種模型叫做支持向量機(jī)庞瘸。
學(xué)習(xí)的對(duì)偶算法
對(duì)于最優(yōu)化問(wèn)題(9)-(10):
首先構(gòu)建拉格朗日函數(shù):
其中捧弃,則原始問(wèn)題為極小極大問(wèn)題:
由拉格朗日對(duì)偶性改為求解原始問(wèn)題的對(duì)偶問(wèn)題:
首先求解對(duì)偶問(wèn)題的內(nèi)部極小問(wèn)題:
將拉格朗日函數(shù)分別對(duì),
求偏導(dǎo)并令其等于0:
得到:
將其代入(11)得到:
于是對(duì)偶問(wèn)題為:
對(duì)(14)的目標(biāo)函數(shù)取相反數(shù)轉(zhuǎn)化為極小問(wèn)題:
定理
設(shè)是對(duì)偶問(wèn)題最優(yōu)化問(wèn)題
的解擦囊,則存在下標(biāo)违霞,使得
,并按下式求得原始最優(yōu)化問(wèn)題
的解瞬场,
證明
由于目標(biāo)函數(shù)和約束函數(shù)
是凸函數(shù)葛家,且假設(shè)不等式約束
是嚴(yán)格可行的,則
泌类,
,
分別原始問(wèn)題和對(duì)偶問(wèn)題的解的充分必要條件是
,
刃榨,
滿足
條件:
由(18)得
由反證法弹砚,假設(shè)不存在下標(biāo),使得
枢希,根據(jù)(22)桌吃,則
,代入(18)得到
苞轿,超平面不存在茅诱,假設(shè)不成立。于是存在下標(biāo)
搬卒,使得
瑟俭,根據(jù)(20)得到
根據(jù)得
解得
將
代入得到
證明完成。
線性可分支持向量機(jī)的對(duì)偶學(xué)習(xí)算法
輸入:線性可分訓(xùn)練數(shù)據(jù)集其中
契邀,
摆寄,
;
輸出:最大間隔分離超平面和分類決策函數(shù)坯门。
(1)構(gòu)造并求解約束最優(yōu)化問(wèn)題
求得最優(yōu)解微饥。
(2)計(jì)算
并選擇的一個(gè)正分量
,計(jì)算
(3)求得分離超平面
分類決策函數(shù):
支持向量
根據(jù)公式
可以知道對(duì)的結(jié)果有影響的樣本點(diǎn)
古戴,其
欠橘,又因?yàn)?img class="math-inline" src="https://math.jianshu.com/math?formula=%5Calpha_i%5E*%5Cgeq0" alt="\alpha_i^*\geq0" mathimg="1">,所以
现恼,根據(jù)
條件:
所以
這樣的樣本點(diǎn)落在間隔邊界上
與前面的描述相同肃续。