超平面用方程表示為
1.問題求解:
(1)拉格朗日乘子法
定義拉格朗日函數(shù)
棚品,
KKT條件為:
求極值蚜迅,則令
得到:
代入消去
和
,得到原問題的對偶問題為
由KKT條件得到:對于任意訓(xùn)練樣本總有
或
,這就意味著當(dāng)
時侦鹏,該樣本并不會對
產(chǎn)生而任何影響,當(dāng)
時臀叙,此時意味著訓(xùn)練樣本在最大間隔的邊界上略水,該樣本點稱之為支持向量。
(2)對偶問題求解:
**
2.核函數(shù)
假設(shè)樣本線性可分劝萤,即存在一個超平面對樣本進(jìn)行分類渊涝。而實際任務(wù)中,樣本往往是非線性可分床嫌。此時跨释,我們將映射到高維特征空間,在特征空間中找到超平面使得樣本線性可分厌处,記
為
映射到高維特征空間所對應(yīng)的特征向量鳖谈。
因此,對應(yīng)的模型可以表示為
實際只需要求解如下函數(shù):
對偶問題為:
當(dāng)特征空間維度很高時阔涉,計算困難缆娃,故定義核函數(shù)
使得
,
則對偶問題重寫為:
求解該對偶問題得到
3.軟間隔
前面介紹的支持向量機形式是要求所有樣本均滿足約束
, 即所有樣本都必須劃分正確瑰排,這稱為"硬間隔" (hard margin)贯要,而軟間隔則是允許某些樣本不滿足約束。當(dāng)然我們是希望這樣不滿足約束的樣本越少越好椭住。因此目標(biāo)函數(shù)定義為
,其中
由于非凸崇渗、非連續(xù),常用其他損失函數(shù)替代,如下圖所示:
采用hinge損失得到:
引入松弛變量得到:
軟間隔支持向量機
采用拉格朗日乘子法
,求極值乘碑,令
帶入L得到原問題的對偶問題為:
KKT條件要求:
由此可得:
對于任意
,當(dāng)
時, 該樣本不會對
產(chǎn)生任何影響兽肤;當(dāng)
時套腹,必有
,此時該樣本是支持向量。當(dāng)
時资铡,
,則
,此時樣本處于最大間隔邊界上电禀,當(dāng)
時,
笤休,則
尖飞;若
,樣本被錯誤分類;若
,樣本落在最大間隔內(nèi)部。
軟間隔支持向量機模型僅與支持向量有關(guān)店雅。
4.支持向量回歸
(1)考慮與
最多允許有
的誤差
(2)構(gòu)建寬度為的間隔帶政基,如圖:
目標(biāo)函數(shù):
可允許間隔帶兩側(cè)的松弛程度有所不同,故引入松弛變量
拉格朗日乘子法
代入L,得到SVR的對偶問題:
KKT條件為:
當(dāng)且僅當(dāng)
,
為非零窍奋;當(dāng)且僅當(dāng)
,
為非零.換言之荐健,樣本
沒有落在
-間隔帶時,
和
為非零琳袄。此外江场,
和
不能同時成立。因此窖逗,
和
至少有一個為零址否。
由可知,只有
非零時碎紊,
為SVR的支持向量在张,且落在
-間隔帶之外。落在
-間隔帶中的樣本矮慕,滿足
5.支持向量機與KNN
**