SVM涉及的內(nèi)容相當(dāng)多割粮,這里只是列了一些關(guān)鍵點(diǎn)方便記憶艇纺。
1怎静、原始問(wèn)題
SVM的基本思想:在將所有樣本都正確分類的前提下,求一個(gè)幾何間隔最大的超平面黔衡。
為樣本i的幾何間隔蚓聘,令
,那么有:
1.1
目標(biāo)函數(shù):
約束條件:
1.2
由幾何間隔和函數(shù)間隔的關(guān)系盟劫,將幾何間隔替換為函數(shù)間隔夜牡,得到:
1.3
由于函數(shù)間隔可以取任意值,而不影響目標(biāo)函數(shù)取值和約束條件的成立(參考李航-統(tǒng)計(jì)學(xué)習(xí)方法p.99)侣签,因此令氯材,得到:
也就是:
得到了凸二次規(guī)劃問(wèn)題的形式渣锦。
2、目標(biāo)函數(shù)的拉格朗日變換
2.1 拉格朗日變換的作用:1氢哮、對(duì)偶問(wèn)題更容易求解袋毙、2、自然的引入核函數(shù)
2.2 通過(guò)拉格朗日對(duì)偶性冗尤,通過(guò)求解原始問(wèn)題的對(duì)偶問(wèn)題得到原始問(wèn)題的最優(yōu)解听盖。
為拉格朗日乘子。
二次規(guī)劃的對(duì)偶問(wèn)題為:
求解后得到最終的分類函數(shù):
對(duì)應(yīng)的超平面為:
其中:
由這個(gè)條件可以發(fā)現(xiàn)裂七,出現(xiàn)在
中的只有滿足
的樣本皆看,也就是支持向量。
3背零、核函數(shù)
從原始空間到高維空間的映射記為:腰吟,代入以上公式可得:
由于的維度很高,直接求解通常很困難徙瓶,所以引入核函數(shù)的概念:
,即樣本i和j在高維空間的內(nèi)積可通過(guò)函數(shù)
計(jì)算得到毛雇。這個(gè)函數(shù)
就是核函數(shù)。
求解后得到:
核函數(shù)的類型有:線性核侦镇、多項(xiàng)式核
灵疮、高斯核等等
4、軟間隔和正則化
軟間隔即給約束條件加入松弛變量:
5壳繁、補(bǔ)充概念:
1震捣、超平面:
2、幾何間隔闹炉,也就是點(diǎn)到超平面的垂直距離:
3蒿赢、函數(shù)間隔:
所以函數(shù)間隔和幾何間隔的關(guān)系是: