對(duì)于一個(gè)分類問題,其樣本集中往往存在一些模糊不清的樣本,直觀上告丢,考慮SVM分類器,這些樣本往往處于超平面的附近损谦。這些樣本對(duì)于分類器的設(shè)計(jì)具有很大的影響岖免。一種常用的方法為引入松弛因子到約束條件中,同時(shí)需要將這種松弛所導(dǎo)致的懲罰因子加入到目標(biāo)函數(shù)中照捡。
實(shí)際模型中颅湘,我們并不關(guān)心松弛因子,其數(shù)值是根據(jù)樣本點(diǎn)到假設(shè)超平面的距離給出的栗精,所以闯参,我們只需要設(shè)定懲罰因子C的數(shù)值即可。C的值可以為固定的一個(gè)值悲立,也可以是一個(gè)向量鹿寨。這里可以引申出分類中不均衡的問題,即薪夕,樣本中正分類和負(fù)分類的數(shù)量具有較大差異释移。這時(shí)我們可以通過引入兩種懲罰因子C,人為的增加對(duì)較少樣本數(shù)量類別的重視程度寥殖,進(jìn)而改善不均衡問題玩讳。