線性可分是最簡單的分類器暖庄,需要注意的是,線性并不是傳統(tǒng)的直線的概念楼肪。線性培廓,如果特征在一維空間,那么線性分類器可以是一個點春叫;二維空間肩钠,則是一條直線泣港,三維則是平面。如果我們忽略具體的維度价匠,泛指某個維度上的線性分類器当纱,則這個分類器又可以稱之為超平面(Hyper Plane)。
注意惫东,x不再是橫軸坐標(biāo)的概念,而是一組特征向量毙石。g(x)可以用來判別輸入的特征向量x所屬的類別廉沮。簡單的將如果,wx+b>0為一類徐矩,wx+b<0則為二類滞时。
對于一個分類問題,其所對應(yīng)的超平面具有無窮多個滤灯,那么如何選擇最好的超平面坪稽?首先,需要定義一種評價標(biāo)準(zhǔn)鳞骤,再依據(jù)這種標(biāo)準(zhǔn)來尋找該超平面窒百。其中一種思路是,定義樣本與超平面的距離豫尽,所有樣本到該平面的距離的平均越小篙梢,則該超平面越優(yōu)秀。對于一組樣本美旧,
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? Di=(xi,yi)
其中渤滞,xi為某個樣本特征向量,yi為該樣本所對應(yīng)的類別標(biāo)簽榴嗅,如二元分類妄呕,則可以理解為1和-1。對于一個超平面g(x)=wx+b嗽测,則某個樣本到該超平面的距離可以表示為绪励,
范數(shù)
R為特征向量最大維度