間隔與支持向量
分類任務(wù)中捆姜,最基本的思想就是通過超平面,將不同類別的樣本分開迎膜。
超平面就是一個(gè)維空間向
維空間的一個(gè)投影泥技,它比原來空間少一個(gè)自由度。超平面可以通過以下公式描述:
其中是法相量磕仅,確定超平面的方向珊豹;
是位移項(xiàng),確定超平面與原點(diǎn)之間的距離榕订。例如:
為一個(gè)三位空間的平面店茶,
向量就是該平面的法相量,與該平面內(nèi)的任意向量相乘等于零卸亮。
理解了超平面忽妒,我們需要得到最佳的超平面來將樣本進(jìn)行劃分,就是相對于各類樣本都比較居中的平面,就需要通過距離來衡量段直。將超平面標(biāo)記為吃溅,那么樣本空間中任意一點(diǎn)
到
的距離為:
如果超平面能夠正確劃分樣本,對于就有:
通過縮放鸯檬,必有:
對于樣本中那些使等號成立的點(diǎn)决侈,稱為支持向量,兩類支持向量到超平面距離之和稱為間隔喧务,為:
想要間隔最大赖歌,即在條件下:
最大化等價(jià)于最小化
,重寫上式功茴,即在條件
下:
對偶問題
凸函數(shù)是指函數(shù)在一定區(qū)間內(nèi)庐冯,任意亮點(diǎn)之間連線,連線上的任意一點(diǎn)的值坎穿,大于其對應(yīng)自變量處的函數(shù)值展父。可用公式描述為: