支持向量機(jī)(Support Vector Machines,SVM)
SVM有很多實(shí)現(xiàn)非洲,其中最流行的一種是序列最小優(yōu)化(Sequential Minimal Optimization踱稍,SMO)
優(yōu)點(diǎn):泛化錯(cuò)誤率低获印,計(jì)算開(kāi)銷(xiāo)不大秘血,結(jié)果易解釋
缺點(diǎn):對(duì)參數(shù)調(diào)節(jié)和核函數(shù)的選擇敏感奶卓,原始分類(lèi)器不加修改僅適用于處理二類(lèi)問(wèn)題。
使用數(shù)據(jù)類(lèi)型:數(shù)值型和標(biāo)稱(chēng)型數(shù)據(jù)
上述將數(shù)據(jù)集分隔開(kāi)來(lái)的直線(xiàn)稱(chēng)為分隔超平面(separating hyperplane)存炮。
二維平面就是一條直線(xiàn)分割炬搭,如果是三維,此時(shí)分隔數(shù)據(jù)就是一個(gè)平面穆桂。如果1024維的話(huà)宫盔,就需要一個(gè)1024維的某某對(duì)象來(lái)對(duì)數(shù)據(jù)進(jìn)行分隔,改對(duì)象被稱(chēng)之為超平面享完,也就是分類(lèi)的決策邊界灼芭。
如果數(shù)據(jù)點(diǎn)距離決策邊界越遠(yuǎn),那么其最后的預(yù)測(cè)結(jié)果也就越可信般又。
支持向量就是離分隔超平面最近的那些點(diǎn)
尋找最大間隔
核函數(shù)
將數(shù)據(jù)從一個(gè)特征空間轉(zhuǎn)換到另一個(gè)特征空間茴迁。在新空間下寄悯,我們可以很容易利用已有的工具對(duì)數(shù)據(jù)進(jìn)行處理。數(shù)學(xué)家們喜歡將這個(gè)過(guò)程稱(chēng)之為從一個(gè)特征空間到另一個(gè)特征空間的映射笋熬。在通常情況下热某,這種映射會(huì)將低維特征空間映射到高維空間。這種從某個(gè)特征空間到另一個(gè)特征空間的映射是通過(guò)核函數(shù)來(lái)實(shí)現(xiàn)的胳螟∥舨觯可以把核函數(shù)想象成一個(gè)包裝器或者是接口,它能把數(shù)據(jù)從某個(gè)很難處理的形式轉(zhuǎn)換成為另一個(gè)較容易處理的形式糖耸。
徑向基核函數(shù)是SVM中常用的一個(gè)核函數(shù)秘遏。徑向基函數(shù)是一個(gè)采用向量作為自變量的函數(shù),能夠基于向量距離運(yùn)算輸出一個(gè)標(biāo)量嘉竟。這個(gè)距離可以是從<0,0>向量或者其他向量開(kāi)始計(jì)算的距離邦危。