【SVM】SVM 面試題

http://blog.csdn.net/szlcw1/article/details/52259668

1. SVM的原理是什么?

SVM是一種二類分類模型桥言。它的基本模型是在特征空間中尋找間隔最大化的分離超平面的線性分類器萌踱。(間隔最大是它有別于感知機(jī))

(1)當(dāng)訓(xùn)練樣本線性可分時(shí)葵礼,通過硬間隔最大化,學(xué)習(xí)一個(gè)線性分類器并鸵,即線性可分支持向量機(jī)鸳粉;

(2)當(dāng)訓(xùn)練數(shù)據(jù)近似線性可分時(shí),引入松弛變量园担,通過軟間隔最大化届谈,學(xué)習(xí)一個(gè)線性分類器,即線性支持向量機(jī)弯汰;

(3)當(dāng)訓(xùn)練數(shù)據(jù)線性不可分時(shí)艰山,通過使用核技巧及軟間隔最大化,學(xué)習(xí)非線性支持向量機(jī)咏闪。

注:以上各SVM的數(shù)學(xué)推導(dǎo)應(yīng)該熟悉:硬間隔最大化(幾何間隔)---學(xué)習(xí)的對偶問題---軟間隔最大化(引入松弛變量)---非線性支持向量機(jī)(核技巧)曙搬。


2. SVM為什么采用間隔最大化?

當(dāng)訓(xùn)練數(shù)據(jù)線性可分時(shí)汤踏,存在無窮個(gè)分離超平面可以將兩類數(shù)據(jù)正確分開织鲸。

感知機(jī)利用誤分類最小策略,求得分離超平面溪胶,不過此時(shí)的解有無窮多個(gè)搂擦。

線性可分支持向量機(jī)利用間隔最大化求得最優(yōu)分離超平面哗脖,這時(shí)瀑踢,解是唯一的。另一方面才避,此時(shí)的分隔超平面所產(chǎn)生的分類結(jié)果是最魯棒的橱夭,對未知實(shí)例的泛化能力最強(qiáng)

然后應(yīng)該借此闡述桑逝,幾何間隔棘劣,函數(shù)間隔,及從函數(shù)間隔—>求解最小化1/2 ||w||^2 時(shí)的w和b楞遏。即線性可分支持向量機(jī)學(xué)習(xí)算法—最大間隔法的由來茬暇。


3. 為什么要將求解SVM的原始問題轉(zhuǎn)換為其對偶問題?

一寡喝、是對偶問題往往更易求解(當(dāng)我們尋找約束存在時(shí)的最優(yōu)點(diǎn)的時(shí)候糙俗,約束的存在雖然減小了需要搜尋的范圍,但是卻使問題變得更加復(fù)雜预鬓。為了使問題變得易于處理巧骚,我們的方法是把目標(biāo)函數(shù)和約束全部融入一個(gè)新的函數(shù),即拉格朗日函數(shù),再通過這個(gè)函數(shù)來尋找最優(yōu)點(diǎn)劈彪。

二竣蹦、自然引入核函數(shù),進(jìn)而推廣到非線性分類問題粉臊。


4. 為什么SVM要引入核函數(shù)草添?

當(dāng)樣本在原始空間線性不可分時(shí),可將樣本從原始空間映射到一個(gè)更高維的特征空間扼仲,使得樣本在這個(gè)特征空間內(nèi)線性可分。

引入映射后的對偶問題:

在學(xué)習(xí)預(yù)測中抄淑,只定義核函數(shù)K(x,y)屠凶,而不是顯式的定義映射函數(shù)?。因?yàn)?b>特征空間維數(shù)可能很高肆资,甚至可能是無窮維矗愧,因此直接計(jì)算?(x?(y)是比較困難的。相反郑原,直接計(jì)算K(x,y)比較容易(即直接在原來的低維空間中進(jìn)行計(jì)算唉韭,而不需要顯式地寫出映射后的結(jié)果)。

核函數(shù)的定義:K(x,y)=<?(x),?(y)>犯犁,即在特征空間的內(nèi)積等于它們在原始樣本空間中通過核函數(shù)K計(jì)算的結(jié)果属愤。

除了 SVM 之外,任何將計(jì)算表示為數(shù)據(jù)點(diǎn)的內(nèi)積的方法酸役,都可以使用核方法進(jìn)行非線性擴(kuò)展住诸。


5. svm RBF核函數(shù)的具體公式?

Gauss徑向基函數(shù)則是局部性強(qiáng)的核函數(shù)涣澡,其外推能力隨著參數(shù)σ的增大而減弱贱呐。

這個(gè)核會將原始空間映射為無窮維空間。不過入桂,如果σ選得很大的話奄薇,高次特征上的權(quán)重實(shí)際上衰減得非常快抗愁,所以實(shí)際上(數(shù)值上近似一下)相當(dāng)于一個(gè)低維的子空間馁蒂;反過來,如果σ選得很小驹愚,則可以將任意的數(shù)據(jù)映射為線性可分——當(dāng)然远搪,這并不一定是好事,因?yàn)殡S之而來的可能是非常嚴(yán)重的過擬合問題逢捺。不過谁鳍,總的來說,通過調(diào)控參數(shù)σ高斯核實(shí)際上具有相當(dāng)高的靈活性倘潜,也是使用最廣泛的核函數(shù)之一绷柒。


6. SVM如何處理多分類問題?

一般有兩種做法:一種是直接法涮因,直接在目標(biāo)函數(shù)上修改废睦,將多個(gè)分類面的參數(shù)求解合并到一個(gè)最優(yōu)化問題里面⊙荩看似簡單但是計(jì)算量卻非常的大嗜湃。

另外一種做法是間接法:對訓(xùn)練器進(jìn)行組合。其中比較典型的有一對一澜掩,和一對多购披。

一對多,就是對每個(gè)類都訓(xùn)練出一個(gè)分類器肩榕,由svm是二分類刚陡,所以將此而分類器的兩類設(shè)定為目標(biāo)類為一類,其余類為另外一類株汉。這樣針對k個(gè)類可以訓(xùn)練出k個(gè)分類器筐乳,當(dāng)有一個(gè)新的樣本來的時(shí)候,用這k個(gè)分類器來測試乔妈,那個(gè)分類器的概率高蝙云,那么這個(gè)樣本就屬于哪一類。這種方法效果不太好褒翰,bias比較高贮懈。

svm一對一法(one-vs-one),針對任意兩個(gè)類訓(xùn)練出一個(gè)分類器优训,如果有k類朵你,一共訓(xùn)練出C(2,k) 個(gè)分類器,這樣當(dāng)有一個(gè)新的樣本要來的時(shí)候揣非,用這C(2,k)?個(gè)分類器來測試宛琅,每當(dāng)被判定屬于某一類的時(shí)候挎狸,該類就加一,最后票數(shù)最多的類別被認(rèn)定為該樣本的類。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末步鉴,一起剝皮案震驚了整個(gè)濱河市胡野,隨后出現(xiàn)的幾起案子仁连,更是在濱河造成了極大的恐慌满葛,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,888評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件琐驴,死亡現(xiàn)場離奇詭異俘种,居然都是意外死亡秤标,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,677評論 3 399
  • 文/潘曉璐 我一進(jìn)店門宙刘,熙熙樓的掌柜王于貴愁眉苦臉地迎上來苍姜,“玉大人,你說我怎么就攤上這事悬包⊙弥恚” “怎么了?”我有些...
    開封第一講書人閱讀 168,386評論 0 360
  • 文/不壞的土叔 我叫張陵布近,是天一觀的道長垫释。 經(jīng)常有香客問我,道長吊输,這世上最難降的妖魔是什么饶号? 我笑而不...
    開封第一講書人閱讀 59,726評論 1 297
  • 正文 為了忘掉前任,我火速辦了婚禮季蚂,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘琅束。我一直安慰自己扭屁,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,729評論 6 397
  • 文/花漫 我一把揭開白布涩禀。 她就那樣靜靜地躺著料滥,像睡著了一般。 火紅的嫁衣襯著肌膚如雪艾船。 梳的紋絲不亂的頭發(fā)上葵腹,一...
    開封第一講書人閱讀 52,337評論 1 310
  • 那天,我揣著相機(jī)與錄音屿岂,去河邊找鬼践宴。 笑死,一個(gè)胖子當(dāng)著我的面吹牛爷怀,可吹牛的內(nèi)容都是我干的阻肩。 我是一名探鬼主播,決...
    沈念sama閱讀 40,902評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼运授,長吁一口氣:“原來是場噩夢啊……” “哼烤惊!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起吁朦,我...
    開封第一講書人閱讀 39,807評論 0 276
  • 序言:老撾萬榮一對情侶失蹤柒室,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后逗宜,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體雄右,經(jīng)...
    沈念sama閱讀 46,349評論 1 318
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡空骚,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,439評論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了不脯。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片府怯。...
    茶點(diǎn)故事閱讀 40,567評論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖防楷,靈堂內(nèi)的尸體忽然破棺而出复局,到底是詐尸還是另有隱情角钩,我是刑警寧澤,帶...
    沈念sama閱讀 36,242評論 5 350
  • 正文 年R本政府宣布恭朗,位于F島的核電站涛贯,受9級特大地震影響稀余,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,933評論 3 334
  • 文/蒙蒙 一菩掏、第九天 我趴在偏房一處隱蔽的房頂上張望智绸。 院中可真熱鬧野揪,春花似錦、人聲如沸瞧栗。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,420評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽沼溜。三九已至,卻和暖如春游添,著一層夾襖步出監(jiān)牢的瞬間系草,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,531評論 1 272
  • 我被黑心中介騙來泰國打工唆涝, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留找都,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,995評論 3 377
  • 正文 我出身青樓廊酣,卻偏偏與公主長得像能耻,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子亡驰,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,585評論 2 359