SVM 的核函數(shù)選擇和調(diào)參


本文結(jié)構(gòu):

  1. 什么是核函數(shù)
  2. 都有哪些 & 如何選擇
  3. 調(diào)參

1. 什么是核函數(shù)

核函數(shù)形式 K(x, y) = <f(x), f(y)>寻狂,
其中 x, y 為 n 維凛澎,f 為 n 維到 m 維的映射撑教,<f(x), f(y)> 表示內(nèi)積送挑。

在用SVM處理問(wèn)題時(shí)茫陆,如果數(shù)據(jù)線性不可分颤芬,希望通過(guò) 將輸入空間內(nèi)線性不可分的數(shù)據(jù) 映射到 一個(gè)高維的特征空間內(nèi)慰丛,使數(shù)據(jù)在特征空間內(nèi)是線性可分的卓囚,這個(gè)映射記作 ?(x),

之后優(yōu)化問(wèn)題中就會(huì)有內(nèi)積 ?i??j诅病,
這個(gè)內(nèi)積的計(jì)算維度會(huì)非常大哪亿,因此引入了核函數(shù)几苍,
kernel 可以幫我們很快地做一些計(jì)算, 否則將需要在高維空間中進(jìn)行計(jì)算备闲。


2. 都有哪些 & 如何選擇

下表列出了 9 種核函數(shù)以及它們的用處和公式,常用的為其中的前四個(gè):linear澜倦,Polynomial芥永,RBF篡殷,Sigmoid

核函數(shù) 用處 公式
linear kernel 線性可分時(shí),特征數(shù)量多時(shí)埋涧,樣本數(shù)量多再補(bǔ)充一些特征時(shí)板辽,linear kernel可以是RBF kernel的特殊情況
Polynomial kernel image processing,參數(shù)比RBF多棘催,取值范圍是(0,inf)
Gaussian radial basis function (RBF) 通用劲弦,線性不可分時(shí),特征維數(shù)少 樣本數(shù)量正常時(shí)醇坝,在沒有先驗(yàn)知識(shí)時(shí)用邑跪,取值在[0,1]
Sigmoid kernel 生成神經(jīng)網(wǎng)絡(luò),在某些參數(shù)下和RBF很像,可能在某些參數(shù)下是無(wú)效的
Gaussian kernel 通用画畅,在沒有先驗(yàn)知識(shí)時(shí)用
Laplace RBF kernel 通用砸琅,在沒有先驗(yàn)知識(shí)時(shí)用
Hyperbolic tangent kernel neural networks中用
Bessel function of the first kind Kernel 可消除函數(shù)中的交叉項(xiàng)
ANOVA radial basis kernel 回歸問(wèn)題
Linear splines kernel in one-dimension text categorization,回歸問(wèn)題夜赵,處理大型稀疏向量

其中 linear kernel 和 RBF kernel 在線性可分和不可分的對(duì)比可視化例子如下:

linear kernel RBF kernel
線性可分
線性不可分

3. 調(diào)參

在 sklearn 中可以用 grid search 找到合適的 kernel明棍,以及它們的 gamma,C 等參數(shù)寇僧,那么來(lái)看看各 kernel 主要調(diào)節(jié)的參數(shù)是哪些:

核函數(shù) 公式 調(diào)參
linear kernel
Polynomial kernel
-d:多項(xiàng)式核函數(shù)的最高次項(xiàng)次數(shù)摊腋,-g:gamma參數(shù),-r:核函數(shù)中的coef0
Gaussian radial basis function (RBF)
-g:gamma參數(shù)嘁傀,默認(rèn)值是1/k
Sigmoid kernel
-g:gamma參數(shù)兴蒸,-r:核函數(shù)中的coef0

其中有兩個(gè)重要的參數(shù),即 C(懲罰系數(shù)) 和 gamma细办,
gamma 越大橙凳,支持向量越少,gamma 越小笑撞,支持向量越多岛啸。
而支持向量的個(gè)數(shù)影響訓(xùn)練和預(yù)測(cè)的速度。
C 越高茴肥,容易過(guò)擬合坚踩。C 越小,容易欠擬合瓤狐。


學(xué)習(xí)資料:
https://data-flair.training/blogs/svm-kernel-functions/
https://www.quora.com/What-are-kernels-in-machine-learning-and-SVM-and-why-do-we-need-them
https://www.zhihu.com/question/21883548
https://www.quora.com/How-do-I-select-SVM-kernels


推薦閱讀 歷史技術(shù)博文鏈接匯總
http://www.reibang.com/p/28f02bb59fe5
也許可以找到你想要的:
[入門問(wèn)題][TensorFlow][深度學(xué)習(xí)][強(qiáng)化學(xué)習(xí)][神經(jīng)網(wǎng)絡(luò)][機(jī)器學(xué)習(xí)][自然語(yǔ)言處理][聊天機(jī)器人]

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末瞬铸,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子础锐,更是在濱河造成了極大的恐慌嗓节,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,372評(píng)論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件皆警,死亡現(xiàn)場(chǎng)離奇詭異拦宣,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)信姓,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門恢着,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人财破,你說(shuō)我怎么就攤上這事掰派。” “怎么了左痢?”我有些...
    開封第一講書人閱讀 162,415評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵靡羡,是天一觀的道長(zhǎng)系洛。 經(jīng)常有香客問(wèn)我,道長(zhǎng)略步,這世上最難降的妖魔是什么描扯? 我笑而不...
    開封第一講書人閱讀 58,157評(píng)論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮趟薄,結(jié)果婚禮上绽诚,老公的妹妹穿的比我還像新娘。我一直安慰自己杭煎,他們只是感情好恩够,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,171評(píng)論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著羡铲,像睡著了一般蜂桶。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上也切,一...
    開封第一講書人閱讀 51,125評(píng)論 1 297
  • 那天扑媚,我揣著相機(jī)與錄音,去河邊找鬼雷恃。 笑死疆股,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的倒槐。 我是一名探鬼主播押桃,決...
    沈念sama閱讀 40,028評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼导犹!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起羡忘,我...
    開封第一講書人閱讀 38,887評(píng)論 0 274
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤谎痢,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后卷雕,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體节猿,經(jīng)...
    沈念sama閱讀 45,310評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,533評(píng)論 2 332
  • 正文 我和宋清朗相戀三年漫雕,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了滨嘱。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,690評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡浸间,死狀恐怖太雨,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情魁蒜,我是刑警寧澤囊扳,帶...
    沈念sama閱讀 35,411評(píng)論 5 343
  • 正文 年R本政府宣布吩翻,位于F島的核電站,受9級(jí)特大地震影響锥咸,放射性物質(zhì)發(fā)生泄漏狭瞎。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,004評(píng)論 3 325
  • 文/蒙蒙 一搏予、第九天 我趴在偏房一處隱蔽的房頂上張望熊锭。 院中可真熱鬧,春花似錦雪侥、人聲如沸碗殷。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)亿扁。三九已至,卻和暖如春鸟廓,著一層夾襖步出監(jiān)牢的瞬間从祝,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評(píng)論 1 268
  • 我被黑心中介騙來(lái)泰國(guó)打工引谜, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留牍陌,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,693評(píng)論 2 368
  • 正文 我出身青樓员咽,卻偏偏與公主長(zhǎng)得像毒涧,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子贝室,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,577評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容

  • 標(biāo)簽: PRML契讲; 核函數(shù) 備注:文中可能存在錯(cuò)誤,敬請(qǐng)指正滑频。 聲明:本文主要整理思路捡偏,原創(chuàng)參考資料列在文末,在...
    zjdxwsn閱讀 748評(píng)論 0 0
  • 本文是scikit-learn 支持向量機(jī)的翻譯峡迷,原文地址:http://scikit-learn.org/sta...
    學(xué)以致用123閱讀 2,993評(píng)論 0 4
  • 支持向量機(jī):是一種監(jiān)督式學(xué)習(xí)的方法银伟,可廣泛地應(yīng)用于統(tǒng)計(jì)分類以及回歸分析。支持向量機(jī)屬于一般化線性分類器绘搞,這族分類器...
    Vince_zzhang閱讀 1,262評(píng)論 0 0
  • 流行(pop) 韓流(korean pop) 韓勍堋(korean drama) 話劇(drama) 電視(TV)劇...
    shelley_hu閱讀 176評(píng)論 0 0
  • 周一模孩,一周的開始尖阔,對(duì)我來(lái)說(shuō),永遠(yuǎn)在打仗拼殺中度過(guò)榨咐,周末積攢的郵件回復(fù)介却,三個(gè)業(yè)務(wù)例會(huì)的參加,上一周遺留下來(lái)需要繼續(xù)跟...
    心芒咨詢閱讀 643評(píng)論 0 4