SVM支持向量機(jī)

線性可分支持向量機(jī)

特點(diǎn)

  1. 二分類問題
  2. 輸入空間:歐式空間或離散集合
  3. 特征空間:歐式空間或希爾伯特空間
  4. 線性可分支持向量機(jī)创南、線性支持向量機(jī):假設(shè)這兩個空間的元素一一對應(yīng)卿泽,并將輸入空間中的輸入映射為特征空間中的特征向量

理論模型

  1. 假設(shè)特征空間上的訓(xùn)練數(shù)據(jù)集:


    假設(shè)
  2. 線性可分支持向量機(jī):給定線性可分訓(xùn)練數(shù)據(jù)集岭参,通過間隔最大化或等價地求解相應(yīng)的凸二次規(guī)劃問題學(xué)習(xí)得到的分離超平面為


    超平面
  3. 決策函數(shù)


    決策函數(shù)

函數(shù)間隔和幾何間隔

  1. 點(diǎn)到分離超平面的遠(yuǎn)近
    確信程度

    表示分類預(yù)測的確信程度尝艘,
    符號
    的符號與類標(biāo)記y的符號是否一致表示分類是否正確演侯,所以
    正確性
    表示分類的正確性
  2. 函數(shù)間隔
    樣本點(diǎn)的函數(shù)間隔


    函數(shù)間隔

    訓(xùn)練數(shù)據(jù)集的函數(shù)間隔


    函數(shù)間隔
  3. 幾何間隔
    樣本點(diǎn)的幾何間隔


    幾何間隔

    訓(xùn)練數(shù)據(jù)集的幾何間隔


    幾何間隔

間隔最大化

  1. 最大間隔分類超平面


    最大間隔
  2. 根據(jù)幾何間隔和函數(shù)間隔的關(guān)系,問題轉(zhuǎn)化為


    間隔
  3. 因?yàn)楹瘮?shù)間隔并不影響問題的最優(yōu)解拷获,所以我們令函數(shù)間隔為1.線性可分支持向量機(jī)學(xué)習(xí)可以轉(zhuǎn)化為以下最優(yōu)化問題


    最優(yōu)化問題

拉格朗日對偶

給每一個約束條件加上一個拉格朗日乘子

舷嗡,定義拉格朗日函數(shù)



這里我們把X看做常量进萄,對
求其最大值

在滿足約束的條件下,目標(biāo)函數(shù)變?yōu)榱?/p>


轉(zhuǎn)化為對偶問題

*** 通過拉格朗日對偶重新定義一個無約束問題,這個無約束問題等價于原來的約束優(yōu)化問題援雇,從而將約束問題無約束化惫搏! ***

求解對偶問題的步驟

  1. 首先固定
    要讓 L 關(guān)于 w 和 b 最小化铣猩,我們分別對w茴丰,b求偏導(dǎo)數(shù),即令 ?L/?w 和 ?L/?b 等于零


    最后失仁,得到:
  2. 計(jì)算



  3. 求得分離超平面


  4. 分類決策函數(shù)


*** 分類決策函數(shù)只依賴于輸入x和訓(xùn)練樣本輸入的內(nèi)積萄焦,上式稱為線性可分支持向量機(jī)的對偶形式 ***

線性支持向量機(jī)與軟間隔最大化

引入松弛變量和懲罰參數(shù)

  1. 構(gòu)造并求解約束最優(yōu)化問題


  2. 計(jì)算



    并選擇α*拂封,適合條件



    計(jì)算:

非線性支持向量機(jī)與核函數(shù)

核技巧應(yīng)用到支持向量機(jī)冒签,其基本想法:
通過一個非線性變換將輸入空間(歐氏空間R”或離散集合)對應(yīng)于一個特征空間(希爾伯特空間)钟病,使得在輸入空間中的超曲面模型對應(yīng)于特征空間中的超平面模型(支持向量機(jī))萧恕。分類問題的學(xué)習(xí)任務(wù)通過在特征空間中求解線性支持向量機(jī)就可以完成.

多項(xiàng)式核函數(shù)

高斯核


如果σ選得很大的話票唆,高次特征上的權(quán)重實(shí)際上衰減得非骋倥牵快噪伊,所以實(shí)際上(數(shù)值上近似一下)相當(dāng)于一個低維的子空間;反過來鉴吹,如果選得很小豆励,則可以將任意的數(shù)據(jù)映射為線性可分——當(dāng)然,這并不一定是好事般堆,因?yàn)殡S之而來的可能是非常嚴(yán)重的過擬合問題诚啃。不過,總的來說和橙,通過調(diào)控參數(shù)σ,高斯核實(shí)際上具有相當(dāng)高的靈活性晰搀,也是使用最廣泛的核函數(shù)之一

序列最小最優(yōu)化算法SMO

  1. 解如下凸二次規(guī)劃的對偶問題


  2. 啟發(fā)式算法外恕,基本思路
    如果所有變量的解都滿足此最優(yōu)化問題的KKT條件乡翅,那么得到解
    否則,選擇兩個變量尚洽,固定其它變量靶累,針對這兩個變量構(gòu)建一個二次規(guī)劃問題挣柬,稱為子問題,可通過解析方法求解澈灼,提高了計(jì)算速度
    子問題的兩個變量:一個是違反KKT條件最嚴(yán)重的那個店溢,另一個由約束條件自動確定


  3. 兩個變量二次規(guī)劃的求解過程
    選擇兩個變量床牧,其它固定



    假設(shè)問題的初始可行解為



    最優(yōu)解

    設(shè)α2未經(jīng)剪輯時的最優(yōu)解為

    則有



    最優(yōu)化問題沿約束方向未經(jīng)剪輯的解

    剪輯后的解

    得到α1的解
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末壕吹,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子踏堡,更是在濱河造成了極大的恐慌咒劲,老刑警劉巖诫隅,帶你破解...
    沈念sama閱讀 221,198評論 6 514
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件逐纬,死亡現(xiàn)場離奇詭異削樊,居然都是意外死亡漫贞,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,334評論 3 398
  • 文/潘曉璐 我一進(jìn)店門摇肌,熙熙樓的掌柜王于貴愁眉苦臉地迎上來仪际,“玉大人,你說我怎么就攤上這事肯适〕砂瘢” “怎么了?”我有些...
    開封第一講書人閱讀 167,643評論 0 360
  • 文/不壞的土叔 我叫張陵刘绣,是天一觀的道長挣输。 經(jīng)常有香客問我,道長停士,這世上最難降的妖魔是什么完丽? 我笑而不...
    開封第一講書人閱讀 59,495評論 1 296
  • 正文 為了忘掉前任逻族,我火速辦了婚禮,結(jié)果婚禮上瓷耙,老公的妹妹穿的比我還像新娘。我一直安慰自己长搀,他們只是感情好源请,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,502評論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著舅踪,像睡著了一般良蛮。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上货徙,一...
    開封第一講書人閱讀 52,156評論 1 308
  • 那天痴颊,我揣著相機(jī)與錄音屡贺,去河邊找鬼。 笑死泻仙,一個胖子當(dāng)著我的面吹牛量没,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 40,743評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼饶套,長吁一口氣:“原來是場噩夢啊……” “哼垒探!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起蛤克,我...
    開封第一講書人閱讀 39,659評論 0 276
  • 序言:老撾萬榮一對情侶失蹤构挤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后唐础,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體矾飞,經(jīng)...
    沈念sama閱讀 46,200評論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,282評論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了申眼。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,424評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡仲智,死狀恐怖钓辆,靈堂內(nèi)的尸體忽然破棺而出肴焊,到底是詐尸還是另有隱情,我是刑警寧澤似嗤,帶...
    沈念sama閱讀 36,107評論 5 349
  • 正文 年R本政府宣布烁落,位于F島的核電站豌注,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏轧铁。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,789評論 3 333
  • 文/蒙蒙 一绑洛、第九天 我趴在偏房一處隱蔽的房頂上張望童本。 院中可真熱鬧,春花似錦讨跟、人聲如沸鄙煤。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,264評論 0 23
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽亡资。三九已至锥腻,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間京革,已是汗流浹背幸斥。 一陣腳步聲響...
    開封第一講書人閱讀 33,390評論 1 271
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留廊勃,地道東北人经窖。 一個月前我還...
    沈念sama閱讀 48,798評論 3 376
  • 正文 我出身青樓画侣,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,435評論 2 359

推薦閱讀更多精彩內(nèi)容

  • 轉(zhuǎn)自微信公眾號:機(jī)器學(xué)習(xí)算法與Python學(xué)習(xí) 統(tǒng)計(jì)學(xué)習(xí)方法 & 小象學(xué)院 SVM算法優(yōu)點(diǎn): 可用于線性/非線性分...
    士多啤梨蘋果橙_cc15閱讀 984評論 0 2
  • SVM是數(shù)據(jù)挖掘算法中比較復(fù)雜難懂的,反復(fù)觀看斯坦福機(jī)器學(xué)習(xí)的視頻西疤, 以及網(wǎng)上零散學(xué)習(xí)各種數(shù)學(xué)和SVM相關(guān)資料休溶, ...
    wujustin閱讀 22,375評論 0 20
  • 囫圇吞棗看完SVM兽掰,個人感覺如果不好好理解一些概念,或說如果知其然而不知其所以然的話孽尽,不如不看杉女。因此我想隨便寫一寫...
    煎魚不可能有BUG閱讀 17,863評論 2 38
  • 【概述】 SVM訓(xùn)練分類器的方法是尋找到超平面,使正負(fù)樣本在超平面的兩側(cè)(分類正確性即“分得開”)速勇,且樣本到超平面...
    sealaes閱讀 11,079評論 0 7
  • 非線性支持向量機(jī)與核函數(shù) 對解線性分類問題烦磁,線性分類支持向量機(jī)是一種非常有效的方法廉白。但是有些分類問題的非線性的。其...
    士多啤梨蘋果橙_cc15閱讀 306評論 0 0