《機(jī)器學(xué)習(xí)》筆記-支持向量機(jī)(6)

寫(xiě)在最前面

如今機(jī)器學(xué)習(xí)和深度學(xué)習(xí)如此火熱配并,相信很多像我一樣的普通程序猿或者還在大學(xué)校園中的同學(xué)光酣,一定也想?yún)⑴c其中。不管是出于好奇揍障,還是自身充電目养,跟上潮流,我覺(jué)得都值得試一試亚兄。對(duì)于自己混稽,經(jīng)歷了一段時(shí)間的系統(tǒng)學(xué)習(xí)(參考《機(jī)器學(xué)習(xí)/深度學(xué)習(xí)入門(mén)資料匯總》),現(xiàn)在計(jì)劃重新閱讀《機(jī)器學(xué)習(xí)》[周志華]和《深度學(xué)習(xí)》[Goodfellow et al]這兩本書(shū)审胚,并在閱讀的過(guò)程中進(jìn)行記錄和總結(jié)匈勋。這兩本是機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的入門(mén)經(jīng)典。筆記中除了會(huì)對(duì)書(shū)中核心及重點(diǎn)內(nèi)容進(jìn)行記錄膳叨,同時(shí)洽洁,也會(huì)增加自己的理解,包括過(guò)程中的疑問(wèn)菲嘴,并盡量的和實(shí)際的工程應(yīng)用和現(xiàn)實(shí)場(chǎng)景進(jìn)行結(jié)合饿自,使得知識(shí)不只是停留在理論層面,而是能夠更好的指導(dǎo)實(shí)踐龄坪。記錄筆記昭雌,一方面,是對(duì)自己先前學(xué)習(xí)過(guò)程的總結(jié)和補(bǔ)充健田。 另一方面烛卧,相信這個(gè)系列學(xué)習(xí)過(guò)程的記錄,也能為像我一樣入門(mén)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)同學(xué)作為學(xué)習(xí)參考妓局。

章節(jié)目錄

  • 間隔與支持向量
  • 對(duì)偶問(wèn)題
  • 核函數(shù)
  • 軟間隔與正則化
  • 支持向量回歸
  • 核方法

(一)間隔與支持向量

給定訓(xùn)練樣本D={{x1, y1}, {x2, y2}, ...,{xm, ym}}, yi∈{-1, +1}总放,分類學(xué)習(xí)最基本的想法就是基于訓(xùn)練集D在樣本空間找到一個(gè)劃分超平面,


圖6.1

在樣本空間中好爬,劃分超平面可通過(guò)如下線性方程來(lái)描述局雄,


6.1

假設(shè)超平面(w,b)能將訓(xùn)練樣本正確分類存炮,即對(duì)于(xi, yi)∈D炬搭,令蜈漓,
6.3

6.2

距離超平面最近的這幾個(gè)訓(xùn)練樣本點(diǎn)稱為“支持向量”(support vector),兩個(gè)異類支持向量到超平面的距離之和為尚蝌,


6.4

稱為“間隔”(margin)迎变。
找到“最大間隔”(maximum margin)的劃分超平面,就是支持向量機(jī)(Support Vector Machine飘言,簡(jiǎn)稱SVM)的基本型衣形。

(二)對(duì)偶問(wèn)題

我們對(duì)SVM基本型求解是一個(gè)凸二次規(guī)劃(convex quadratic programming)問(wèn)題,能直接用現(xiàn)成的優(yōu)化計(jì)算包求解姿鸿,但我們可以有更高效的辦法谆吴。即對(duì)SVM的基本型使用拉格朗日算子法得到其“對(duì)偶問(wèn)題”(dual problem)。

(三)核函數(shù)

在現(xiàn)實(shí)任務(wù)中苛预,原始樣本空間內(nèi)也許并不存在一個(gè)能正確劃分兩類樣本的超平面句狼。對(duì)這樣的問(wèn)題,可以將樣本從原始空間映射到一個(gè)更高維的特征空間热某,使得樣本在這個(gè)特征空間內(nèi)線性可分腻菇。如下圖,


圖6.3

幸運(yùn)的是昔馋,如果原始空間是有限維筹吐,即屬性數(shù)有限,那么一定存在一個(gè)高維特征空間使樣本可分秘遏。
令Φ(x)表示將x映射后的特征向量丘薛,于是,在特征空間中劃分超平面所對(duì)應(yīng)的模型可表示為邦危,


6.19

其對(duì)偶問(wèn)題是洋侨,
6.21

6.21

求解設(shè)計(jì)到計(jì)算,


公式

倦蚪,這是樣本xi與xj映射到特征空間之后的內(nèi)積希坚。由于特征空間的維數(shù)可能很高,甚至可能到無(wú)窮維陵且,因此直接計(jì)算通常是困難的裁僧。為了避開(kāi)這個(gè)障礙,可以假設(shè)這樣一個(gè)函數(shù)滩报,
6.22

即xi與xj在特征空間的內(nèi)積等于他們?cè)紭颖究臻g通過(guò)函數(shù)k(. , .)計(jì)算的結(jié)果。有了這樣的函數(shù)播急,我們就不必直接計(jì)算高維甚至無(wú)窮維特征空間中的內(nèi)積脓钾。這里的函數(shù)k(. , .)就是“核函數(shù)”(kernel function)。
“核函數(shù)選擇”是支持向量機(jī)的最大變數(shù)桩警。常用的核函數(shù)有可训,
表6.1

此外,還可以通過(guò)函數(shù)的組合得到。

(四)軟間隔與正則化

在前面的討論中握截,我們一直假定訓(xùn)練樣本在訓(xùn)練空間或特征空間中是線性可分的飞崖,即存在一個(gè)超平面將不同類的樣本完全劃分開(kāi)。然而谨胞,在現(xiàn)實(shí)任務(wù)中往往很難確定合適的核函數(shù)使得訓(xùn)練樣本在特征空間中線性可分固歪。
緩解該問(wèn)題的一個(gè)辦法是允許支持向量機(jī)在一些樣本上出錯(cuò)。為此引入了“軟間隔”(soft margin)的概念胯努,如下圖所示牢裳,


圖6.4

具體來(lái)說(shuō),前面介紹的支持向量機(jī)形式是要求所有樣本均滿足約束叶沛,即所有樣本必須劃分正確蒲讯,這稱為“硬間隔”(hard margin),而軟間隔則是允許這樣的樣本不滿足約束灰署。

(五)支持向量回歸

對(duì)樣本(x判帮,y),傳統(tǒng)回歸模型通常直接基于模型輸出f(x)與真實(shí)輸出y之間的差別來(lái)計(jì)算損失溉箕,當(dāng)切僅當(dāng)f(x)與y完全相同時(shí)晦墙,損失才為零。于此不同约巷,支持向量回歸(Support Vector Regression偎痛,簡(jiǎn)稱SVR)假設(shè)我們能容忍f(x)與y之間最多有ε的偏差,即僅當(dāng)f(x)與y之間的差別絕對(duì)值大于ε時(shí)才計(jì)算損失独郎。如下圖所示踩麦,


圖6.6

(六)核方法

根據(jù)“表示定理”,對(duì)于一般的損失函數(shù)和正則化項(xiàng)(不要求是凸函數(shù))氓癌,優(yōu)化問(wèn)題的最優(yōu)解都可表示為核函數(shù)的線性組合谓谦。這顯示出核函數(shù)的巨大威力。
人們發(fā)展出一系列基于核函數(shù)的學(xué)習(xí)方法贪婉,統(tǒng)稱為“核方法”(kernel methods)反粥。最常見(jiàn)的,是通過(guò)“核化”(即引入核函數(shù))來(lái)將線性學(xué)習(xí)器拓展為非線性學(xué)習(xí)器疲迂。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末才顿,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子尤蒿,更是在濱河造成了極大的恐慌郑气,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,122評(píng)論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件腰池,死亡現(xiàn)場(chǎng)離奇詭異尾组,居然都是意外死亡忙芒,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,070評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén)讳侨,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)呵萨,“玉大人,你說(shuō)我怎么就攤上這事跨跨〕甭停” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 164,491評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵歹叮,是天一觀的道長(zhǎng)跑杭。 經(jīng)常有香客問(wèn)我,道長(zhǎng)咆耿,這世上最難降的妖魔是什么德谅? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,636評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮萨螺,結(jié)果婚禮上窄做,老公的妹妹穿的比我還像新娘。我一直安慰自己慰技,他們只是感情好椭盏,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,676評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著吻商,像睡著了一般掏颊。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上艾帐,一...
    開(kāi)封第一講書(shū)人閱讀 51,541評(píng)論 1 305
  • 那天乌叶,我揣著相機(jī)與錄音,去河邊找鬼柒爸。 笑死准浴,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的捎稚。 我是一名探鬼主播乐横,決...
    沈念sama閱讀 40,292評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼今野!你這毒婦竟也來(lái)了葡公?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 39,211評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤条霜,失蹤者是張志新(化名)和其女友劉穎催什,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體蛔外,經(jīng)...
    沈念sama閱讀 45,655評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡蛆楞,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,846評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了夹厌。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片豹爹。...
    茶點(diǎn)故事閱讀 39,965評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖矛纹,靈堂內(nèi)的尸體忽然破棺而出臂聋,到底是詐尸還是另有隱情,我是刑警寧澤或南,帶...
    沈念sama閱讀 35,684評(píng)論 5 347
  • 正文 年R本政府宣布孩等,位于F島的核電站,受9級(jí)特大地震影響采够,放射性物質(zhì)發(fā)生泄漏肄方。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,295評(píng)論 3 329
  • 文/蒙蒙 一蹬癌、第九天 我趴在偏房一處隱蔽的房頂上張望权她。 院中可真熱鬧,春花似錦逝薪、人聲如沸隅要。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,894評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)步清。三九已至,卻和暖如春虏肾,著一層夾襖步出監(jiān)牢的瞬間廓啊,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,012評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工询微, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留崖瞭,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,126評(píng)論 3 370
  • 正文 我出身青樓撑毛,卻偏偏與公主長(zhǎng)得像书聚,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子藻雌,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,914評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容