機(jī)器學(xué)習(xí)之SVM(簡單理解)

應(yīng)該對現(xiàn)有流行并將繼續(xù)流行下去的分類模型有深刻的了解薛耻。隨機(jī)森林和支持向量機(jī)(svm)
上篇文章簡單介紹了隨機(jī)森林浓领,這篇文章簡單介紹一下支持向量機(jī)(svm)。
偏重應(yīng)用固蚤,輕數(shù)學(xué)解釋推導(dǎo)。

線性分類器

一個非常簡單的分類問題歹茶。

image.png

用一條直線夕玩,將兩種顏色的點分開你弦,如圖所示(可以有無數(shù)條這樣的直線)。
假如將黑點記作-1燎孟, 白點+1禽作。直線f(x) = wx+b。這里的x揩页, w是向量领迈,其實也可以寫成這種形式。f(x) = w1x1 + w2x2 + ... + wnxn + b(w0x0)碍沐,當(dāng)向量x的維度是2的時候狸捅,f(x)表示二維空間中的一條直線,當(dāng)x的維度等于3的時候累提,f(x)表示3維空間中的一個平面尘喝;當(dāng)x的維度n大于3的時候,表示的是n維空間中的n-1維超平面斋陪。
當(dāng)有一個新的點需要預(yù)測分類的時候朽褪,就用sgn(f(x))。sgn表示符號函數(shù)无虚,當(dāng)f(x) > 0, 屬于黑點缔赠;否則屬于白點。

但是友题,對于無數(shù)條可能的直線嗤堰,哪條效果是最好的?

image.png

直觀感受度宦,讓這條直線到給定樣本中最近的點距離最遠(yuǎn)踢匣,如下圖的兩種分法,2效果好戈抄。
image.png

從直觀上來說离唬,分割的間隙越大越好,把兩個類別的點分得越開越好划鸽。
SVM中输莺,成為Maximum Marginal, 是svm的一個理論基礎(chǔ)之一裸诽。
選擇是的空隙最大的函數(shù)是有很多道理的嫂用。比如從概率的角度講, 就使的置信度最小的點置信度最大崭捍。
上圖中被紅色和藍(lán)色的線圈出來的點就是所謂的支持向量(support vector)尸折。
image.png

image.png

上圖就是對間隙的一個描述。Classifier Boundary就是fx殷蛇, 紅藍(lán)線就是support vertor 所在面实夹。紅色,藍(lán)色線之間的間隙就是要最大化的分類間的間隙粒梦。
直接給出M的公式:
image.png

另外支持向量位于wx+b = 1和wx+b=-1的直線上亮航。在前面乘上一個該點所屬的類別(1或者-1), 就可以得到支持向量的表達(dá)式 y(wx+b) =1匀们, 簡單的將支持向量表示出來缴淋。
當(dāng)確定支持向量后,分割函數(shù)也隨之確定泄朴,兩個問題等價重抖。得到支持向量還有一個作用,讓支持向量后面的那些點不參與計算祖灰。
image.png

省略一堆公式钟沛。
image.png

器學(xué)習(xí)中的算法(2)-支持向量機(jī)(SVM)基礎(chǔ)

線性不可分

由于線性可分的情況太少,下圖是一個典型的線性不可分的分類圖局扶。

image.png

image.png

要得到這種情況下的分類器恨统,有兩種方式。

  • 用圖示曲線將其完全分開
  • 另一種還是直線三妈, 不用保證可分性, 包容分錯畜埋。

針對第二種情況,假如懲罰函數(shù)畴蒲,使的分錯的情況越合理越好悠鞍。可以為分錯的點加上一點懲罰模燥,對一個分錯的點的懲罰函數(shù)就是這個點到其正確位置的距離:

image.png

上圖中狞玛,藍(lán)色,紅色的直線分別為支持向量所在的邊界涧窒,綠色的線為決策函數(shù)心肪。紫色的線表示分錯的點到其相應(yīng)的決策面的距離,這樣可以在原函數(shù)上加上一個懲罰函數(shù)(藍(lán)色部分)
image.png

核函數(shù)

剛剛提到纠吴,可以使用非線性的方法來完美劃分硬鞍。
讓空間從原來的線性空間變成一個更高維的空間,在這個高維的線性空間下戴已,在用一個超平面進(jìn)行分割罗侯。


image.png

可以將上圖的點映射到一個三維空間(z1, z2, z3),并對映射后的坐標(biāo)旋轉(zhuǎn)就可以得到一個線性可分的集扫尖。


image.png

image.png

上面就是對svm的簡單理解贷币,筆者也不太懂,只是做個記錄握联,期待后面有能力填坑桦沉。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末每瞒,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子纯露,更是在濱河造成了極大的恐慌剿骨,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,755評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件埠褪,死亡現(xiàn)場離奇詭異浓利,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)钞速,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,305評論 3 395
  • 文/潘曉璐 我一進(jìn)店門贷掖,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人渴语,你說我怎么就攤上這事苹威。” “怎么了遵班?”我有些...
    開封第一講書人閱讀 165,138評論 0 355
  • 文/不壞的土叔 我叫張陵屠升,是天一觀的道長。 經(jīng)常有香客問我狭郑,道長腹暖,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,791評論 1 295
  • 正文 為了忘掉前任翰萨,我火速辦了婚禮脏答,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘亩鬼。我一直安慰自己殖告,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,794評論 6 392
  • 文/花漫 我一把揭開白布雳锋。 她就那樣靜靜地躺著黄绩,像睡著了一般。 火紅的嫁衣襯著肌膚如雪玷过。 梳的紋絲不亂的頭發(fā)上爽丹,一...
    開封第一講書人閱讀 51,631評論 1 305
  • 那天,我揣著相機(jī)與錄音辛蚊,去河邊找鬼粤蝎。 笑死,一個胖子當(dāng)著我的面吹牛袋马,可吹牛的內(nèi)容都是我干的初澎。 我是一名探鬼主播,決...
    沈念sama閱讀 40,362評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼虑凛,長吁一口氣:“原來是場噩夢啊……” “哼碑宴!你這毒婦竟也來了软啼?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,264評論 0 276
  • 序言:老撾萬榮一對情侶失蹤墓懂,失蹤者是張志新(化名)和其女友劉穎焰宣,沒想到半個月后霉囚,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體捕仔,經(jīng)...
    沈念sama閱讀 45,724評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,900評論 3 336
  • 正文 我和宋清朗相戀三年盈罐,在試婚紗的時候發(fā)現(xiàn)自己被綠了榜跌。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,040評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡盅粪,死狀恐怖钓葫,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情票顾,我是刑警寧澤础浮,帶...
    沈念sama閱讀 35,742評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站奠骄,受9級特大地震影響豆同,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜含鳞,卻給世界環(huán)境...
    茶點故事閱讀 41,364評論 3 330
  • 文/蒙蒙 一影锈、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧蝉绷,春花似錦鸭廷、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,944評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至桅狠,卻和暖如春讼载,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背垂攘。 一陣腳步聲響...
    開封第一講書人閱讀 33,060評論 1 270
  • 我被黑心中介騙來泰國打工维雇, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人晒他。 一個月前我還...
    沈念sama閱讀 48,247評論 3 371
  • 正文 我出身青樓吱型,卻偏偏與公主長得像,于是被迫代替她去往敵國和親陨仅。 傳聞我的和親對象是個殘疾皇子津滞,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,979評論 2 355

推薦閱讀更多精彩內(nèi)容