支持向量機(SVM)算法

支持向量機(Support Vector Machine):SVM算法既可以處理分類問題似舵,也可以處理回歸問題绅喉。SVM算法要解決的問題就是找到最好的決策邊界,以對問題進行分類和求解窟坐。
我們用這張圖來理解SVM算法,圖片中有兩類點方形和圓形,我們要找到一條分界線將兩類點清楚的分開惊搏。我們的依據是分界線離最近點的距離要最大贮乳,這樣的決策邊界是最優(yōu)的,右圖的決策邊界要優(yōu)于左圖的決策邊界恬惯,因為它的分類效果更好向拆,直觀地看就是決策邊界越寬越好。我們將這些最近的點成為支持向量酪耳,我們的決策邊界的構造只取決于它們浓恳,與其他點無關。


support vectors.png

SVM是機器學習中非常重要的算法碗暗,也是面試中經常會被問到的算法颈将。因為SVM算法涉及到的數(shù)學問題非常的多,整個數(shù)學推導過程還是挺復雜的言疗。下方的鏈接是SVM算法的推導過程晴圾,如果想從事機器學習方面相關工作的,SVM的算法的數(shù)學原理是要掌握的噪奄。
鏈接:https://pan.baidu.com/s/1Ml-LbBkKy5bSZ4qJMSSGLQ
提取碼:u77t
1.SVM算法的核心要點
找到距離決策邊界最近的點死姚,然后使得該點到決策邊界的距離最大。
2.解決特征難以分割的數(shù)據
下圖中左邊的數(shù)據點在二維平面中是難以分割的勤篮,決策邊界非常復雜都毒。通過將二維數(shù)據映射到三位空間中,由于新增了一個高度方向的維度碰缔,數(shù)據點在這個方向上就變得容易區(qū)分了账劲。原數(shù)據X通過映射函數(shù)φ轉換成φ(X),使得新的數(shù)據集φ(X)容易分類手负。

維度變換.png

3.SVM API文檔

sklearn.svm.SVC(C=1.0, kernel=’rbf’, degree=3, gamma=’auto_deprecated’, coef0=0.0,
 shrinking=True, probability=False, tol=0.001, cache_size=200, class_weight=None, 
verbose=False, max_iter=-1, decision_function_shape=’ovr’, random_state=None)

SVM關鍵參數(shù)說明


C:浮點型數(shù)值涤垫,默認值為1,可指定數(shù)值竟终。這個參數(shù)我們稱之為松弛因子蝠猬,C值越大,決策邊界越窄统捶,分類要求越嚴格榆芦。C值越小,決策邊界越寬喘鸟,分類要求寬松匆绣,前面我們說到決策邊界越寬越好。
kernel:核變換參數(shù)什黑,如上面的將二維數(shù)據轉換為三維數(shù)據崎淳,就需要指定kernel參數(shù)。kernel可指定為‘linear’, ‘poly’, ‘rbf’, ‘sigmoid’, ‘precomputed’愕把,默認為'rbf'拣凹。'linear'就是線性變換森爽,'rbf'就是對數(shù)據做高斯變換,如將二維數(shù)據轉換為三維數(shù)據嚣镜。
gamma爬迟,默認為'auto',只有當kernel指定為'rbf'時菊匿,gamma數(shù)值才有效付呕。gamma值越大,支持向量的個數(shù)越少跌捆,gamma值越小徽职,支持向量的個數(shù)越多。支持向量的數(shù)量影響模型的訓練與預測速度疹蛉。


SVM 樣例演示
使用sklearn中封裝好的iris數(shù)據集活箕,最終得出SVM算法的精度。

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn import datasets

iris = datasets.load_iris()
iris_X = iris.data
iris_y = iris.target

from sklearn.model_selection import train_test_split
#切分數(shù)據集
X_train,X_test,y_train,y_test = train_test_split(iris_X,iris_y,test_size = 0.3,random_state = 0)
#調用SVC算法
from sklearn.svm import SVC
clf = SVC(kernel = 'linear')
clf.fit(X_train,y_train)
clf.score(X_test,y_test)
0.9777777777777777

SVM算法小結:
SVM算法的目標是求解最優(yōu)的決策邊界可款,對決策邊界起決定性的作用的數(shù)據點育韩,我們稱之為支持向量,也就是距離決策邊界最近的數(shù)據點闺鲸。
SVM算法可以將低維不可分的數(shù)據轉化為高維可分的數(shù)據筋讨。
SVM算法中最主要的三個參數(shù):
C:懲罰力度的大小,C越小摸恍,容錯能力越大悉罕,對決策邊界的要求越寬松。C越大立镶,容錯能力越小壁袄,對決策邊界的要求越嚴格。
kernel:核函數(shù)媚媒,默認為'rbf'高斯核函數(shù)嗜逻,對原始數(shù)據進行變換。
gamma:只有當kernel為'rbf'缭召,gamma值才回起作用栈顷,gamma值越大,選用的支持向量越少嵌巷,gamma值越小萄凤,所選用的支持向量越多。

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末搪哪,一起剝皮案震驚了整個濱河市靡努,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖颤难,帶你破解...
    沈念sama閱讀 218,204評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件神年,死亡現(xiàn)場離奇詭異已维,居然都是意外死亡行嗤,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,091評論 3 395
  • 文/潘曉璐 我一進店門垛耳,熙熙樓的掌柜王于貴愁眉苦臉地迎上來栅屏,“玉大人,你說我怎么就攤上這事堂鲜≌祸ǎ” “怎么了?”我有些...
    開封第一講書人閱讀 164,548評論 0 354
  • 文/不壞的土叔 我叫張陵缔莲,是天一觀的道長哥纫。 經常有香客問我,道長痴奏,這世上最難降的妖魔是什么蛀骇? 我笑而不...
    開封第一講書人閱讀 58,657評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮读拆,結果婚禮上擅憔,老公的妹妹穿的比我還像新娘。我一直安慰自己檐晕,他們只是感情好暑诸,可當我...
    茶點故事閱讀 67,689評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著辟灰,像睡著了一般个榕。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上芥喇,一...
    開封第一講書人閱讀 51,554評論 1 305
  • 那天西采,我揣著相機與錄音,去河邊找鬼乃坤。 笑死苛让,一個胖子當著我的面吹牛,可吹牛的內容都是我干的湿诊。 我是一名探鬼主播狱杰,決...
    沈念sama閱讀 40,302評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼厅须!你這毒婦竟也來了仿畸?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 39,216評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎错沽,沒想到半個月后簿晓,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經...
    沈念sama閱讀 45,661評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡千埃,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,851評論 3 336
  • 正文 我和宋清朗相戀三年憔儿,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片放可。...
    茶點故事閱讀 39,977評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡谒臼,死狀恐怖,靈堂內的尸體忽然破棺而出耀里,到底是詐尸還是另有隱情蜈缤,我是刑警寧澤,帶...
    沈念sama閱讀 35,697評論 5 347
  • 正文 年R本政府宣布冯挎,位于F島的核電站底哥,受9級特大地震影響,放射性物質發(fā)生泄漏房官。R本人自食惡果不足惜趾徽,卻給世界環(huán)境...
    茶點故事閱讀 41,306評論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望易阳。 院中可真熱鬧附较,春花似錦、人聲如沸潦俺。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,898評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽事示。三九已至早像,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間肖爵,已是汗流浹背卢鹦。 一陣腳步聲響...
    開封第一講書人閱讀 33,019評論 1 270
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留劝堪,地道東北人冀自。 一個月前我還...
    沈念sama閱讀 48,138評論 3 370
  • 正文 我出身青樓,卻偏偏與公主長得像秒啦,于是被迫代替她去往敵國和親熬粗。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,927評論 2 355

推薦閱讀更多精彩內容