譯自:https://en.wikipedia.org/wiki/Support_vector_machine
? 類似和google搜索上的差距棒口,百度百科和wiki相比而言就是坑爹的寄月,wiki良心,唯一不足是沒有中文无牵。狗尾續(xù)翻譯下:
? 幾個定論假設(shè):
? 1漾肮、根據(jù)經(jīng)驗(yàn),間隔margin越大茎毁、可信度confidence越高克懊,這是SVM之所以要尋找最大間隔超平面hyperplane的實(shí)踐基礎(chǔ);
? 2七蜘、原始樣本也就是歐氏有限維空間中的向量可以被映射到更高維特征空間:it was proposed that the original finite-dimensional space be mapped into a much higher-dimensional space
? 欣賞一下wiki對超平面精煉的語文定義:
? The hyperplanes in the higher-dimensional space are defined as the set of points
whose dot product with a vector(w) in that space is constant(b).
? 數(shù)學(xué)定義:w·x=b谭溉;或者寫為:w·x-b=0;一些資料簡寫為(w,b)橡卤,即所有滿足該方程的向量x代表的點(diǎn)集夜只;
? w是超平面法向量;x是超平面上所有點(diǎn)代表的向量蒜魄;b是標(biāo)量即超平面截距也就是語文定義所說的constant常數(shù)扔亥。
劃幾個重點(diǎn):
1、規(guī)范化的原因與齊次線性方程組的解結(jié)構(gòu)有關(guān)谈为,AX-b=0形式的齊次線性方程組往往具有無數(shù)解旅挤,因?yàn)閷Ψ匠套霰冻艘约皟山M解相加所得全他媽是解(實(shí)質(zhì)上這對應(yīng)著矩陣行初等變換規(guī)則:倍乘、相加)伞鲫;因?yàn)檫@個原因粘茄,AX-b=0形式或者具體來說ax+by+c=0形式的方程,如果已知系數(shù)那么x和y一般是一條直線(行空間),但反過來知道仨(x,y)往往不能直接求出abc柒瓣,這其實(shí)是有無數(shù)組解的表現(xiàn)儒搭,行列式=0也是表現(xiàn),幾何上來解釋就是:行列式為零芙贫,系數(shù)矩陣A實(shí)際上做了“降維”變換搂鲫,如果是三維空間則A的三個列向量線性相關(guān)也就是共面甚至于共線,其張成的體積為零磺平,A張成子空間就是零空間魂仍,它與XY行空間正交,不管該空間是平面還是直線都有無數(shù)向量拣挪,這無數(shù)向量就是無數(shù)組解擦酌,它們?nèi)紳M足方程式,它們一定線性相關(guān)菠劝;綜上所述為了統(tǒng)一衡量比較向量到超平面的距離赊舶,需要做規(guī)范化。
2赶诊、核函數(shù)僅僅方便計算映射到高維特征空間的向量點(diǎn)積锯岖,參考:http://mp.weixin.qq.com/s?__biz=MzIxNDIwMTk2OQ==&mid=2649077019&idx=1&sn=e0c4a6c502e3668e1dc410f21e531cfd&scene=0#wechat_redirect
3、點(diǎn)積/內(nèi)積是基礎(chǔ)甫何,本質(zhì)是向量a投影到向量b方向出吹,投影長度與b長度的乘積,它的重要之處在于:它是唯一的可以在向量空間中簡潔地定義辙喂、計算向量長度和角度的唯一工具捶牢!恩~類似于π在三角函數(shù)中的作用吧,你說它本身有什么意義巍耗,說不上秋麸,但三角函數(shù)體系中的公式大量用它,要說不用能不能定義公式呢炬太,也行灸蟆,但肯定不會那么簡潔了,不優(yōu)雅亲族,點(diǎn)積也叫標(biāo)量積炒考,意思是兩個向量想乘得到標(biāo)量。范數(shù)就是向量長度霎迫,是點(diǎn)積的開方斋枢,結(jié)合規(guī)范化,要令法向量規(guī)范化知给,可以令向量除以范數(shù)瓤帚。
恩也許以后核函數(shù)/核方法會像微積分一樣成體系也說不定...
待續(xù)...