支持向量機之最小二乘(LS)-------6

上次了解了核函數(shù)與損失函數(shù)之后顽悼,支持向量機的理論已經(jīng)基本完成,今天將談論一種數(shù)學優(yōu)化技術(shù)------最小二乘法(Least Squares, LS)∽卟福現(xiàn)在引用一下《正態(tài)分布的前世今生》里的內(nèi)容稍微簡單闡述下刁赖。我們口頭中經(jīng)常說:一般來說,平均來說僚焦。如平均來說,不吸煙的健康優(yōu)于吸煙者曙痘,之所以要加“平均”二字芳悲,是因為凡事皆有例外,總存在某個特別的人他吸煙但由于經(jīng)常鍛煉所以他的健康狀況可能會優(yōu)于他身邊不吸煙的朋友边坤。而最小二乘法的一個最簡單的例子便是算術(shù)平均名扛。

最小二乘法(又稱最小平方法)是一種數(shù)學優(yōu)化技術(shù)。它通過最小化誤差的平方和尋找數(shù)據(jù)的最佳函數(shù)匹配茧痒。利用最小二乘法可以簡便地求得未知的數(shù)據(jù)肮韧,并使得這些求得的數(shù)據(jù)與實際數(shù)據(jù)之間誤差的平方和為最小。用函數(shù)表示為:

使誤差平方和達到最小以尋求估計值的方法旺订,就叫做最小二乘法弄企,用最小二乘法得到的估計,叫做最小二乘估計区拳。當然拘领,取平方和作為目標函數(shù)只是眾多可取的方法之一。

最小二乘法是Legendre 在1806 年發(fā)表的樱调,基本思想就是認為測量中有誤差约素,我們求解出導致累積誤差最小的參數(shù)即可。

????????對最小二乘法的優(yōu)良性做了幾點說明:

最小二乘使得誤差平方和最小笆凌,并在各個方程的誤差之間建立了一種平衡圣猎,從而防止某一個極端誤差取得支配地位

計算中只要求偏導后求解線性方程組,計算過程明確便捷

最小二乘可以導出算術(shù)平均值作為估計值

對于最后一點菩颖,從統(tǒng)計學的角度來看是很重要的一個性質(zhì)样漆。推理如下:假設(shè)真值為θ为障,x1, x2, · · · , xn 為n 次測量值晦闰,每次測量的誤差為ei = xi ? θ放祟,按最小二乘法,誤差累積為:

求解θ 使L(θ) 達到最小呻右,正好是算術(shù)平均

由于算術(shù)平均是一個歷經(jīng)考驗的方法跪妥,而以上的推理說明,算術(shù)平均是最小二乘的一個特例声滥,所以從另一個角度說明了最小二乘方法的優(yōu)良性眉撵,使我們對最小二乘法更加有信心。

最小二乘法發(fā)表之后很快得到了大家的認可接受落塑,并迅速的在數(shù)據(jù)分析實踐中被廣泛使用纽疟。不過歷史上又有人把最小二乘法的發(fā)明歸功于Gauss,這又是怎么一回事呢憾赁。Gauss 在1809 年也發(fā)表了最小二乘法污朽,并且聲稱自己已經(jīng)使用這個方法多年。Gauss 發(fā)明了小行星定位的數(shù)學方法龙考,并在數(shù)據(jù)分析中使用最小二乘方法進行計算蟆肆,準確的預測了谷神星的位置。

說了這么多晦款,貌似跟本文的主題支持向量機沒啥關(guān)系呀炎功,別急,請讓我繼續(xù)闡述缓溅。本質(zhì)上說蛇损,最小二乘法即是一種參數(shù)估計方法,說到參數(shù)估計肛宋,咱們得從一元線性模型說起州藕。

什么是一元線性模型呢?先來梳理下幾個基本概念:

(1)?監(jiān)督學習中酝陈,如果預測的變量是離散的床玻,我們稱其為分類(如決策樹,支持向量機等)沉帮,如果預測的變量是連續(xù)的锈死,我們稱其為回歸。

(2) 回歸分析中穆壕,如果只包括一個自變量和一個因變量待牵,且二者的關(guān)系可用一條直線近似表示,這種回歸分析稱為一元線性回歸分析喇勋。

(3) 如果回歸分析中包括兩個或兩個以上的自變量缨该,且因變量和自變量之間是線性關(guān)系,則稱為多元線性回歸分析川背。

(4)?對于二維空間線性是一條直線贰拿;對于三維空間線性是一個平面蛤袒,對于多維空間線性是一個超平面。

對于一元線性回歸模型, 假設(shè)從總體中獲取了n 組觀察值(x1, y1), (x2, y2), · · · , (xn, yn)膨更。對于平面中的這n個點妙真,可以使用無數(shù)條曲線來擬合。要求樣本回歸函數(shù)盡可能好地擬合這組值荚守。綜合起來看珍德,這條直線處于樣本數(shù)據(jù)的中心位置最合理。

選擇最佳擬合曲線的標準可以確定為:使總的擬合誤差(即總殘差)達到最小矗漾。有以下三個標準可以選擇:

1. 用“殘差和最小”確定直線位置是一個途徑锈候。但很快發(fā)現(xiàn)計算“殘差和”存在相互抵消的問題。

2. 用“殘差絕對值和最小”確定直線位置也是一個途徑敞贡。但絕對值的計算比較麻煩晴及。

3. 最小二乘法的原則是以“殘差平方和最小”確定直線位置。用最小二乘法除了計算比較方便外嫡锌,得到的估計量還具有優(yōu)良特性虑稼。這種方法對異常值非常敏感。

最常用的是普通最小二乘法Ordinary Least Square, OLS :所選擇的回歸模型應該使所有觀察值的殘差平方和達到最小势木,即采用平方損失函數(shù)蛛倦。

我們定義樣本回歸模型為:

其中ei 為樣本(xi, yi) 的誤差。定義平方損失函數(shù):

SMO 算法則通過Q 最小確定這條直線啦桌,即確定β0 和 β1溯壶,以β0 和 β1 為變量,把它們看作是Q 的函數(shù)甫男,就變成了一個求極值的問題且改,可以通過求導數(shù)得到。求Q 對兩個待估參數(shù)的偏導數(shù)并令其等于0:

求解可以得到:

這就是最小二乘法的解法板驳,就是求得平方損失函數(shù)的極值點又跛。自此,你看到求解最小二乘法與求解SVM 問題何等相似若治,尤其是定義損失函數(shù)慨蓝,而后通過偏導求得極值。

上面僅僅給出了SMO算法的最終求解公式端幼,并未給出具體的求解過程礼烈,這個內(nèi)容將在明天給出,也是關(guān)于支持向量機基本理論的最后一點內(nèi)容~~~~

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末婆跑,一起剝皮案震驚了整個濱河市此熬,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖犀忱,帶你破解...
    沈念sama閱讀 216,496評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件疟赊,死亡現(xiàn)場離奇詭異,居然都是意外死亡峡碉,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,407評論 3 392
  • 文/潘曉璐 我一進店門驮审,熙熙樓的掌柜王于貴愁眉苦臉地迎上來鲫寄,“玉大人,你說我怎么就攤上這事疯淫〉乩矗” “怎么了?”我有些...
    開封第一講書人閱讀 162,632評論 0 353
  • 文/不壞的土叔 我叫張陵熙掺,是天一觀的道長未斑。 經(jīng)常有香客問我,道長币绩,這世上最難降的妖魔是什么蜡秽? 我笑而不...
    開封第一講書人閱讀 58,180評論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮缆镣,結(jié)果婚禮上芽突,老公的妹妹穿的比我還像新娘。我一直安慰自己董瞻,他們只是感情好寞蚌,可當我...
    茶點故事閱讀 67,198評論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著钠糊,像睡著了一般挟秤。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上抄伍,一...
    開封第一講書人閱讀 51,165評論 1 299
  • 那天艘刚,我揣著相機與錄音,去河邊找鬼截珍。 笑死昔脯,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的笛臣。 我是一名探鬼主播云稚,決...
    沈念sama閱讀 40,052評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼沈堡!你這毒婦竟也來了静陈?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,910評論 0 274
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎鲸拥,沒想到半個月后拐格,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,324評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡刑赶,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,542評論 2 332
  • 正文 我和宋清朗相戀三年捏浊,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片撞叨。...
    茶點故事閱讀 39,711評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡金踪,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出牵敷,到底是詐尸還是另有隱情胡岔,我是刑警寧澤,帶...
    沈念sama閱讀 35,424評論 5 343
  • 正文 年R本政府宣布枷餐,位于F島的核電站靶瘸,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏毛肋。R本人自食惡果不足惜怨咪,卻給世界環(huán)境...
    茶點故事閱讀 41,017評論 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望润匙。 院中可真熱鬧惊暴,春花似錦、人聲如沸趁桃。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,668評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽卫病。三九已至油啤,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間蟀苛,已是汗流浹背益咬。 一陣腳步聲響...
    開封第一講書人閱讀 32,823評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留帜平,地道東北人幽告。 一個月前我還...
    沈念sama閱讀 47,722評論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像裆甩,于是被迫代替她去往敵國和親冗锁。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,611評論 2 353

推薦閱讀更多精彩內(nèi)容