支持向量機(jī)SVM(1)線性可分支持向量機(jī)、拉格朗日乘子法八千、KKT條件吗讶、SMO

支持向量機(jī)(SVM,Support Vecor Machine)是一種二分類算法恋捆,在集成學(xué)習(xí)和深度學(xué)習(xí)火起來之前支持向量機(jī)的使用非常廣泛照皆,其分類效果好、適用性廣(線性沸停、非線性都可用)膜毁,功能真的是很棒棒,下來我們就來梳理一下支持向量機(jī)的原理愤钾。

1 支持向量機(jī)的原理

1)背景

回想一下之前講過的邏輯回歸和感知機(jī)瘟滨,他們的目標(biāo)都是找到一個(gè)將線性可分的數(shù)據(jù)一分為二的決策超平面:

如上圖所示,決策超平面的一側(cè)為正樣本能颁,另一側(cè)為負(fù)樣本室奏,但是我們可以發(fā)現(xiàn)妨蛹,滿足這個(gè)特性的決策超平面并不是唯一的窘行,在有限的線性可分樣本中简识,正負(fù)樣本點(diǎn)之間的間隔使得不同的決策超平面存在挪略,那么如果樣本點(diǎn)繼續(xù)增加病梢,這些決策超平面中那個(gè)分類效果最好呢傲须?也就是說誰的泛華效果最好呢造虎?——這就是支持向量機(jī)要解決的主要問題块攒,也是支持向量機(jī)與感知機(jī)的主要區(qū)別谦疾。

2)支持向量

就上面的圖來說南蹂,主觀上看哪個(gè)超平面的分類泛化能力最強(qiáng)呢?我們認(rèn)為紅色的那條可能會(huì)比較好念恍,這條線距離最近的紅點(diǎn)區(qū)域和最近的藍(lán)點(diǎn)區(qū)域都比較遠(yuǎn)六剥,無論是紅點(diǎn)還是藍(lán)點(diǎn)晚顷,再向靠近超平面的方向增加一些點(diǎn)都沒問題,還可以被這條超平面分的比較開疗疟,那兩條虛線就沒有這么好的效果该默,如下圖所示,我們新增幾個(gè)點(diǎn)策彤,可以看出其分類效果的差別:

似乎可以得出這樣的結(jié)論:超平面離直線兩邊的數(shù)據(jù)的間隔越大栓袖,對訓(xùn)練集的數(shù)據(jù)的局限性或噪聲有最大的容忍能力,也就是所謂的魯棒性店诗。

所以裹刮,如果所有的樣本點(diǎn)不只是可以被決策超平面分開,還和超平面保持一定的距離間隔庞瘸,那么這樣的分類超平面是更優(yōu)的捧弃,支持向量機(jī)就是要找到使這個(gè)間隔最大的決策超平面(即最大化下圖中的margin)。訓(xùn)練樣本中和這個(gè)超平面距離最近的樣本點(diǎn)被稱為支持向量擦囊,如下圖虛線所經(jīng)過的樣本點(diǎn)即為支持向量:

3)函數(shù)間隔违霞、幾何間隔

最大化間隔的思想我們大概了解了,不過要最大化這個(gè)間隔首先得量化霜第,怎么量化呢葛家?

支持向量是距離分類超平面最近的樣本點(diǎn),那么樣本點(diǎn)距離超平面的距離不就是支持向量與分類超平面的距離嗎泌类?在前面的幾篇文章中我們也經(jīng)常提到樣本點(diǎn)到超平面的距離的度量癞谒,這里我們就稍微詳細(xì)點(diǎn)說下函數(shù)間隔和幾何間隔。

函數(shù)間隔

在決策超平面??^????+??=0確定的情況下刃榨,|??^????+??|能夠表示點(diǎn)x到超平面的距離遠(yuǎn)近弹砚;??^????+??y是否同號能夠表示分類是否正確,所以可用y(??^????+??)來表示分類的正確性及確定性枢希,我們在羅輯回歸和感知機(jī)中就有類似的用法桌吃,這就是函數(shù)間隔的概念,定義函數(shù)間隔??′為:

\gamma^{'} = y(w^Tx + b)

幾何間隔

函數(shù)間隔雖然可以表示分類的正確性和確定性苞轿,但其缺點(diǎn)是只能在一個(gè)確定的超平面??^????+??=0下比較樣本點(diǎn)到超平面的相對距離茅诱,不同參數(shù)的超平面條件下計(jì)算的距離是不能比較大小的,比如超平面2??^????+2??=0??^????+??=0是同一個(gè)超平面搬卒,樣本點(diǎn)與其真實(shí)距離沒有變化瑟俭,但是函數(shù)距離卻翻了一倍,因此我們需要將參數(shù)加以約束契邀,使其具備可比性摆寄,我們定義幾何間隔:

\gamma = \frac{y(w^Tx + b)}{||w||_2} = \frac{\gamma^{'}}{||w||_2}

可見,幾何間隔才是點(diǎn)到超平面的真正距離,上一篇感知機(jī)中的損失函數(shù)正是幾何間隔的形式微饥,我們支持向量機(jī)也使用幾何間隔來表示支持向量到分類超平面的間隔逗扒,如上圖中的margin即為兩個(gè)支持向量與超平面的幾何間隔之和\frac{2}{||w||_2}

4)線性可分支持向量機(jī)模型

綜合上述內(nèi)容可知欠橘,線性可分支持向量機(jī)可以表示為:

f(x)=sign(w^*x+b^*)

式中矩肩,w^*x+b^*=0為與支持向量間隔最大化的分類超平面,可見與感知機(jī)是基本一樣的简软,就多了個(gè)間隔最大化的要求蛮拔。

2 支持向量機(jī)模型求解

1)目標(biāo)函數(shù)

通過上述已知述暂,支持向量機(jī)是要最大化支持向量與決策超平面之間的幾何間隔痹升,所以目標(biāo)函數(shù)為:

\max_{w,b} \;\; \gamma = \frac{y(w^Tx + b)}{||w||_2} \;\; s.t \;\; \frac{y_i(w^Tx_i + b)}{||w||_2} \geq \gamma ,i =1,2,...m

這個(gè)式子表示,最大化訓(xùn)練樣本與超平面的幾何間隔??畦韭,同時(shí)要保證約束條件每個(gè)訓(xùn)練樣本與超平面的幾何距離不小于??疼蛾,目標(biāo)函數(shù)可以改寫為:

\max_{w,b} \;\; \gamma=\frac{??′}{||w||_2}\;\; s.t \;\; y_i(w^Tx_i + b) \geq ??′ ,i =1,2,...m

一般我們都取函數(shù)間隔??′為1,為什么呢艺配,因?yàn)?img class="math-inline" src="https://math.jianshu.com/math?formula=%F0%9D%9B%BE%E2%80%B2" alt="??′" mathimg="1">的取值不影響最優(yōu)化問題的解察郁,假設(shè)??′不為1,就相當(dāng)于wb變?yōu)榱?img class="math-inline" src="https://math.jianshu.com/math?formula=%F0%9D%9B%BE%E2%80%B2w" alt="??′w" mathimg="1">和??′b转唉,對目標(biāo)函數(shù)和約束不等式都沒有影響皮钠,都是可以約掉的,所以??′為1完全沒問題赠法,此時(shí)最優(yōu)化問題變?yōu)椋?/p>

\max_{w,b} \;\; \frac{1}{||w||_2} \;\; s.t \;\; y_i(w^Tx_i + b) \geq 1 ,i =1,2,...m

可以轉(zhuǎn)變?yōu)椋?/p>

\min_{w,b} \;\; \frac{1}{2}||w||_2^2 \;\; s.t \;\; y_i(w^Tx_i + b) \geq 1 ,i =1,2,...m

(有的地方說要最大化margin同時(shí)保證兩類的支持向量到超平面的距離相等麦轰,所以有max\frac{2}{||w||_2},個(gè)人認(rèn)為這個(gè)解釋很牽強(qiáng)砖织,明明優(yōu)化\gamma的過程中兩類就會(huì)互相博弈找到這個(gè)最優(yōu)的超平面)根據(jù)下面定義的描述發(fā)現(xiàn)款侵,這個(gè)凸最優(yōu)化問題是一個(gè)凸二次規(guī)劃問題(convex quadratic programming)。

目標(biāo)函數(shù)和約束條件都為變量的線性函數(shù)——線性規(guī)劃問題侧纯;
目標(biāo)函數(shù)為變量的二次函數(shù)和約束條件為變量的線性函數(shù)——二次規(guī)劃問題新锈;
目標(biāo)函數(shù)和約束條件都為非線性函數(shù)——非線性規(guī)劃問題。

2)對偶問題轉(zhuǎn)化及求解

在感知機(jī)中我們說過眶熬,利用對偶問題可以從不同角度看待同一個(gè)問題妹笆,可能會(huì)引入新的參數(shù)來幫助我們優(yōu)化,在約束最優(yōu)化問題中娜氏,常常利用拉格朗日對偶性(Lagrange duality)將原始問題轉(zhuǎn)換為對偶問題拳缠,通過解對偶問題得到原始問題的解。

首先我們的優(yōu)化目標(biāo)函數(shù)可以使用拉格朗日乘子法(詳細(xì)內(nèi)容見附錄)轉(zhuǎn)變成拉格朗日函數(shù):

L(w,b,\lambda)= \frac{1}{2}||w||_2^2 +\sum_i^m \lambda_i [1-y_i(w^Tx_i + b)], \; \lambda_i\geq0

目標(biāo)函數(shù)的優(yōu)化轉(zhuǎn)變?yōu)椋?/p>

\min_{w,b}\;\max_{\lambda}\; L(w,b,\lambda)

這一步是什么意思呢牍白,因?yàn)榧s束不等式1-y_i(w^Tx_i + b)\leq 0,\lambda_i\geq 0脊凰,所以加號后面整體小于等于0,只有當(dāng)其取最大值是為0,此時(shí)\max_{\lambda}\; L(w,b,\lambda)= \frac{1}{2}||w||_2^2狸涌,即為原目標(biāo)函數(shù)切省,這個(gè)變形稱為廣義拉格朗日函數(shù)的極小極大問題,它與原問題是完全等價(jià)的帕胆,在對偶性中朝捆,這個(gè)問題被稱為原始問題(Primal problem)

這個(gè)優(yōu)化函數(shù)滿足KKT條件(詳細(xì)內(nèi)容見附錄)懒豹,可以實(shí)現(xiàn)強(qiáng)對偶芙盘,即可以通過拉格朗日對偶(Lagrange duality)將其轉(zhuǎn)化為等價(jià)的對偶問題:

\max_{\lambda}\;\min_{w,b}\; L(w,b,\lambda)

所以我們可以先求優(yōu)化函數(shù)極小值對應(yīng)的wb,再求的極大值對應(yīng)的拉格朗日乘子系數(shù)\lambda

\frac{\partial L}{\partial w} = 0 \;\rightarrow w+\sum_i^m \lambda_iy_ix_i=0 \;\rightarrow w = \sum_{i=1}^{m}\lambda_iy_ix_i

\frac{\partial L}{\partial b} = 0 \;\rightarrow \sum_i^m \lambda_iy_i=0

優(yōu)化函數(shù)取得極小值時(shí)脸秽,w可以用\lambda儒老,而b無所謂,取什么值都不影響優(yōu)化函數(shù)取得極小值记餐,所以可得:

\begin{align} J(\lambda)&=\min_{w,b}\; L(w,b,\lambda)\\&= \frac{1}{2}||w||_2^2 +\sum_i^m \lambda_i [1-y_i(w^Tx_i + b)]\\ &= \frac{1}{2}w^Tw-\sum_{i=1}^{m}\lambda_iy_iw^Tx_i - \sum_{i=1}^{m}\lambda_iy_ib + \sum_{i=1}^{m}\lambda_i\\ &= \frac{1}{2}\sum_{i=1}^{m}(\lambda_iy_ix_i)^T\sum_{i=1}^{m}\lambda_iy_ix_i-(\lambda_iy_ix_i)^T\sum_{i=1}^{m}\lambda_iy_ix_i- \sum_{i=1}^{m}\lambda_iy_ib + \sum_{i=1}^{m}\lambda_i\\ &=-\frac{1}{2}\sum_{i=1}^{m}(\lambda_iy_ix_i)^T\sum_{i=1}^{m}\lambda_iy_ix_i- b\sum_{i=1}^{m}\lambda_iy_i + \sum_{i=1}^{m}\lambda_i\\ &=-\frac{1}{2}\sum_{i=1}^{m}\lambda_iy_ix_i^T\sum_{i=1}^{m}\lambda_iy_ix_i+ \sum_{i=1}^{m}\lambda_i\\ &=-\frac{1}{2}\sum_{i=1,j=1}^{m}\lambda_iy_ix_i^T\lambda_jy_jx_j+ \sum_{i=1}^{m}\lambda_i \end{align}

J(\lambda)完全是關(guān)于參數(shù)\lambda的函數(shù)驮樊,因此:
\max_{\lambda}\;\min_{w,b}\; L(w,b,\lambda)=\max_{\lambda}\;J(\lambda)=\max_{\lambda}\;-\frac{1}{2}\sum_{i=1,j=1}^{m}\lambda_iy_ix_i^T\lambda_jy_jx_j+ \sum_{i=1}^{m}\lambda_i

s.t. \sum_i^m \lambda_iy_i=0,\;\lambda_i\geq0

轉(zhuǎn)化為:

\min_{\lambda}\;\frac{1}{2}\sum_{i=1,j=1}^{m}\lambda_iy_ix_i^T\lambda_jy_jx_j-\sum_{i=1}^{m}\lambda_i

s.t. \sum_i^m \lambda_iy_i=0,\;\lambda_i\geq0

求出上式取得極小值時(shí)對應(yīng)的\lambda向量就可以求出wb了,這里一般需要用到SMO(Sequential Minimal Optimization片酝,序列最小優(yōu)化算法) 算法囚衔,還是比較復(fù)雜的,下面來看看怎么做雕沿。

3)序列最小優(yōu)化算法(SMO)

上述最優(yōu)化問題是要求解m個(gè)參數(shù)(λ_1,λ_2,λ_3,...,λ_m)练湿,其他參數(shù)均為已知,有多種算法可以對上述問題求解审轮,比如之前介紹過的次梯度下降應(yīng)該就可以肥哎,但是算法復(fù)雜度均很大。序列最小最優(yōu)化算法(SMO)可以高效的求解上述SVM問題断国,它把原始求解N個(gè)參數(shù)二次規(guī)劃問題分解成很多個(gè)子二次規(guī)劃問題分別求解贤姆,每個(gè)子問題只需要求解兩個(gè)參數(shù),方法類似于坐標(biāo)上升稳衬,節(jié)省時(shí)間成本和降低了內(nèi)存需求霞捡。每次啟發(fā)式選擇兩個(gè)變量進(jìn)行優(yōu)化,不斷循環(huán)薄疚,直到達(dá)到函數(shù)最優(yōu)值碧信。

為什么每次優(yōu)化兩個(gè)參數(shù)呢?像坐標(biāo)下降不是每次只優(yōu)化一個(gè)參數(shù)嗎街夭?因?yàn)槲覀冞@里有個(gè)約束砰碴, \sum_i^m \lambda_iy_i=0,如果認(rèn)為m-1個(gè)都是固定值板丽,那么剩下的那個(gè)也就確定了呈枉,所以選擇每次優(yōu)化兩個(gè)趁尼。因?yàn)镾MO比較復(fù)雜,本篇文章就不細(xì)說了猖辫,這里先這樣提一下SMO酥泞,大家知道上面的優(yōu)化是用SMO計(jì)算的就好。

使用SMO算法啃憎,我們得到了\max_{λ}\;J(λ)對應(yīng)的λ^*芝囤,所以:

w = \sum_{i=1}^{m}λ_i^*y_ix_i

因?yàn)閷χС窒蛄坑校?img class="math-inline" src="https://math.jianshu.com/math?formula=y_i(w%5ETx_i%2Bb)%3D1" alt="y_i(w^Tx_i+b)=1" mathimg="1">,所以要根據(jù)這個(gè)等式解出b需要將支持向量樣本點(diǎn)代入辛萍,怎么獲得支持向量呢悯姊?KKT條件中的對偶互補(bǔ)條件λ_i(y_i(w^Tx_i+b)?1)=0,我們已經(jīng)求出了λ^*贩毕,如果λ_i>0則有y_i(w^Tx_i+b)=1 悯许,即樣本點(diǎn)為支持向量,求解b

y_i^2(w^Tx_i+b)=y_i

b=y_i-w^Tx_i= y_i-\sum_{i=1}^{m}λ_i^*y_ix_i^Tx_i

顯然耳幢,支持向量大多不止一個(gè)岸晦,對線性可分支持向量機(jī)來說欧啤,可以證明分類超平面是存在且唯一的睛藻,b的解也就只有一個(gè),此時(shí)用不同的支持向量求出來的b都是相同的邢隧,如果數(shù)據(jù)有噪聲店印,并不是完全線性可分的,那么為了增加模型的魯棒性倒慧,b取所有值的平均值按摘,即假設(shè)有n個(gè)支持向量,則:

b=\frac{1}{n}\sum_i^n (y_i-w^Tx_i)

至此纫谅,線性可分支持向量機(jī)的模型參數(shù)就求出來了炫贤,模型也就確定了。

4)線性可分支持向量機(jī)算法流程

綜合以上全部內(nèi)容付秕,可以得到線性可分支持向量機(jī)的算法流程:

  • 輸入:線性可分的樣本T=(x_1,y_1),(x_2,y_2),...,(x_m,y_m)兰珍,xn維特征向量,y\in[+1,-1]询吴;
  • 輸出:w,b掠河,支持向量機(jī)模型f(x)=sign(w^Tx+b)
  1. 確定目標(biāo)函數(shù):

\min_{\lambda}\;\frac{1}{2}\sum_{i=1,j=1}^{m}\lambda_iy_ix_i^T\lambda_jy_jx_j-\sum_{i=1}^{m}\lambda_i

s.t. \sum_i^m \lambda_iy_i=0,\;\lambda_i\geq0

  1. 使用SMO優(yōu)化目標(biāo)函數(shù)猛计,得到對應(yīng)的λ^*唠摹;
  2. 根據(jù)λ^*找到樣本中的共k=1個(gè)支持向量,計(jì)算參數(shù)w,b

w^* = \sum_{i=1}^{m}λ_i^*y_ix_i

b^*=\frac{1}{k}\sum_i^k (y_i-w^Tx_i)

  1. 得到支持向量機(jī)模型f(x)=sign(w^{*T}x+b^*)奉瘤。

3 線性可分支持向量機(jī)小結(jié)

線性可分支持向量機(jī)假設(shè)數(shù)據(jù)是線性可分的勾拉,這點(diǎn)跟感知機(jī)、邏輯回歸是一樣的,就是為了最大化間隔才使得線性可分SVM的理論復(fù)雜了這么多藕赞,不過對于非線性可分的數(shù)據(jù)還是沒法處理苛秕,怎么辦呢?我們接下來看一下基于軟間隔最大化的線性支持向量機(jī)(linear support vector machine)找默。


附錄

1)拉格朗日乘子法

拉格朗日乘子法是一種尋找多元函數(shù)在一組約束下的極值的方法艇劫,通過引入拉格朗日乘子,可將有d個(gè)變量與k個(gè)約束條件的優(yōu)化問題轉(zhuǎn)換為具有d+k個(gè)變量的無約束優(yōu)化問題惩激。這種方法引入了一種新的標(biāo)量未知數(shù)店煞,即拉格朗日乘子:它是約束方程的梯度的線性組合中,每個(gè)梯度向量的系數(shù)风钻。

(1)無約束條件
我們一般對函數(shù)變量求導(dǎo)顷蟀,令導(dǎo)數(shù)等于0的點(diǎn)認(rèn)為是極值點(diǎn)。

(2)等式約束條件
設(shè)目標(biāo)函數(shù)為f(x)骡技,約束條件為h_i(x)

min f(x) \;\\ s.t. \;\;h_i(x)=0,\;\;i=1,2,...,n

對于這種形式的優(yōu)化問題我們一般使用拉格朗日乘子法(Lagrange multiplier)鸣个,當(dāng)然也能用消元法,不過太麻煩了布朦,先從幾何上理解拉格朗日乘子法(以二維為例)囤萤,假設(shè)要求f(x,y)極值,約束條件h(x,y)=0是趴,函數(shù)f(x,y)相當(dāng)于其在三維坐標(biāo)系下f(x,y)的等高線涛舍,h(x,y)=0是一條曲線,試想如果是等高線與曲線的相交點(diǎn)唆途,說明曲線還可以沿著等高線變大或變小的方向走下去富雅,必然不是極值點(diǎn),所以約束曲線h(x,y)=0與某一條等高線f(x,y)=a相切時(shí)肛搬,函數(shù)取得極值:

在切點(diǎn)處h(x,y)=0f(x,y)的法向量共線没佑,也就是函數(shù)f(x,y)h(x,y)在切點(diǎn)處的梯度平行,有:

\nabla f=λ'\nabla h

因此滿足:

\begin{cases} \nabla f+λ\nabla h=0 \\ \\ h(x,y)=0 \end{cases}

即為約束下目標(biāo)函數(shù)的極值點(diǎn)温赔,也可以寫成我們常見的:

F(x,y)=f(x,y)+λh(x,y)

因?yàn)閷ζ淝髮?dǎo)并令導(dǎo)數(shù)為0可得:

\begin{cases} \frac{\partial F}{\partial (x,y)}=\nabla f+λ\nabla h =0 \\ \\ \frac{\partial F}{\partial λ}=h(x,y)=0 \end{cases}

跟上面的方程組是一樣的蛤奢,這也是從代數(shù)上理解拉格朗日乘子法的方式,因此拉格朗日乘子法可以用來求多元函數(shù)在一組等式約束下的極值让腹。

(3)不等式約束條件
設(shè)目標(biāo)函數(shù)f(x)远剩,不等式約束為g(x),等式約束條件h(x)

min f(x) \;\\ s.t. \;\;h_i(x)=0,\;\;i=1,2,...,n \\ \;\;g_j(x)\leq0,\;\;j=1,2,...,m

在不等式約束下骇窍,極值點(diǎn)的位置可能有兩種情況瓜晤,一種是極值點(diǎn)被不等式約束包含,如下左圖所示腹纳;另一種是極值點(diǎn)沒有被不等式約束包含痢掠,如下右圖所示:

對于第一種情況來說驱犹,顯然滿足\nabla f=0即可,對于第二種情況足画,依然是等高線與不等式的邊界相切的點(diǎn)為極值點(diǎn)雄驹,可知:

\begin{cases} \nabla f+\mu\nabla h=0 \\ \\ h(x,y)=0 \end{cases}

看起來似乎跟等式約束的一樣,其實(shí)是有一些區(qū)別的淹辞,我們知道医舆,等高線在切點(diǎn)處的梯度(也就是切線的法向量)的方向是向著等高線值增大的方向的,對于圖示的凸函數(shù)來說象缀,就是如圖所示向外的蔬将,而對于不等式g_j(x)\leq0,其梯度方向必然是相反朝向的央星,因?yàn)樘荻纫赶蛟鲩L的方向霞怀,肯定會(huì)指向g_j(x)>0的方向了:

因此,等式約束的拉格朗日乘子λ沒有符號限制莉给,而不等式約束的拉格朗日乘子\mu\geq 0毙石,所以將初始求極值問題轉(zhuǎn)化為:

\begin{cases} \nabla f+\mu\nabla h=0 \\ \\ h(x,y)=0 \\ \\ \mu\geq 0 \end{cases}

可以寫成我們常見的:

F(x,y)=f(x,y)+\sum_i^nλ_ih_i(x,y)+\sum_j^m\mu_j g_j(x,y), \;\; \mu_j\geq 0

2)KKT條件

仍然是設(shè)目標(biāo)函數(shù)f(x),不等式約束為g(x)颓遏,等式約束條件h(x)

min f(x) \;\\ s.t. \;\;h_i(x)=0,\;\;i=1,2,...,n \\ \;\;g_j(x)\leq0,\;\;j=1,2,...,m

通過拉格朗日乘子法我們可以將求有約束的函數(shù)極值的問題統(tǒng)一轉(zhuǎn)化為求解:

\begin{cases} \nabla f+\sum_i^nλ_i\nabla h_i+\sum_j^m\mu_j \nabla g_j=0 \\ \\ h_i=0,i=1,2,...,n \\ \\ g_j\leq 0,j=1,2,...,m \\ \\ \mu_i\geq 0\\ \\ \mu_j g_j= 0 \end{cases}

這個(gè)方程組也就是所謂的KKT條件徐矩,前面四項(xiàng)應(yīng)該都比較好理解,最后一個(gè)\mu_j g_j= 0是什么意思呢州泊?在上一節(jié)不等式約束中丧蘸,第一種情況不等式約束相當(dāng)于不影響極值點(diǎn),所以\mu_j= 0 遥皂, g_j\leq 0,在第二種情況中使用不等式的邊界刽漂,有\mu_j\geq 0 演训, g_j= 0



主要參考

《統(tǒng)計(jì)學(xué)習(xí)方法》李航
如何理解拉格朗日乘子法和KKT條件贝咙?
如何理解拉格朗日乘子法样悟?

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市庭猩,隨后出現(xiàn)的幾起案子窟她,更是在濱河造成了極大的恐慌,老刑警劉巖蔼水,帶你破解...
    沈念sama閱讀 211,042評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件震糖,死亡現(xiàn)場離奇詭異,居然都是意外死亡趴腋,警方通過查閱死者的電腦和手機(jī)吊说,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,996評論 2 384
  • 文/潘曉璐 我一進(jìn)店門论咏,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人颁井,你說我怎么就攤上這事厅贪。” “怎么了雅宾?”我有些...
    開封第一講書人閱讀 156,674評論 0 345
  • 文/不壞的土叔 我叫張陵养涮,是天一觀的道長。 經(jīng)常有香客問我眉抬,道長单寂,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,340評論 1 283
  • 正文 為了忘掉前任吐辙,我火速辦了婚禮宣决,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘昏苏。我一直安慰自己尊沸,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,404評論 5 384
  • 文/花漫 我一把揭開白布贤惯。 她就那樣靜靜地躺著洼专,像睡著了一般。 火紅的嫁衣襯著肌膚如雪孵构。 梳的紋絲不亂的頭發(fā)上屁商,一...
    開封第一講書人閱讀 49,749評論 1 289
  • 那天,我揣著相機(jī)與錄音颈墅,去河邊找鬼蜡镶。 笑死,一個(gè)胖子當(dāng)著我的面吹牛恤筛,可吹牛的內(nèi)容都是我干的官还。 我是一名探鬼主播,決...
    沈念sama閱讀 38,902評論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼毒坛,長吁一口氣:“原來是場噩夢啊……” “哼望伦!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起煎殷,我...
    開封第一講書人閱讀 37,662評論 0 266
  • 序言:老撾萬榮一對情侶失蹤屯伞,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后豪直,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體劣摇,經(jīng)...
    沈念sama閱讀 44,110評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,451評論 2 325
  • 正文 我和宋清朗相戀三年顶伞,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了饵撑。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片剑梳。...
    茶點(diǎn)故事閱讀 38,577評論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖滑潘,靈堂內(nèi)的尸體忽然破棺而出垢乙,到底是詐尸還是另有隱情,我是刑警寧澤语卤,帶...
    沈念sama閱讀 34,258評論 4 328
  • 正文 年R本政府宣布追逮,位于F島的核電站,受9級特大地震影響粹舵,放射性物質(zhì)發(fā)生泄漏钮孵。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,848評論 3 312
  • 文/蒙蒙 一眼滤、第九天 我趴在偏房一處隱蔽的房頂上張望巴席。 院中可真熱鬧,春花似錦诅需、人聲如沸漾唉。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,726評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽赵刑。三九已至,卻和暖如春场刑,著一層夾襖步出監(jiān)牢的瞬間般此,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,952評論 1 264
  • 我被黑心中介騙來泰國打工牵现, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留铐懊,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,271評論 2 360
  • 正文 我出身青樓施籍,卻偏偏與公主長得像居扒,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子丑慎,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,452評論 2 348