Levenberg-Maquardt Algorithm 推導(dǎo)


前置知識

1. 牛頓法

作用:1. 求根 2.求極值

  1. 求根

    目標(biāo): 求解 f(y)=0 的根

    計算穿過初始點(x_0,f(x_0)) 并且斜率為 f'(x) 的直線與x軸的交點可得

    ? 0=(x-x_0)f'(x_0)+f(x_0)

    迭代公式: x_{n+1}=x_n-\frac{f(x_n)}{f'(x_{n})}

  2. 求解一維無約束最小值

    目標(biāo): 求解 min f(x) , x\in R 的根

    牛頓法也可用來求解函數(shù)的極值空入。極值點是導(dǎo)數(shù)為0,可用牛頓法求導(dǎo)數(shù)的零點。

    f(x+\Delta) 的二階泰勒展開為 f(x+\Delta)=f(x)+f'(x)\Delta+\frac{1}{2}f''(x)\Delta^2

    求解 \frac{\partial f(x+\Delta)}{ \partial \Delta}=0

    可得 f'(x)+f''(x)\Delta=0
    ? \Delta=-\frac{f'(x_n)}{f''(x_{n})}

    迭代公式: x_{n+1}=x_n-\frac{f'(x_n)}{f''(x_{n})}

  3. 求解高維無約束最小值

    高維情況下泰勒二階展開為

    ? f(\mathbf x+\mathbf \Delta)=f(\mathbf x)+\nabla f(\mathbf x)\Delta+\frac{1}{2}\Delta ^TH(f(\mathbf x))\Delta

    因此迭代公式:x_{n+1}=x_n-[H(f(x_n))]^{-1}\nabla f(x)

優(yōu)點

  • 牛頓法是二階收斂,比一般梯度下降法更快收斂竞阐,特別是當(dāng)初始點距離目標(biāo)足夠靠近摸航。

缺點

  • 應(yīng)用求極值的時候需要目標(biāo)函數(shù)二次可微,而梯度下降法只需要可微
  • 需要 Hessian 矩陣正定铜邮,遇到 f 的極值點仪召,或者初始點距離目標(biāo)遠時候可能無法收斂
  • 每次迭代需要求 Hessian 的逆矩陣,運算量非常大

2. 高斯-牛頓法

作用:降低牛頓法的計算量松蒜,提高計算效率

最小二乘法問題

對于向量函數(shù) {\bf f}:R^m\to R^n,m\ge n

最小化 ||f(x)|| 或者找到 x^*=argmin_x\{F(x)\}

這里 F(x)=\frac{1}{2}\sum_{i=1}^m(f_i(x))^2=\frac{1}{2}{\bf f}({\bf x})^T{\bf f}({\bf x})

牛頓法推導(dǎo)

已知牛頓法迭代公式: x_{n+1}=x_n-[H(f(x_n))]^{-1}\nabla f(x)

F(x) 的梯度 \nabla F(x)=\begin{bmatrix}\frac{\partial (\frac{1}{2}\sum_{i=1}^m(f_i(x))^2)}{\partial x_1}\\\vdots\\\frac{\partial (\frac{1}{2}\sum_{i=1}^m(f_i(x))^2)}{\partial x_n}\end{bmatrix}=\begin{bmatrix}\sum_{i=1}^{m}f_i\frac{\partial f_i}{\partial x_1}\\\vdots\\\sum_{i=1}^{m}f_i\frac{\partial f_i}{\partial x_n} \end{bmatrix}= \begin{bmatrix} \frac{\partial f_1}{\partial x_1} & \cdots & \frac{\partial f_1}{\partial x_n} \\ \vdots & \ddots & \vdots \\ \frac{\partial f_m}{\partial x_1} & \cdots & \frac{\partial f_m}{\partial x_n} \end{bmatrix}^T\begin{bmatrix}f_1 \\ \vdots \\ f_m \end{bmatrix}

\nabla F(x)=J_f^Tf

Hessian 矩陣有 H_{jk}=\sum_{i=1}^m(\frac{\partial f_i}{\partial x_j}\frac{\partial f_i}{\partial x_k}+f_i\frac{\partial ^2f_i}{\partial x_j\partial x_k})

忽略二階導(dǎo)數(shù)項有: H_{jk}\approx \sum_{i=1}^mJ_{ij}J_{ik}

所以: H\approx J_f^TJ_f

高斯-牛頓迭代公式: x_{n+1}=x_n-[J_f^TJ_f]^{-1}J_f^Tf(x_n) s.t. |\frac{\partial f_i}{\partial x_j}\frac{\partial f_i}{\partial x_k}|\gg |f_i\frac{\partial ^2f_i}{\partial x_j\partial x_k}|

優(yōu)點

  • J_f滿秩扔茅,此時二次項 |f_i\frac{\partial ^2f_i}{\partial x_j\partial x_k}| 可以忽略,高斯牛頓和牛頓法都會收斂
  • 無需計算 Hessian 矩陣

缺點

  • |fi||f_i\frac{\partial ^2f_i}{\partial x_j\partial x_k}| 比較大秸苗,會導(dǎo)致難以忽略該二次項召娜,高斯牛頓法的收斂速度會很慢,甚至無法收斂惊楼。

Levenberg-Maquardt 算法

根據(jù)目標(biāo)函數(shù)F(x) 二階近似得到:

? F(x+h)\approx F( x)+\nabla F(x)h+\frac{1}{2}h^TH_Fh\approx F( x)+J_f^Tfh+\frac{1}{2}h^TJ_f^TJ_fh

我們定義下降方向為 L(h)

? L(h)\equiv F( x)+J_f^Tfh+\frac{1}{2}h^TJ_f^TJ_fh? S.T. h = x_{n+1} - x_n= \Delta ?

高斯牛頓法迭代公式:
x_{n+1}=x_n-[J_f^TJ_f]^{-1}J_f^Tf(x_n)

LM迭代公式: x_{n+1}=x_n-[J_f^TJ_f+\mu I]^{-1}J_f^Tf(x_n)
? or
? [J_f^TJ_f+\mu I]h=-J_f^Tf(x_n)

作用:結(jié)合了高斯牛頓法與梯度下降法的特點玖瘸,引入阻尼因子來調(diào)節(jié)算法特性。

因子作用

  • 當(dāng) \mu\gt 0 時保證系數(shù)矩陣正定檀咙,從而確保迭代的下降方向
  • 當(dāng) \mu 很大時雅倒,退化為梯度下降法: x_{n+1}=x_n-\frac{1}{\mu}J_f^Tf(x_n)
  • 當(dāng) \mu 很小時,退化為高斯牛頓法: x_{n+1}=x_n-[J_f^TJ_f]^{-1}J_f^Tf(x_n)

\mu的計算

  • 初始取值:\mu 的初始值\mu_0J(x_0)^TJ(x_0) 矩陣的元素個數(shù)有關(guān):

    ? \mu_0=\tau*max_i\{a_{ii}^{(0)}\}

  • 更新: 由系數(shù) \varrho 來控制弧可,這里:

    ? \varrho=\frac{F(x)-F(x+h)}{L(0)-L(h)}

    ? 分子的目標(biāo)函數(shù)在步長 h 下的實際變化蔑匣,分母為目標(biāo)函數(shù)二階近似的變化:

    ? L(0)-L(h)=(F(x))-(F(x)+h^TJ^Tf+\frac{1}{2}h^TJ^TJh)=-h^TJ^Tf-\frac{1}{2}h^TJ^TJh

    可以看出

    • \varrho 越大,表明 LF 的效果越好,可以縮小 \mu 以使得 LM 算法接近高斯牛頓法
    • \varrho 越小裁良,表明 LF 的效果越差凿将,所以增大 \mu 以使得 LM 算法接近梯度下降法并減少步長 h

? if\,\varrho>0\,\mu =\mu * max\{\frac{1}{3},1-(2\varrho-1)^3\}\\else\,\mu =\mu * v;v=2

u 和 p 關(guān)系曲線圖

? \mu\varrho 關(guān)系曲線圖

LM算法流程圖

LM算法流程圖

Reference

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市价脾,隨后出現(xiàn)的幾起案子牧抵,更是在濱河造成了極大的恐慌,老刑警劉巖彼棍,帶你破解...
    沈念sama閱讀 210,978評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件灭忠,死亡現(xiàn)場離奇詭異,居然都是意外死亡座硕,警方通過查閱死者的電腦和手機弛作,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,954評論 2 384
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來华匾,“玉大人映琳,你說我怎么就攤上這事≈├” “怎么了萨西?”我有些...
    開封第一講書人閱讀 156,623評論 0 345
  • 文/不壞的土叔 我叫張陵,是天一觀的道長旭旭。 經(jīng)常有香客問我谎脯,道長,這世上最難降的妖魔是什么持寄? 我笑而不...
    開封第一講書人閱讀 56,324評論 1 282
  • 正文 為了忘掉前任源梭,我火速辦了婚禮,結(jié)果婚禮上稍味,老公的妹妹穿的比我還像新娘废麻。我一直安慰自己,他們只是感情好模庐,可當(dāng)我...
    茶點故事閱讀 65,390評論 5 384
  • 文/花漫 我一把揭開白布烛愧。 她就那樣靜靜地躺著,像睡著了一般掂碱。 火紅的嫁衣襯著肌膚如雪怜姿。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,741評論 1 289
  • 那天顶吮,我揣著相機與錄音社牲,去河邊找鬼。 笑死悴了,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播湃交,決...
    沈念sama閱讀 38,892評論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼熟空,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了搞莺?” 一聲冷哼從身側(cè)響起息罗,我...
    開封第一講書人閱讀 37,655評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎才沧,沒想到半個月后迈喉,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,104評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡温圆,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,451評論 2 325
  • 正文 我和宋清朗相戀三年挨摸,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片岁歉。...
    茶點故事閱讀 38,569評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡得运,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出锅移,到底是詐尸還是另有隱情熔掺,我是刑警寧澤,帶...
    沈念sama閱讀 34,254評論 4 328
  • 正文 年R本政府宣布非剃,位于F島的核電站置逻,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏备绽。R本人自食惡果不足惜券坞,卻給世界環(huán)境...
    茶點故事閱讀 39,834評論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望疯坤。 院中可真熱鬧报慕,春花似錦、人聲如沸压怠。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,725評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽菌瘫。三九已至蜗顽,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間雨让,已是汗流浹背雇盖。 一陣腳步聲響...
    開封第一講書人閱讀 31,950評論 1 264
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留栖忠,地道東北人崔挖。 一個月前我還...
    沈念sama閱讀 46,260評論 2 360
  • 正文 我出身青樓贸街,卻偏偏與公主長得像,于是被迫代替她去往敵國和親狸相。 傳聞我的和親對象是個殘疾皇子薛匪,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,446評論 2 348