梯度下降和牛頓法

這里主要討論梯度下降法和牛頓法的原理

1.梯度下降法

形式:\theta _{k+1}=\theta _{k}-\eta \bigtriangledown L(\theta _{k})五芝,其中L為損失函數(shù),\theta 為模型參數(shù)


下面將推導(dǎo)這一形式的由來.

首先辕万,需要用到多元函數(shù)的一級泰勒展開式:L(\theta ) = L(\theta_0) + [\bigtriangledown L(\theta_0) ]^T (\theta - \theta_0) + \omicron (\theta - \theta_0)

如果忽略高階無窮小枢步,即\theta \theta _0\delta領(lǐng)域沉删,那么等號就會變?yōu)榻葡嗟龋矗?img class="math-inline" src="https://math.jianshu.com/math?formula=L(%5Ctheta%20)%20-L(%5Ctheta_0)%20%5Capprox%20%20%20%20%5B%5Cbigtriangledown%20L(%5Ctheta_0)%20%5D%5ET%20(%5Ctheta%20-%20%5Ctheta_0)%20" alt="L(\theta ) -L(\theta_0) \approx [\bigtriangledown L(\theta_0) ]^T (\theta - \theta_0) " mathimg="1">

要使得損失函數(shù)L下降更快醉途,只需要等式右邊得到最小值矾瑰。

X^TY=||X||\cdot ||Y||\cdot cos\alpha 可知,當(dāng)[\bigtriangledown L(\theta _0)](\theta -\theta _0)的夾角余弦cos\alpha =-1時等式右邊可取得最小值隘擎。

由于[\bigtriangledown L(\theta _0)]對應(yīng)的方向單位向量可表示為:\frac{[\bigtriangledown L(\theta _0)]}{||[\bigtriangledown L(\theta _0)]||}

當(dāng)[\bigtriangledown L(\theta _0)](\theta -\theta _0)的方向相反(夾角余弦cos\alpha =-1)時有:(\theta -\theta_0)= - \eta  \frac{[\bigtriangledown L(\theta _0)]}{||[\bigtriangledown L(\theta _0)]||} 殴穴,其中\eta 為正數(shù)。由于分母為標(biāo)量货葬,因此可以合并到\eta 中采幌,化簡為:\theta =\theta_0 - \eta \bigtriangledown L(\theta _0)


需要注意的是,\theta \theta_0要離的充分近震桶,也就是在它的\delta鄰域里面休傍,才能忽略掉泰勒展開里面的一次以上的項,否則就不能忽略它了尼夺,它就不是高階無窮小了尊残,約等于的條件就不成立了,所以\eta 步長不能夠太大淤堵,由此我們就得到了梯度下降法的公式。


2.牛頓法

? ??形式:\theta_{k+1} = \theta_{k} -H^{-1}g_k?顷扩, 其中為Hessian矩陣

下面將推導(dǎo)這一形式的由來拐邪。

首先,需要用到多元函數(shù)的二級泰勒展開式:L(\theta ) = L(\theta_0)  + [\bigtriangledown L(\theta_0)]^T(\theta -\theta_0)+\frac{1}{2} (\theta -\theta_0)^T H(\theta -\theta_0) + \omicron (\theta -\theta_0)

如果忽略高階無窮小隘截,即\theta \theta_0\delta鄰域扎阶,那么等號就會變?yōu)榻葡嗟龋矗?img class="math-inline" src="https://math.jianshu.com/math?formula=L(%5Ctheta%20)%20%5Capprox%20%20L(%5Ctheta_0)%20%20%2B%20%5B%5Cbigtriangledown%20L(%5Ctheta_0)%5D%5ET(%5Ctheta%20-%5Ctheta_0)%2B%5Cfrac%7B1%7D%7B2%7D%20(%5Ctheta%20-%5Ctheta_0)%5ET%20H(%5Ctheta%20-%5Ctheta_0)" alt="L(\theta ) \approx L(\theta_0) + [\bigtriangledown L(\theta_0)]^T(\theta -\theta_0)+\frac{1}{2} (\theta -\theta_0)^T H(\theta -\theta_0)" mathimg="1">

如果是二次函數(shù)的話婶芭,我們找它梯度等于0的點是非常好找的东臀,基于約等于的式子,兩邊同時求導(dǎo)犀农。

因為

且H是對稱矩陣惰赋,所以:\bigtriangledown L(\theta )\approx \bigtriangledown L(\theta_0)+H(\theta_0)(\theta - \theta_0) = 0

下面可以求解一次方程,如果hessian 矩陣可逆呵哨,就可以兩邊乘上 H 的逆矩陣赁濒,令g = \bigtriangledown L(\theta _0),則g+H(\theta -\theta_0)=0

兩邊同時乘H 的逆矩陣孟害,有\theta -\theta_0 = -H^{-1}g

注意一下H和g都是\theta =\theta_0點處取得的拒炎,稍作調(diào)整為:\theta_{k+1}=\theta_{k}-H^{-1}g_k

有同學(xué)肯定會說,那我們?nèi)デ蠼夥匠探M挨务,那不是一次就可以求得梯度等于 0 的點 \theta 了嘛击你, 但是因為我們忽略了后面的高階無窮小玉组,所以我們只是近似的找到了梯度等于 0 的點,但 是它并沒有真正找到丁侄,所以我們下次要繼續(xù)去用這個公式去迭代球切。

迭代優(yōu)化時會加上步長:\theta_{k+1} = \theta_{k} -\eta H^{-1}g_k

如果我們的\theta 是二次函數(shù)的話,牛頓法一步就可以收斂绒障,前提是步長不做設(shè)置吨凑,等于 1 的 時候就可以了,這是因為如果原函數(shù)L(\theta )是二次函數(shù)的話户辱,泰勒展開里面就不是約等于鸵钝,而是直接等于。


梯度下降法和牛頓法的關(guān)系

梯度下降法和牛頓法的關(guān)系

梯度下降法只用到了一階導(dǎo)數(shù)的信息庐镐,牛頓法既用到了一階導(dǎo)數(shù)的信息恩商,也用到了二階導(dǎo)數(shù)的信息。

梯度下降法是用線性函數(shù)來代替目標(biāo)函數(shù)必逆,牛頓法是用二次函數(shù)來代替目標(biāo)函數(shù)怠堪, 所以說牛頓法的收斂速度是更快的。

但是牛頓法也有它的局限名眉,hessian 矩陣不一定可逆粟矿,第二個即使存在,我們來解一個線性 方程組损拢,當(dāng) hessian 矩陣規(guī)模很大陌粹,解線性方程組是非常耗時的,因此出現(xiàn)了一種改進的算 法叫擬牛頓法

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末福压,一起剝皮案震驚了整個濱河市掏秩,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌荆姆,老刑警劉巖蒙幻,帶你破解...
    沈念sama閱讀 217,734評論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異胆筒,居然都是意外死亡邮破,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,931評論 3 394
  • 文/潘曉璐 我一進店門腐泻,熙熙樓的掌柜王于貴愁眉苦臉地迎上來决乎,“玉大人,你說我怎么就攤上這事派桩」钩希” “怎么了?”我有些...
    開封第一講書人閱讀 164,133評論 0 354
  • 文/不壞的土叔 我叫張陵铆惑,是天一觀的道長范嘱。 經(jīng)常有香客問我送膳,道長,這世上最難降的妖魔是什么丑蛤? 我笑而不...
    開封第一講書人閱讀 58,532評論 1 293
  • 正文 為了忘掉前任叠聋,我火速辦了婚禮,結(jié)果婚禮上受裹,老公的妹妹穿的比我還像新娘碌补。我一直安慰自己,他們只是感情好棉饶,可當(dāng)我...
    茶點故事閱讀 67,585評論 6 392
  • 文/花漫 我一把揭開白布厦章。 她就那樣靜靜地躺著,像睡著了一般照藻。 火紅的嫁衣襯著肌膚如雪袜啃。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,462評論 1 302
  • 那天幸缕,我揣著相機與錄音群发,去河邊找鬼。 笑死发乔,一個胖子當(dāng)著我的面吹牛熟妓,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播列疗,決...
    沈念sama閱讀 40,262評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼滑蚯,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了抵栈?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,153評論 0 276
  • 序言:老撾萬榮一對情侶失蹤坤次,失蹤者是張志新(化名)和其女友劉穎古劲,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體缰猴,經(jīng)...
    沈念sama閱讀 45,587評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡产艾,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,792評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了滑绒。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片闷堡。...
    茶點故事閱讀 39,919評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖疑故,靈堂內(nèi)的尸體忽然破棺而出杠览,到底是詐尸還是另有隱情,我是刑警寧澤纵势,帶...
    沈念sama閱讀 35,635評論 5 345
  • 正文 年R本政府宣布踱阿,位于F島的核電站管钳,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏软舌。R本人自食惡果不足惜才漆,卻給世界環(huán)境...
    茶點故事閱讀 41,237評論 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望佛点。 院中可真熱鬧醇滥,春花似錦、人聲如沸超营。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,855評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽糟描。三九已至怀喉,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間船响,已是汗流浹背躬拢。 一陣腳步聲響...
    開封第一講書人閱讀 32,983評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留见间,地道東北人聊闯。 一個月前我還...
    沈念sama閱讀 48,048評論 3 370
  • 正文 我出身青樓,卻偏偏與公主長得像米诉,于是被迫代替她去往敵國和親菱蔬。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,864評論 2 354