ADAM: A METHOD FOR STOCHASTIC OPTIMIZATION

Diederik P. Kingma
Jimmy Lei Ba

論文結(jié)構(gòu):


image.png
  1. 介紹+提出adam算法結(jié)構(gòu)
  • 針對(duì)的問題:高維參數(shù)空間的隨機(jī)目標(biāo)的優(yōu)化問題校坑。在這種情況下,高階優(yōu)化方法是不合適的玖雁,adam局限于一階優(yōu)化方法瓮下。
  • 為什么觅丰?
    需要一個(gè)基于梯度優(yōu)化的有效隨機(jī)//優(yōu)化算法
  • 優(yōu)點(diǎn):
    實(shí)現(xiàn)簡(jiǎn)單
    高效的計(jì)算
    所需內(nèi)存少
    梯度對(duì)角縮放的不變性(第二部分將給予證明)
    適合解決含大規(guī)模數(shù)據(jù)和參數(shù)的優(yōu)化問題
    適用于非平穩(wěn)(non-stationary)目標(biāo)/非凸優(yōu)化
    適用于解決包含很高噪聲或稀疏梯度的問題
    超參數(shù)可以很直觀地解釋饵溅,并且基本上只需極少量的調(diào)參
  • 算法結(jié)構(gòu)


    image.png
  1. 算法詳解+更新規(guī)則
  • 詳細(xì)解釋:
  • 學(xué)習(xí)率衰減:


    image.png
  • ADAM’S UPDATE RULE
    Adam 算法更新規(guī)則會(huì)很謹(jǐn)慎地選擇步長(zhǎng)的大小。假定ε=0妇萄,則每次時(shí)間步t有效下降步長(zhǎng)為


    image.png

    有界性:


    image.png

    image.png

    可以令其相對(duì)簡(jiǎn)單地提前知道α正確的范圍蜕企,因此其要優(yōu)于沒有提供足夠信息的當(dāng)前梯度估計(jì)。
    信噪比(signal-to-noise ratio/SNR):
    image.png

    其大小決定了符合真實(shí)梯度方向的不確定性嚣伐。例如糖赔,SNR 值在最優(yōu)解附近趨向于 0,因此也會(huì)在參數(shù)空間有更小的有效步長(zhǎng):即一種自動(dòng)退火(automatic annealing)的形式轩端。
    梯度對(duì)角縮放的不變性:有效步長(zhǎng)?t 對(duì)于梯度縮放來說仍然是不變量放典。


    image.png
  1. 偏差修正
    基于指數(shù)加權(quán)平均數(shù)的梯度更新:


    image.png

    展開式:


    image.png

    指數(shù)加權(quán)平均數(shù)和真實(shí)量之間的偏差修正,我們對(duì)式(1)的左邊和右邊去期望:
    image.png
  1. adam收斂性
    利用 Zinkevich 2003 年提出的在線學(xué)習(xí)框架分析了 Adam 算法的收斂性。


    image.png

    image.png
  1. 其它相關(guān)優(yōu)化算法
  • RMSprop


    image.png

    區(qū)別:帶動(dòng)量算時(shí)重新計(jì)算梯度上的動(dòng)量而不是指數(shù)加權(quán)平均數(shù)的算法奋构。沒有偏差修正壳影。

  • adagrad


    image.png

    區(qū)別:beta取值,有偏差修正弥臼。

  1. 模型性能測(cè)試
    評(píng)估方法:(使用大規(guī)模數(shù)據(jù)集和模型宴咧,相同的參數(shù)初始化,顯示結(jié)果為最好的超參數(shù))
  • Logistic 回歸
    1.minist數(shù)據(jù)集径缅,網(wǎng)絡(luò)為28*28=784掺栅,minibatch=128。
    2.IMDB電影評(píng)論數(shù)據(jù)集纳猪,稀疏特征問題氧卧。


    image.png
  • 多層全連接神經(jīng)網(wǎng)絡(luò)
    MINIST訓(xùn)練集,兩層完全連接的隱含層,每層隱含單元1000,ReLU激活的神經(jīng)網(wǎng)絡(luò)模型, minibatch size=128.


    image.png
  • 卷積神經(jīng)網(wǎng)絡(luò)


    image.png
  • 偏差校正


    image.png

開源代碼:https://github.com/michaelshiyu/kerNET

  1. adamax
    L^2---> L^p
    令 p → ∞氏堤,得出一個(gè)極其穩(wěn)定和簡(jiǎn)單的算法adamax


    image.png

    結(jié)構(gòu):


    image.png

    其中:
    image.png

    變?yōu)榈剑?br>
    image.png

    其中沙绝,不需要修正beta2的初始化偏差。同樣 AdaMax 參數(shù)更新的量級(jí)要比 Adam 更簡(jiǎn)單鼠锈,即|?t| ≤ α闪檬。

下一步方向:
adam超參數(shù)設(shè)置:調(diào)參經(jīng)驗(yàn)
缺點(diǎn)改進(jìn):adam雖然收斂的很快,也很穩(wěn)定购笆,但是收斂的效果差(即收斂到的最優(yōu)解的準(zhǔn)確率偏低)粗悯。
更好的優(yōu)化算法:
比如AMSGrad和AdaBound。后者是目前來說比較有希望頂替Adam的:前期和Adam一樣快由桌,后期有和SGD一樣的精度为黎。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市行您,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌剪廉,老刑警劉巖娃循,帶你破解...
    沈念sama閱讀 218,858評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異斗蒋,居然都是意外死亡捌斧,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,372評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門泉沾,熙熙樓的掌柜王于貴愁眉苦臉地迎上來捞蚂,“玉大人,你說我怎么就攤上這事跷究⌒昭福” “怎么了?”我有些...
    開封第一講書人閱讀 165,282評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)丁存。 經(jīng)常有香客問我肩杈,道長(zhǎng),這世上最難降的妖魔是什么解寝? 我笑而不...
    開封第一講書人閱讀 58,842評(píng)論 1 295
  • 正文 為了忘掉前任扩然,我火速辦了婚禮,結(jié)果婚禮上聋伦,老公的妹妹穿的比我還像新娘夫偶。我一直安慰自己,他們只是感情好觉增,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,857評(píng)論 6 392
  • 文/花漫 我一把揭開白布兵拢。 她就那樣靜靜地躺著,像睡著了一般抑片。 火紅的嫁衣襯著肌膚如雪卵佛。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,679評(píng)論 1 305
  • 那天敞斋,我揣著相機(jī)與錄音截汪,去河邊找鬼。 笑死植捎,一個(gè)胖子當(dāng)著我的面吹牛衙解,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播焰枢,決...
    沈念sama閱讀 40,406評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼蚓峦,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了济锄?” 一聲冷哼從身側(cè)響起暑椰,我...
    開封第一講書人閱讀 39,311評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎荐绝,沒想到半個(gè)月后一汽,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,767評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡低滩,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,945評(píng)論 3 336
  • 正文 我和宋清朗相戀三年召夹,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片恕沫。...
    茶點(diǎn)故事閱讀 40,090評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡监憎,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出婶溯,到底是詐尸還是另有隱情鲸阔,我是刑警寧澤偷霉,帶...
    沈念sama閱讀 35,785評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站隶债,受9級(jí)特大地震影響腾它,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜死讹,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,420評(píng)論 3 331
  • 文/蒙蒙 一瞒滴、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧赞警,春花似錦妓忍、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,988評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至笤虫,卻和暖如春旁瘫,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背琼蚯。 一陣腳步聲響...
    開封第一講書人閱讀 33,101評(píng)論 1 271
  • 我被黑心中介騙來泰國(guó)打工酬凳, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人遭庶。 一個(gè)月前我還...
    沈念sama閱讀 48,298評(píng)論 3 372
  • 正文 我出身青樓宁仔,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親峦睡。 傳聞我的和親對(duì)象是個(gè)殘疾皇子翎苫,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,033評(píng)論 2 355