Adam 優(yōu)化算法通惫,學(xué)習(xí)率策略以及局部最優(yōu)點(diǎn)

吳恩達(dá):Adam 優(yōu)化算法茂翔,學(xué)習(xí)率策略以及局部最優(yōu)點(diǎn)

簡(jiǎn)介

Adaptive moment estimation(Adam)是目前被實(shí)際證明最有效,應(yīng)用最廣泛的算法履腋,它的實(shí)現(xiàn)是建立在另外兩個(gè)非常成熟的優(yōu)化算法上珊燎,momentum算法RMSprop算法


算法公式

對(duì)于任意權(quán)重參數(shù)w(包括bias
S_{dw} = \beta_1 * S_{dw} + (1 - \beta_1)*dw^2
V_{dw} = \beta_2 * V_{dw} + (1 - \beta_2)*dw
w = w - \alpha * \frac{V_{dw}}{\sqrt{S_{dw}}}

name explanation
S_{dw} 來自RMSprop算法惭嚣,為非負(fù)數(shù)
\beta_1 推薦取值0.999的超參數(shù)
dw 權(quán)重梯度
w 權(quán)重參數(shù)
V_dw 動(dòng)量,取自動(dòng)量梯度下降法
\beta_2 推薦取值0.9的超參數(shù)
\alpha 學(xué)習(xí)率,需要重點(diǎn)調(diào)的參數(shù)

參數(shù)的具體意義則可以在前面兩種算法的筆記中找到詳細(xì)的說明悔政。


優(yōu)化:學(xué)習(xí)率衰減

Adam已經(jīng)基本上可以用于所有類型的網(wǎng)絡(luò)并且取得很好的結(jié)果晚吞,但是由于采用Mini Batch方法,在神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)前期谋国,使用相對(duì)大的學(xué)習(xí)率進(jìn)行快速逼近最優(yōu)點(diǎn)槽地,在學(xué)習(xí)后期則需要采用學(xué)習(xí)率衰減防止結(jié)果在最優(yōu)點(diǎn)附近不斷震蕩無法收斂。

  1. 分母下降法(自己起的名字)
    \alpha = \alpha_0 * \frac{1}{1+decay.rate*epoch}

  2. 指數(shù)下降法

    \alpha = 0.95^{epoch}*\alpha_0

  3. 根號(hào)分母下降法(自己起的名字)
    \alpha = \alpha_0 * \frac{k}{\sqrt{epoch}}

  4. 離散樓梯法(discrete staircase)
    k = \biggl\lfloor\frac{steps}{steps.gate}\biggr\rfloor

\alpha = 0.5^{k}*\alpha_0
如果沒有精力手動(dòng)調(diào)節(jié)學(xué)習(xí)率芦瘾,采用合適的學(xué)習(xí)率衰減策略是有效的捌蚊。

局部最優(yōu)點(diǎn)

compare_local_minimum.png

在以前,研究者們常常以為局部最優(yōu)點(diǎn)像上圖左邊那樣近弟,是凹陷狀缅糟,現(xiàn)在研究者發(fā)現(xiàn)實(shí)際上梯度零點(diǎn)往往是右邊那樣的鞍點(diǎn)。
為了直觀這樣的現(xiàn)象祷愉,假設(shè)存在一個(gè)兩萬維的空間溺拱,要出現(xiàn)上圖左邊這樣的局部最優(yōu)點(diǎn),需要兩萬緯度同時(shí)為凸函數(shù)或者凹函數(shù)谣辞,則概率為,相基本當(dāng)于不可能!這也是三維圖形直觀推廣到高緯空間的錯(cuò)誤示范沐扳。
由于不太可能出現(xiàn)完全凹陷的局部最優(yōu)點(diǎn)泥从,則在鞍點(diǎn)和高原點(diǎn),正是體現(xiàn)RMSprop和Momemtum(當(dāng)然也包括Adam)算法優(yōu)勢(shì)的時(shí)候沪摄,這非常好理解躯嫉。


附錄:

  1. Adam算法實(shí)際上會(huì)加上Bias Correction
    V_{dw}^{corrected} =\frac{V_{dw}}{1-\beta_1}
    S_{dw}^{corrected} =\frac{V_{dw}}{1-\beta_2}
    對(duì)于bias參數(shù)同理
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市杨拐,隨后出現(xiàn)的幾起案子祈餐,更是在濱河造成了極大的恐慌,老刑警劉巖哄陶,帶你破解...
    沈念sama閱讀 218,858評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件帆阳,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡屋吨,警方通過查閱死者的電腦和手機(jī)蜒谤,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,372評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來至扰,“玉大人鳍徽,你說我怎么就攤上這事「铱危” “怎么了阶祭?”我有些...
    開封第一講書人閱讀 165,282評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵绷杜,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我濒募,道長(zhǎng)鞭盟,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,842評(píng)論 1 295
  • 正文 為了忘掉前任萨咳,我火速辦了婚禮懊缺,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘培他。我一直安慰自己鹃两,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,857評(píng)論 6 392
  • 文/花漫 我一把揭開白布舀凛。 她就那樣靜靜地躺著俊扳,像睡著了一般。 火紅的嫁衣襯著肌膚如雪猛遍。 梳的紋絲不亂的頭發(fā)上馋记,一...
    開封第一講書人閱讀 51,679評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音懊烤,去河邊找鬼梯醒。 笑死,一個(gè)胖子當(dāng)著我的面吹牛腌紧,可吹牛的內(nèi)容都是我干的茸习。 我是一名探鬼主播,決...
    沈念sama閱讀 40,406評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼壁肋,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼号胚!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起浸遗,我...
    開封第一講書人閱讀 39,311評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤猫胁,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后跛锌,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體弃秆,經(jīng)...
    沈念sama閱讀 45,767評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,945評(píng)論 3 336
  • 正文 我和宋清朗相戀三年髓帽,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了驾茴。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,090評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡氢卡,死狀恐怖锈至,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情译秦,我是刑警寧澤峡捡,帶...
    沈念sama閱讀 35,785評(píng)論 5 346
  • 正文 年R本政府宣布击碗,位于F島的核電站,受9級(jí)特大地震影響们拙,放射性物質(zhì)發(fā)生泄漏稍途。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,420評(píng)論 3 331
  • 文/蒙蒙 一砚婆、第九天 我趴在偏房一處隱蔽的房頂上張望械拍。 院中可真熱鬧,春花似錦装盯、人聲如沸坷虑。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,988評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽迄损。三九已至,卻和暖如春账磺,著一層夾襖步出監(jiān)牢的瞬間芹敌,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,101評(píng)論 1 271
  • 我被黑心中介騙來泰國打工垮抗, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留氏捞,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,298評(píng)論 3 372
  • 正文 我出身青樓冒版,卻偏偏與公主長(zhǎng)得像幌衣,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子壤玫,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,033評(píng)論 2 355