16.深度學(xué)習(xí)之優(yōu)化算法-2

16.1 RMSProp

  • RMSProp算法對(duì)AdaGrad算法做了修改在刺,僅累積最近迭代的梯度

    • 使用指數(shù)衰減來(lái)實(shí)現(xiàn)


  • 和AdaGrad算法一樣檬寂,RMSProp算法將目標(biāo)函數(shù)自變量中每個(gè)元素的學(xué)習(xí)率通過(guò)按元素運(yùn)算重新調(diào)整内狸,然后更新自變量


16.2 AdaDelta算法

16.3 Adam算法

  • Adam算法結(jié)合了動(dòng)量?jī)?yōu)化和 RMSProp 的思想
  • 算法
    • 動(dòng)量變量
  • 將小批量隨機(jī)梯度按元素平方后的項(xiàng)做指數(shù)加權(quán)移動(dòng)平均得到
  • 由于將
  • 中的元素都初始化為0焰枢, 在時(shí)間步t得到
  • 將過(guò)去各時(shí)間步小批量隨機(jī)梯度的權(quán)值相加拱雏,得到
  • 需要注意的是滴劲,當(dāng)t較小時(shí),過(guò)去各時(shí)間步小批量隨機(jī)梯度權(quán)值之和會(huì)較小寂嘉。

  • 例如奏瞬,當(dāng)


  • 在Adam算法中,對(duì)變量


  • 均作偏差修正:


  • 接下來(lái)泉孩,Adam算法使用以上偏差修正后的變量


  • 將模型參數(shù)中每個(gè)元素的學(xué)習(xí)率通過(guò)按元素運(yùn)算重新調(diào)整:


  • 最后硼端,使用


  • 迭代自變量:


16.4 深度學(xué)習(xí)為什么不用二階優(yōu)化

  • 目前深度學(xué)習(xí)中,反向傳播主要是依靠一階梯度寓搬。
  • 二階梯度在理論和實(shí)際上都是可以應(yīng)用都網(wǎng)絡(luò)中的珍昨,但相比于一階梯度,二階優(yōu)化會(huì)存在以下一些主要問(wèn)題:
    • 計(jì)算量大句喷,訓(xùn)練非常慢镣典。
    • 二階方法能夠更快地求得更高精度的解
    • 穩(wěn)定性

16.5 超參數(shù)的重要性順序

  • 學(xué)習(xí)率
    • 在網(wǎng)絡(luò)參數(shù)、優(yōu)化參數(shù)唾琼、正則化參數(shù)中最重要的超參數(shù)可能就是學(xué)習(xí)率了兄春。
  • 損失函數(shù)上的可調(diào)參數(shù),這些損失一般可分成三類:
    • 第一類輔助損失結(jié)合常見的損失函數(shù)锡溯,起到輔助優(yōu)化特征表達(dá)的作用神郊。
      • 例如度量學(xué)習(xí)中的Center loss肴裙,通常結(jié)合交叉熵?fù)p失伴隨一個(gè)權(quán)重完成一些特定的任務(wù)。
      • 這種情況下一般建議輔助損失值不高于或者不低于交叉熵?fù)p失值的兩個(gè)數(shù)量級(jí)涌乳;
    • 第二類蜻懦,多任務(wù)模型的多個(gè)損失函數(shù),每個(gè)損失函數(shù)之間或獨(dú)立或相關(guān)夕晓,用于各自任務(wù)宛乃,這種情況取決于任務(wù)之間本身的相關(guān)性
    • 第三類,獨(dú)立損失函數(shù)
  • 批樣本數(shù)量
    • 過(guò)小的批數(shù)量蒸辆,極端情況下征炼,例如batch size為1,即每個(gè)樣本都去修正一次梯度方向躬贡,樣本之間的差異越大越難以收斂谆奥。
    • 而過(guò)大的batch size,會(huì)使得梯度方向基本穩(wěn)定拂玻,容易陷入局部最優(yōu)解酸些,降低精度。
    • 一般參考范圍會(huì)取在[1:1024]之間
  • 動(dòng)量?jī)?yōu)化器(Gradient Descent with Momentum)的動(dòng)量參數(shù)β檐蚜。
    • 動(dòng)量衰減參數(shù)β是計(jì)算梯度的指數(shù)加權(quán)平均數(shù)魄懂,并利用該值來(lái)更新參數(shù),設(shè)置為 0.9 是一個(gè)常見且效果不錯(cuò)的選擇闯第;
  • Adam優(yōu)化器的超參數(shù)市栗、權(quán)重衰減系數(shù)、丟棄法比率(dropout)
    • Adam優(yōu)化器中的β1咳短,β2填帽,?,常設(shè)為 0.9咙好、0.999篡腌、10?8就會(huì)有不錯(cuò)的表現(xiàn)
    • 權(quán)重衰減系數(shù)通常會(huì)有個(gè)建議值,例如0.0005
    • dropout通常會(huì)在全連接層之間使用防止過(guò)擬合敷扫,建議比率控制在[0.2,0.5]之間
  • dropout的位置
    • 一、在RNN中诚卸,一般會(huì)建議放在輸入和輸出層葵第;
    • 二、不建議dropout后直接跟上batchnorm合溺;
  • 網(wǎng)絡(luò)參數(shù)通常也屬于超參數(shù)的范圍內(nèi)卒密,通常情況下增加網(wǎng)絡(luò)層數(shù)能增加模型的容限能力,但模型真正有效的容限能力還和樣本數(shù)量和質(zhì)量棠赛、層之間的關(guān)系等有關(guān)
  • 模型深度
  • 卷積核尺寸

大數(shù)據(jù)視頻推薦:
騰訊課堂
CSDN
大數(shù)據(jù)語(yǔ)音推薦:
企業(yè)級(jí)大數(shù)據(jù)技術(shù)應(yīng)用
大數(shù)據(jù)機(jī)器學(xué)習(xí)案例之推薦系統(tǒng)
自然語(yǔ)言處理
大數(shù)據(jù)基礎(chǔ)
人工智能:深度學(xué)習(xí)入門到精通

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末哮奇,一起剝皮案震驚了整個(gè)濱河市膛腐,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌鼎俘,老刑警劉巖哲身,帶你破解...
    沈念sama閱讀 211,496評(píng)論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異贸伐,居然都是意外死亡勘天,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,187評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門捉邢,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)脯丝,“玉大人,你說(shuō)我怎么就攤上這事伏伐〕杞” “怎么了?”我有些...
    開封第一講書人閱讀 157,091評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵藐翎,是天一觀的道長(zhǎng)材蹬。 經(jīng)常有香客問(wèn)我,道長(zhǎng)阱高,這世上最難降的妖魔是什么赚导? 我笑而不...
    開封第一講書人閱讀 56,458評(píng)論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮赤惊,結(jié)果婚禮上吼旧,老公的妹妹穿的比我還像新娘。我一直安慰自己未舟,他們只是感情好圈暗,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,542評(píng)論 6 385
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著裕膀,像睡著了一般员串。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上昼扛,一...
    開封第一講書人閱讀 49,802評(píng)論 1 290
  • 那天寸齐,我揣著相機(jī)與錄音,去河邊找鬼抄谐。 笑死渺鹦,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的蛹含。 我是一名探鬼主播毅厚,決...
    沈念sama閱讀 38,945評(píng)論 3 407
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼浦箱!你這毒婦竟也來(lái)了吸耿?” 一聲冷哼從身側(cè)響起祠锣,我...
    開封第一講書人閱讀 37,709評(píng)論 0 266
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎咽安,沒(méi)想到半個(gè)月后伴网,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,158評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡板乙,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,502評(píng)論 2 327
  • 正文 我和宋清朗相戀三年是偷,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片募逞。...
    茶點(diǎn)故事閱讀 38,637評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡蛋铆,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出放接,到底是詐尸還是另有隱情刺啦,我是刑警寧澤,帶...
    沈念sama閱讀 34,300評(píng)論 4 329
  • 正文 年R本政府宣布纠脾,位于F島的核電站玛瘸,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏苟蹈。R本人自食惡果不足惜糊渊,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,911評(píng)論 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望慧脱。 院中可真熱鬧渺绒,春花似錦、人聲如沸菱鸥。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,744評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)氮采。三九已至殷绍,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間鹊漠,已是汗流浹背主到。 一陣腳步聲響...
    開封第一講書人閱讀 31,982評(píng)論 1 266
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留躯概,地道東北人登钥。 一個(gè)月前我還...
    沈念sama閱讀 46,344評(píng)論 2 360
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像楞陷,于是被迫代替她去往敵國(guó)和親怔鳖。 傳聞我的和親對(duì)象是個(gè)殘疾皇子茉唉,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,500評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容