59.網(wǎng)絡訓練中的超參調(diào)整策略—學習率調(diào)整1

  • 學習率可以說是模型訓練最為重要的超參數(shù)漂洋。
    • 通常情況下蝗敢,一個或者一組優(yōu)秀的學習率既能加速模型的訓練,又能得到一個較優(yōu)甚至最優(yōu)的精度钱反。
    • 過大或者過小的學習率會直接影響到模型的收斂。
  • 當模型訓練到一定程度的時候匣距,損失將不再減少面哥,這時候模型的一階梯度接近零,對應Hessian 矩陣通常是兩種情況
    • 一毅待、正定尚卫,即所有特征值均為正,此時通呈欤可以得到一個局部極小值吱涉,若這個局部極小值接近全局最小則模型已經(jīng)能得到不錯的性能了,但若差距很大外里,則模型性能還有待于提升怎爵,通常情況下后者在訓練初最常見。
    • 二盅蝗,特征值有正有負鳖链,此時模型很可能陷入了鞍點,若陷入鞍點风科,模型性能表現(xiàn)就很差撒轮。以上兩種情況在訓練初期以及中期,此時若仍然以固定的學習率贼穆,會使模型陷入左右來回的震蕩或者鞍點题山,無法繼續(xù)優(yōu)化。
  • 所以故痊,學習率衰減或者增大能幫助模型有效的減少震蕩或者逃離鞍點顶瞳。
  • 通常情況下,大部分學習率調(diào)整策略都是衰減學習率愕秫,但有時若增大學習率也同樣起到奇效慨菱。這里結(jié)合TensorFlow的內(nèi)置方法來舉例。

1戴甩、exponential_decaynatural_exp_decay

exponential_decay(learning_rate, global_step, decay_steps, decay_rate,
                   staircase=False, name=None)

natural_exp_decay(learning_rate, global_step, decay_steps, decay_rate,
                   staircase=False, name=None)
  • 指數(shù)衰減是最常用的衰減方式符喝,這種方式簡單直接,在訓練初期衰減較大利于收斂甜孤,在后期衰減較小利于精調(diào)协饲。以上兩種均為指數(shù)衰減,區(qū)別在于后者使用以自然指數(shù)下降缴川。


2茉稠、piecewise_constant

piecewise_constant(x, boundaries, values, name=None)

分段設置學習率法,跟指數(shù)型類似把夸,區(qū)別在于每個階段的衰減并不是按指數(shù)調(diào)整而线。可在不同階段設置手動不同的學習率恋日。這種學習率重點在有利于精調(diào)膀篮。

3、polynomial_decay

polynomial_decay(learning_rate, global_step, decay_steps,
                  end_learning_rate=0.0001, power=1.0,
                  cycle=False, name=None)

多項式衰減谚鄙,計算如下:
global setp = min(global step, decay steps)

lr_{decayed} = (lr-lr_{end})*(1-{globalstep\over decaysteps})^{power} +lr_{end}

有別于上述兩種各拷,多項式衰減則是在每一步迭代上都會調(diào)整學習率。主要看Power參數(shù)闷营,若Power為1烤黍,則是下圖中的紅色直線;若power小于1傻盟,則是開1/power次方速蕊,為藍色線;綠色線為指數(shù)娘赴,power大于1规哲。



此外,需要注意的是參數(shù)cycle诽表,cycle對應的是一種周期循環(huán)調(diào)整的方式唉锌。這種cycle策略主要目的在后期防止在一個局部極小值震蕩隅肥,若跳出該區(qū)域或許能得到更有的結(jié)果。這里說明cycle的方式不止可以在多項式中應用袄简,可配合類似的周期函數(shù)進行衰減腥放,如下圖。


大數(shù)據(jù)視頻推薦:
網(wǎng)易云課堂
CSDN
人工智能算法競賽實戰(zhàn)
AIops智能運維機器學習算法實戰(zhàn)
ELK7 stack開發(fā)運維實戰(zhàn)
PySpark機器學習從入門到精通
AIOps智能運維實戰(zhàn)
騰訊課堂
大數(shù)據(jù)語音推薦:
ELK7 stack開發(fā)運維
企業(yè)級大數(shù)據(jù)技術(shù)應用
大數(shù)據(jù)機器學習案例之推薦系統(tǒng)
自然語言處理
大數(shù)據(jù)基礎
人工智能:深度學習入門到精通

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末绿语,一起剝皮案震驚了整個濱河市秃症,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌吕粹,老刑警劉巖种柑,帶你破解...
    沈念sama閱讀 211,376評論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異匹耕,居然都是意外死亡聚请,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,126評論 2 385
  • 文/潘曉璐 我一進店門稳其,熙熙樓的掌柜王于貴愁眉苦臉地迎上來良漱,“玉大人,你說我怎么就攤上這事欢际∧甘校” “怎么了?”我有些...
    開封第一講書人閱讀 156,966評論 0 347
  • 文/不壞的土叔 我叫張陵损趋,是天一觀的道長患久。 經(jīng)常有香客問我,道長浑槽,這世上最難降的妖魔是什么蒋失? 我笑而不...
    開封第一講書人閱讀 56,432評論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮桐玻,結(jié)果婚禮上篙挽,老公的妹妹穿的比我還像新娘。我一直安慰自己镊靴,他們只是感情好铣卡,可當我...
    茶點故事閱讀 65,519評論 6 385
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著偏竟,像睡著了一般煮落。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上踊谋,一...
    開封第一講書人閱讀 49,792評論 1 290
  • 那天蝉仇,我揣著相機與錄音,去河邊找鬼。 笑死轿衔,一個胖子當著我的面吹牛沉迹,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播害驹,決...
    沈念sama閱讀 38,933評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼胚股,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了裙秋?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,701評論 0 266
  • 序言:老撾萬榮一對情侶失蹤缨伊,失蹤者是張志新(化名)和其女友劉穎摘刑,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體刻坊,經(jīng)...
    沈念sama閱讀 44,143評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡枷恕,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,488評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了谭胚。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片徐块。...
    茶點故事閱讀 38,626評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖灾而,靈堂內(nèi)的尸體忽然破棺而出胡控,到底是詐尸還是另有隱情,我是刑警寧澤旁趟,帶...
    沈念sama閱讀 34,292評論 4 329
  • 正文 年R本政府宣布昼激,位于F島的核電站,受9級特大地震影響锡搜,放射性物質(zhì)發(fā)生泄漏橙困。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,896評論 3 313
  • 文/蒙蒙 一耕餐、第九天 我趴在偏房一處隱蔽的房頂上張望凡傅。 院中可真熱鬧,春花似錦肠缔、人聲如沸夏跷。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,742評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽拓春。三九已至,卻和暖如春亚隅,著一層夾襖步出監(jiān)牢的瞬間硼莽,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,977評論 1 265
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留懂鸵,地道東北人偏螺。 一個月前我還...
    沈念sama閱讀 46,324評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像匆光,于是被迫代替她去往敵國和親套像。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,494評論 2 348

推薦閱讀更多精彩內(nèi)容