機(jī)器學(xué)習(xí)中的優(yōu)化方法

優(yōu)化方法

1. 梯度下降

1.1. 缺點(diǎn)及解決辦法

  • 缺點(diǎn):每一步走的距離在極值點(diǎn)附近非常重要,如果走的步子過(guò)大,容易在極值點(diǎn)附近震蕩而無(wú)法收斂。
  • 解決辦法:將學(xué)習(xí)率設(shè)定為隨著迭代次數(shù)而不斷減小的變量,但是也不能完全減為零举反。

1.2. 常用優(yōu)化器

  • SGD
    g_t=\triangledown \theta_{t-1}f(\theta_{t-1})
    \triangle \theta_t=-\eta * g_t

  • Momentum
    m_t=\mu * m_{t-1} + g_t
    \triangle \theta_t=-\eta * m_t

  • Nesterov
    g_t = \triangledown \theta_{t-1}f(\theta_{t-1}) - \eta * \mu * m_{t-1}
    m_t=\mu * m_{t-1} + g_t
    \triangle \theta_t=-\eta * m_t

  • Adagrad
    n_t = n_{t-1}+{g_t}^2
    \triangle \theta_t = -\frac{ \eta }{\sqrt {n_t + \varepsilon}} * g_t = -\frac{ \eta }{\sqrt {\sum_{r=1}^{t}{g_r}^2 + \varepsilon}} * g_t

  • Adadelta
    n_t = v * n_{t-1} + (1-v) * {g_t}^2
    \triangle \theta_t = -\frac{ \eta }{\sqrt {n_t + \varepsilon}} * g_t

  • Adam
    指數(shù)加權(quán)平均
    m_t = \beta_1 m_{t-1} + (1-\beta_1)g_t
    v_t = \beta_2 v_{t-1} + (1-\beta_2){g_t}^2
    帶偏差修正的指數(shù)加權(quán)平均
    \widehat{m_t} = \frac{m_t}{1-{\beta_1}^t}
    \widehat{v_t} = \frac{v_t}{1-{\beta_2}^t}
    \theta_{t+1} = \theta_t - \frac{\eta}{\sqrt{\widehat{v_t}}+\varepsilon}\widehat{m_t}

2. 牛頓法

2.1. 求解方法

  • 前提
    • 牛頓法是為了求解函數(shù)值為零的時(shí)候變量的取值問(wèn)題的。
    • 如果函數(shù)一階可導(dǎo)扒吁,那么函數(shù)取得極值時(shí)火鼻,一階導(dǎo)數(shù)為0。
    • 所以求解函數(shù)的極值就可以轉(zhuǎn)換為求該函數(shù)一階導(dǎo)數(shù)等于0時(shí)的變量的取值。
    • f'(x)x_0的一階泰勒展開f'(x) = f'(x_0) + f''(x_0)(x-x_0)=0
  • 與梯度下降不同魁索,梯度下降的目的是直接求解目標(biāo)函數(shù)極小值融撞,而牛頓法則變相地通過(guò)求解目標(biāo)函數(shù)一階導(dǎo)為零的參數(shù)值,進(jìn)而求得目標(biāo)函數(shù)最小值蛾默。
  • 具體地懦铺,當(dāng)要求解 f(θ)的極值時(shí),如果 f 二階可導(dǎo)支鸡,那么可以通過(guò)迭代公式冬念。
    \theta = \theta -\frac{f'(\theta)}{f''(\theta) }
  • 當(dāng)θ是向量時(shí),牛頓法可以使用下面式子表示:
    \theta = \theta - H^{-1} \triangledown_{\theta}f(\theta)
    其中H叫做海森矩陣牧挣, H^{-1}表示的是海森矩陣的逆矩陣 急前,其實(shí)就是目標(biāo)函數(shù)對(duì)參數(shù)θ的二階導(dǎo)數(shù)

2.2. 牛頓法的優(yōu)缺點(diǎn)

  • 優(yōu)點(diǎn):海森矩陣的逆就好比梯度下降法的學(xué)習(xí)率參數(shù)alpha。牛頓法收斂速度相比梯度下降法很快瀑构,而且由于海森矩陣的的逆在迭代中不斷減小裆针,起到逐漸縮小步長(zhǎng)的效果
  • 牛頓法是二階收斂寺晌,梯度下降是一階收斂世吨,所以牛頓法就更快。如果更通俗地說(shuō)的話呻征,比如你想找一條最短的路徑走到一個(gè)盆地的最底部耘婚,梯度下降法每次只從你當(dāng)前所處位置選一個(gè)坡度最大的方向走一步,牛頓法在選擇方向時(shí)陆赋,不僅會(huì)考慮坡度是否夠大沐祷,還會(huì)考慮你走了一步之后,坡度是否會(huì)變得更大攒岛。
  • 缺點(diǎn):計(jì)算海森矩陣的逆比較困難赖临,消耗時(shí)間和計(jì)算資源。因此有了擬牛頓法灾锯。

3. 擬牛頓法

  • 擬牛頓法的本質(zhì)思想是改善牛頓法每次需要求解復(fù)雜的Hessian矩陣的逆矩陣的缺陷兢榨,它使用正定矩陣來(lái)近似Hessian矩陣的逆,從而簡(jiǎn)化了運(yùn)算的復(fù)雜度顺饮。

4. 共軛梯度法

  • 共軛梯度法是介于最速下降法與牛頓法之間的一個(gè)方法色乾,它僅需利用一階導(dǎo)數(shù)信息,但克服了最速下降法收斂慢的缺點(diǎn)领突,又避免了牛頓法需要存儲(chǔ)和計(jì)算Hesse矩陣并求逆的缺點(diǎn)。
  • 其優(yōu)點(diǎn)是所需存儲(chǔ)量小案怯,具有步收斂性君旦,穩(wěn)定性高,而且不需要任何外來(lái)參數(shù)。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末金砍,一起剝皮案震驚了整個(gè)濱河市局蚀,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌恕稠,老刑警劉巖琅绅,帶你破解...
    沈念sama閱讀 210,978評(píng)論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異鹅巍,居然都是意外死亡千扶,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,954評(píng)論 2 384
  • 文/潘曉璐 我一進(jìn)店門骆捧,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)澎羞,“玉大人,你說(shuō)我怎么就攤上這事敛苇∽苯剩” “怎么了?”我有些...
    開封第一講書人閱讀 156,623評(píng)論 0 345
  • 文/不壞的土叔 我叫張陵枫攀,是天一觀的道長(zhǎng)括饶。 經(jīng)常有香客問(wèn)我,道長(zhǎng)来涨,這世上最難降的妖魔是什么图焰? 我笑而不...
    開封第一講書人閱讀 56,324評(píng)論 1 282
  • 正文 為了忘掉前任,我火速辦了婚禮扫夜,結(jié)果婚禮上楞泼,老公的妹妹穿的比我還像新娘。我一直安慰自己笤闯,他們只是感情好堕阔,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,390評(píng)論 5 384
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著颗味,像睡著了一般超陆。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上浦马,一...
    開封第一講書人閱讀 49,741評(píng)論 1 289
  • 那天时呀,我揣著相機(jī)與錄音,去河邊找鬼晶默。 笑死谨娜,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的磺陡。 我是一名探鬼主播趴梢,決...
    沈念sama閱讀 38,892評(píng)論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼漠畜,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了坞靶?” 一聲冷哼從身側(cè)響起憔狞,我...
    開封第一講書人閱讀 37,655評(píng)論 0 266
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎彰阴,沒(méi)想到半個(gè)月后瘾敢,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,104評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡尿这,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,451評(píng)論 2 325
  • 正文 我和宋清朗相戀三年簇抵,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片妻味。...
    茶點(diǎn)故事閱讀 38,569評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡正压,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出责球,到底是詐尸還是另有隱情焦履,我是刑警寧澤,帶...
    沈念sama閱讀 34,254評(píng)論 4 328
  • 正文 年R本政府宣布雏逾,位于F島的核電站嘉裤,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏栖博。R本人自食惡果不足惜屑宠,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,834評(píng)論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望仇让。 院中可真熱鬧典奉,春花似錦、人聲如沸丧叽。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,725評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)踊淳。三九已至假瞬,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間迂尝,已是汗流浹背脱茉。 一陣腳步聲響...
    開封第一講書人閱讀 31,950評(píng)論 1 264
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留垄开,地道東北人琴许。 一個(gè)月前我還...
    沈念sama閱讀 46,260評(píng)論 2 360
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像溉躲,于是被迫代替她去往敵國(guó)和親虚吟。 傳聞我的和親對(duì)象是個(gè)殘疾皇子寸认,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,446評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容