深度解讀機器學(xué)習(xí)“梯度下降”

梯度下降是機器學(xué)習(xí)中用來求最小值的算法,它被廣泛應(yīng)用于像邏輯回歸、線性回歸和神經(jīng)網(wǎng)絡(luò)的模型中吗坚。

一菇晃、全局誤差函數(shù)

要了解為什么使用“梯度下降法”去求最小值册倒,必須先知道機器學(xué)習(xí)求得模型的方式。比如現(xiàn)在有一份線性數(shù)據(jù)的關(guān)系磺送,假設(shè)他的模型為線性驻子,w為權(quán)值(隨機)灿意,b為偏置,e為假設(shè)的“誤差”:

假設(shè)擬合模型

我們把這個方程做一下變換拴孤,得到關(guān)于真實值和模型擬合值的誤差

公式轉(zhuǎn)換

上面只是關(guān)于一個數(shù)據(jù)的誤差脾歧,接下來對所有數(shù)據(jù)的誤差進行一次加和,然后再平方演熟。得到一個所有真實值與擬合值誤差的平方函數(shù)鞭执,將其定義為“全局性誤差函數(shù)”loss

誤差函數(shù)loss

我們回過頭去想,機器學(xué)習(xí)的目的就是擬合出一個可以準確描述這組數(shù)據(jù)的模型芒粹。按照上面的公式來看兄纺,如果令“Loss=0”,也就是令所有真實值與擬合值誤差的平方為零化漆,就等于說這個模型是可以準確描述真實世界數(shù)據(jù)的估脆。而讓Loss為零時的w與b,就是描述這個模型的參數(shù)

至于為什么要進行平方處理座云,是應(yīng)用了最小二乘的思想疙赠。我們本來是想找到一個合適的模型,對此構(gòu)建了一個真實值與擬合值的“平方差模型”朦拖,找到了這個平方差模型的解圃阳,也就等于是找到了我們需要的“擬合模型”

本質(zhì)上,我們是通過上面的方式璧帝,把一個求模型的問題捍岳,轉(zhuǎn)換成了一個函數(shù)求解“最小值”的數(shù)學(xué)問題。那么問題來了睬隶,如何找到這個函數(shù)中的最小值锣夹,就是“梯度下降”所解決的問題。

二苏潜、梯度下降法

問題變成了求解一個函數(shù)模型的最小值問題银萍,要用到高等數(shù)學(xué)里關(guān)于“導(dǎo)數(shù)”的一系列概念和知識作為鋪墊。想理解何為梯度恤左,梯度是如何一步一步如何求得這個函數(shù)的最小值砖顷,就必須從他開始

2.1梯度的定義

·導(dǎo)數(shù)

導(dǎo)數(shù)反映在下圖,是曲線上的某個點沿x軸正方向的變化率(即切線)赃梧。

導(dǎo)數(shù)

·偏導(dǎo)數(shù)

偏導(dǎo)數(shù)本質(zhì)上與導(dǎo)數(shù)一樣滤蝠,都是當自變量變化的時候,函數(shù)值的變化量與自變量變化值的比值(即某個點沿x軸正方向的變化率)授嘀。不同在于導(dǎo)數(shù)描述的一元函數(shù)物咳,而偏導(dǎo)描述的是多元函數(shù)

·方向?qū)?shù)

方向?qū)?shù)與導(dǎo)數(shù)和偏導(dǎo)不同在于,它描述的是一個多元函數(shù)蹄皱,在任意方向上的變化率览闰。方向?qū)?shù)既有數(shù)值芯肤,也有方向(不再僅僅是正方向一個方向)。

·梯度

那么問題來了压鉴,你想不想知道在這個點的n多個方向?qū)?shù)中崖咨,哪個是下降的方向變化是最大的,哪個是上升的方向變化最大的油吭。這就引出了對“梯度”的定義:

梯度击蹲,即函數(shù)在某個點的一個向量,它的方向與取得最大方向?qū)?shù)的方向一致婉宰,模為該方向?qū)?shù)的最大值歌豺。

梯度與方向?qū)?shù)的關(guān)系,可以理解為它是方向?qū)?shù)中兩個極端的“子集”心包,因為方向?qū)?shù)可以說有無數(shù)個方向类咧,而梯度就是兩個上升和下降變化率最大的兩個方向

2.2梯度下降法

(1)核心思想

理解了全局性誤差函數(shù)模型和對梯度的定義,讓我們來看看梯度下降是怎么找到函數(shù)最小值的蟹腾。

梯度下降的核心思想為:當你在一個模型中隨機選取了一個點并求得該點的Loss痕惋,此時你的目的是找到讓Loss等于或最接近零的點,你為了讓loss減小娃殖,就要尋找下一個能讓這個loss下降最多的點血巍。但如果對所有的方向依次試一遍,那工作量實在是太大了珊随!這時候就可以引入“梯度”來解決這個問題

我們已經(jīng)知道梯度是某個點的“最大方向?qū)?shù)”,如果沿著“梯度負方向”柿隙,也就是沿著這個點在模型中“下降最多方向”的方向?qū)?shù)叶洞,就最有可能以最快的速度找個“最小值”點。

梯度下降

可以借著上面的圖禀崖,想象自己在一個山上的點衩辟,你想要下山的話,環(huán)顧一下四周波附,沿著一個最最陡峭的方向挪一下艺晴,又到了一個點,繼續(xù)環(huán)顧四周掸屡,找到當前最陡峭的方向封寞,繼續(xù)挪......梯度下降就是這樣一個過程

(2)局部最優(yōu)

當然,即時是沿著“負向”梯度方向仅财,也不一定能保證所到達的點一定是全局最優(yōu)解狈究。目前幾乎所有的實用算法,都不能像上帝視角一樣保證每次都能找到全局最優(yōu)解盏求。不過即使是“局部最優(yōu)”抖锥,也能解決很大問題了亿眠。

(3)梯度下降公式

梯度下降算法的公式如下:

梯度下降算法公式

公式依次代表為“下次迭代的點”、“目前所在的點”磅废、“學(xué)習(xí)率”和“最大負向梯度”纳像。按照這個公式,每次迭代都會根據(jù)上次的步長減去學(xué)習(xí)率乘以“梯度”的值拯勉,去一步一步更新竟趾,這樣能可以每次迭代都朝著最大負方向去迭代。

(4)學(xué)習(xí)率

讓我們來看看學(xué)習(xí)率a代表什么谜喊。它直接決定著每次更新的挪動大小潭兽。

如果a太小,那么每次挪動的距離只會一點一點挪動斗遏,這樣就需要很多步才能到達最低點山卦。

如果a太大,那么梯度下降法可能會越過最低點诵次,甚至可能“無法收斂”都不一定哦账蓉。因為你每次挪動的距離都很大,這次越過了一個最低點逾一,下次又越過了一次最低點铸本,直到越過所有“最低點”,那么你就永遠都找不到“局部最優(yōu)解”了遵堵,也就發(fā)散了

(5)自動減小幅度值

梯度下降法還有一個優(yōu)勢箱玷,就是越接近最小值的時候,梯度下降法會自動調(diào)整更新的幅度陌宿,這是因它的公式本身而決定的锡足,以下圖為例,假設(shè)我最開始在取值在函數(shù)中的最高點(粉紅色)壳坪,那么很顯然每次下降之后的點舶得,梯度都會變得越來越小。

梯度下降步驟(由上至下)

當你接近局部最優(yōu)解的時候爽蝴,很顯然在局部最低時導(dǎo)數(shù)等于零沐批,當接近局部最優(yōu)解時,導(dǎo)數(shù)值(即公式的最后一部分)會變得越來越小蝎亚,所以梯度下降將自動采取較小的幅度九孩。很神奇有木有,你都不用刻意去調(diào)整學(xué)習(xí)率a的值发框,梯度下降法會自動保證不越過最低點

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末捻撑,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌顾患,老刑警劉巖番捂,帶你破解...
    沈念sama閱讀 211,948評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異江解,居然都是意外死亡设预,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,371評論 3 385
  • 文/潘曉璐 我一進店門犁河,熙熙樓的掌柜王于貴愁眉苦臉地迎上來鳖枕,“玉大人,你說我怎么就攤上這事桨螺”龇” “怎么了?”我有些...
    開封第一講書人閱讀 157,490評論 0 348
  • 文/不壞的土叔 我叫張陵灭翔,是天一觀的道長魏烫。 經(jīng)常有香客問我,道長肝箱,這世上最難降的妖魔是什么哄褒? 我笑而不...
    開封第一講書人閱讀 56,521評論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮煌张,結(jié)果婚禮上呐赡,老公的妹妹穿的比我還像新娘。我一直安慰自己骏融,他們只是感情好链嘀,可當我...
    茶點故事閱讀 65,627評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著档玻,像睡著了一般怀泊。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上窃肠,一...
    開封第一講書人閱讀 49,842評論 1 290
  • 那天,我揣著相機與錄音刷允,去河邊找鬼冤留。 笑死,一個胖子當著我的面吹牛树灶,可吹牛的內(nèi)容都是我干的纤怒。 我是一名探鬼主播,決...
    沈念sama閱讀 38,997評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼天通,長吁一口氣:“原來是場噩夢啊……” “哼泊窘!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,741評論 0 268
  • 序言:老撾萬榮一對情侶失蹤烘豹,失蹤者是張志新(化名)和其女友劉穎瓜贾,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體携悯,經(jīng)...
    沈念sama閱讀 44,203評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡祭芦,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,534評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了憔鬼。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片龟劲。...
    茶點故事閱讀 38,673評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖轴或,靈堂內(nèi)的尸體忽然破棺而出昌跌,到底是詐尸還是另有隱情,我是刑警寧澤照雁,帶...
    沈念sama閱讀 34,339評論 4 330
  • 正文 年R本政府宣布蚕愤,位于F島的核電站,受9級特大地震影響囊榜,放射性物質(zhì)發(fā)生泄漏审胸。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,955評論 3 313
  • 文/蒙蒙 一卸勺、第九天 我趴在偏房一處隱蔽的房頂上張望砂沛。 院中可真熱鬧,春花似錦曙求、人聲如沸碍庵。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,770評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽静浴。三九已至,卻和暖如春挤渐,著一層夾襖步出監(jiān)牢的瞬間苹享,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,000評論 1 266
  • 我被黑心中介騙來泰國打工浴麻, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留得问,地道東北人。 一個月前我還...
    沈念sama閱讀 46,394評論 2 360
  • 正文 我出身青樓软免,卻偏偏與公主長得像宫纬,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子膏萧,可洞房花燭夜當晚...
    茶點故事閱讀 43,562評論 2 349

推薦閱讀更多精彩內(nèi)容