1 參悟深度學(xué)習(xí)-梯度下降法

數(shù)學(xué)知識(shí)

導(dǎo)函數(shù)

本質(zhì)上梯度下降法是在解決極值的問題

而在數(shù)學(xué)上求極值,需要知道導(dǎo)函數(shù) 就很容易求的 比如

函數(shù) y = x^2 + 4x + 4 的最大/小值是在其導(dǎo)函數(shù)等于0時(shí)的x的值 即 2*x + 4 = 0 是 x=-2 存在最大/小值 y=0

image.jpeg

導(dǎo)函數(shù)的公式

f(x) = 4                          f(x)’= 0 

f(x) = 2x                        f(x)’= 2 

f(x) = x^2                      f(x)’= 2x 

f(x) = x^3                      f(x)’= 3x^2 

f(x) = 4x^2 + 2x + 5     f(x)’= 8x + 2 

鏈?zhǔn)椒▌t

這個(gè)是一個(gè)非常重要法則

求函數(shù) ?f(x) = 4(x + 2)^2的導(dǎo)函數(shù) 

設(shè) z(x) = x + 2 則 f(x) = f(z(x)) = 4z^2 則 

f(x)’= f(z(x))’* z’= 8*z * (1) = 8*(x + 2) = 8x + 16 

使用鏈?zhǔn)椒▌t 能使求導(dǎo)變得很簡單

偏導(dǎo)數(shù)

如果一個(gè)函數(shù)有兩個(gè)未知數(shù)x, y那么就有個(gè)兩個(gè)導(dǎo)函數(shù),分別關(guān)于x狼犯,y的 求法其實(shí)很簡單 把另一個(gè)當(dāng)作沒看見就好 例如

f(x, y) = 4x^2 + 5 x y + 6y^2 

x的偏導(dǎo)數(shù) = 8x + 5y 

y的偏導(dǎo)數(shù) = 12y + 5x 

矩陣及其乘法

假設(shè)

nx = ax + by + t1 

ny = cx + dy + t2 

那么可以用矩陣表示為

image.jpeg
假設(shè)矩陣[a, b, c, d]為K情组,[x, y]為X丈挟,[t1, t2]為B, [nx, ny]為Y那么上面的等式為 

KX+B=Y 

一個(gè)m行z列的矩陣A 乘以一個(gè) z行n列的矩陣B得到的矩陣為m行n列 即:

m x z @ z x n = m x n  

意味著 兩個(gè)矩陣相乘 必須是前面的列數(shù)等于后面的行數(shù)

意味著 矩陣乘法不滿足交換律

示例如下 前一個(gè)的行乘以后一個(gè)的列作為某個(gè)元素

image.jpeg

梯度下降法

如果求函數(shù)y = x^2 + 4x + 4 的極值

那么當(dāng)2x+4=0時(shí)获枝,x處就是函數(shù)的極值

當(dāng)然還有一種方式积蜻。就是我們把x從-10闯割,10的整數(shù)依次代入上面的函數(shù)中 然后得到當(dāng)x=-2時(shí) y的值最小為0,而梯度下降法與這種方式類似 下圖是使用梯度下降法求極值

image.jpeg

起先x設(shè)置為0竿拆,循環(huán)一百次宙拉,每次上次的基礎(chǔ)上減去 0.1乘以其導(dǎo)數(shù) 輸出如下

image.jpeg

x起始值可以是任意的,同樣的0.1 可以是任意小于1的正小數(shù)丙笋,最終輸出趨于-2

一般地 0.1稱之為學(xué)習(xí)率

為什么循環(huán)谢澈,直接求方程2x+4=0啊 只能說年少輕狂。御板。锥忿。

為什么要減去其導(dǎo)數(shù),參看牛頓法求極值‘

總而言之怠肋,它很重要敬鬓,奠定了機(jī)器學(xué)習(xí)的基礎(chǔ),也能解決實(shí)際中的不少問題

應(yīng)用示例

直線逼近

理想中兩個(gè)點(diǎn)確定了一條直線笙各,但現(xiàn)實(shí)是給了一堆點(diǎn)來確定一條直線

設(shè)這條直線是 kx + b = y 使得 (y - (kx + b))^2 的值最小

已知 x1, x2, x3, y1, y2, y3 求k和b 函數(shù)是((kx + b) - y)^2 

k的偏導(dǎo)數(shù)是 2((kx + b) - y) * x 

b的偏導(dǎo)數(shù)是 2((kx + b) - y) 

示例代碼如下:

image.jpeg
image.jpeg

循環(huán)100次之后發(fā)現(xiàn) 基本上求出k和b了 也可以把k钉答,b的誤差打印出來

image.jpeg

輸出如下:

image.jpeg

2D矩陣逼近

在2d平面中的(x,y)變換成一個(gè)新的點(diǎn)(u, v) 則

(u = ax + by + t1, v = cx + dy + t2)  

由參數(shù)a杈抢,b数尿, c,d惶楼,t1, t2組成了2d的變換矩陣

求一個(gè)變換矩陣 使得滿足(x1, y1), (x2, y2), (x3, y3) … 變換后的點(diǎn)為(u1, v1), (u2, v2), (u3, v3) ….

設(shè) u = ax + by + t1, v = cx + by + t2求參數(shù) a, b, c, d, t1, t2使得((ax + by + t1) - u)^2 和 ((cx + dy + t2) - v) ^2 在極值處 

a’ = 2((ax + by + t1) - u) * x 

b’ = 2((ax + by + t1) - u) * y 

c’ = 2((cx + dy + t2) - v) * x 

d’ = 2((cx + dy + t2) - v) * y 

t1’ = 2((ax + by + t1) - u)  

t2’ = 2((cx + dy + t2) - v) 

示例代碼如下:

image.jpeg

這里使用矩陣W來表示參數(shù)(a, b, c, d), 矩陣T來表示參數(shù)(t1, t2) 使用矩陣的乘法和加法大大的節(jié)省了代碼量

image.jpeg

3D矩陣逼近

了解了2D的矩陣砌创,那么3D的矩陣也同理

u = ax + by + cz + t1 

v = ex + fy + gz + t2 

w = hx + iy + jz + t3 

只是參數(shù)變成了12個(gè) 其中W包含9個(gè) 加上 T的3個(gè) 那么代碼如下

image.jpeg

輸出如下:

image.jpeg

總結(jié)

在上面示例中 更新參數(shù)時(shí) 減去當(dāng)前參數(shù)的偏導(dǎo)數(shù)虏缸,偏導(dǎo)數(shù)也稱之為是該參數(shù)的梯度

這種函數(shù) (kx+b - y)^2 稱之為損失函數(shù)

更新參數(shù)的時(shí)候 是減去 學(xué)習(xí)率 x 梯度,而不是加上 學(xué)習(xí)率 x 梯度嫩实,為什么?如果是加上 那么損失函數(shù)應(yīng)該是(y - (kx + b))^2, 但是在牛頓法中用的是減號(hào)窥岩,在上面的求拋物線y=x^2 + 4x + 4中使用加號(hào)的話 求不出來極值甲献。。颂翼。

首頁:http://www.reibang.com/p/92810c3a2d0e

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末晃洒,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子朦乏,更是在濱河造成了極大的恐慌球及,老刑警劉巖,帶你破解...
    沈念sama閱讀 210,914評(píng)論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件呻疹,死亡現(xiàn)場離奇詭異吃引,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)刽锤,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,935評(píng)論 2 383
  • 文/潘曉璐 我一進(jìn)店門镊尺,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人并思,你說我怎么就攤上這事庐氮。” “怎么了宋彼?”我有些...
    開封第一講書人閱讀 156,531評(píng)論 0 345
  • 文/不壞的土叔 我叫張陵弄砍,是天一觀的道長。 經(jīng)常有香客問我输涕,道長音婶,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,309評(píng)論 1 282
  • 正文 為了忘掉前任占贫,我火速辦了婚禮桃熄,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘型奥。我一直安慰自己瞳收,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,381評(píng)論 5 384
  • 文/花漫 我一把揭開白布厢汹。 她就那樣靜靜地躺著螟深,像睡著了一般。 火紅的嫁衣襯著肌膚如雪烫葬。 梳的紋絲不亂的頭發(fā)上界弧,一...
    開封第一講書人閱讀 49,730評(píng)論 1 289
  • 那天凡蜻,我揣著相機(jī)與錄音,去河邊找鬼垢箕。 笑死划栓,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的条获。 我是一名探鬼主播忠荞,決...
    沈念sama閱讀 38,882評(píng)論 3 404
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢(mèng)啊……” “哼帅掘!你這毒婦竟也來了委煤?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,643評(píng)論 0 266
  • 序言:老撾萬榮一對(duì)情侶失蹤修档,失蹤者是張志新(化名)和其女友劉穎碧绞,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體吱窝,經(jīng)...
    沈念sama閱讀 44,095評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡讥邻,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,448評(píng)論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了癣诱。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片计维。...
    茶點(diǎn)故事閱讀 38,566評(píng)論 1 339
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖撕予,靈堂內(nèi)的尸體忽然破棺而出鲫惶,到底是詐尸還是另有隱情,我是刑警寧澤实抡,帶...
    沈念sama閱讀 34,253評(píng)論 4 328
  • 正文 年R本政府宣布欠母,位于F島的核電站,受9級(jí)特大地震影響吆寨,放射性物質(zhì)發(fā)生泄漏赏淌。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,829評(píng)論 3 312
  • 文/蒙蒙 一啄清、第九天 我趴在偏房一處隱蔽的房頂上張望六水。 院中可真熱鬧,春花似錦辣卒、人聲如沸掷贾。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,715評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽想帅。三九已至,卻和暖如春啡莉,著一層夾襖步出監(jiān)牢的瞬間港准,已是汗流浹背旨剥。 一陣腳步聲響...
    開封第一講書人閱讀 31,945評(píng)論 1 264
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留浅缸,地道東北人轨帜。 一個(gè)月前我還...
    沈念sama閱讀 46,248評(píng)論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像疗杉,于是被迫代替她去往敵國和親阵谚。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,440評(píng)論 2 348