反向傳播算法的矩陣維度分析

各位小伙伴們大家好,這幾天我在群里看見了一位小伙伴提出了關(guān)于BP神經(jīng)網(wǎng)絡(luò)的反向傳播算法的梯度維度的問題,我對這個問題也很有興趣,所以希望通過這篇文章來去和大家探討下這方面的知識.

在我們學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的時(shí)候,我們?yōu)榱瞬粩嗟氐履繕?biāo)函數(shù),我們總是不斷地往復(fù)更新迭代神經(jīng)網(wǎng)絡(luò)中的各個參數(shù)和權(quán)值,而在實(shí)際過程中我們一般都是使用的矩陣向量化的方式去計(jì)算量化,但是如果我們能夠了解這個矩陣求導(dǎo)的過程的話,我們對于反向傳播算法中的梯度問題應(yīng)該就能夠很好的理解.(很多有疑惑的伙伴應(yīng)該是看過CS231n吧,我記得沒有讀懂他的那個反向傳播算法梯度的代碼).

神經(jīng)網(wǎng)絡(luò)前向傳播:

在這里因?yàn)樯线呉蔡岬搅?我們都是用的矩陣向量來去表示數(shù)據(jù),這里的話每一個變量都是有自己的一個維度的信息的:

神經(jīng)網(wǎng)絡(luò)的反向傳播:

在使用反向傳播去更新參數(shù)的時(shí)候,一般情況下都需要涉及到參數(shù)梯度的求解,那么根據(jù)上邊的神經(jīng)網(wǎng)絡(luò)前向傳播公式得到,我們求解的變量的話這時(shí)候有dw,dx,db.

現(xiàn)在我們不妨設(shè)損失函數(shù)loss()=L,并且這個損失函數(shù)是一個標(biāo)量(因?yàn)闃?biāo)量對于矩陣的求偏導(dǎo)數(shù)的話,矩陣的維度不會發(fā)生變化).那這時(shí)候我們挨個來,求求dx,dw,db的梯度:

1:dx的梯度:

在這里我們要用到鏈?zhǔn)角髮?dǎo)法則,如果有不熟悉的小伙伴請去:

http://61.139.105.132/gdsx/dzja/7/4.htm

回憶下知識再來看這篇文章,效果更好.

根據(jù)鏈?zhǔn)角髮?dǎo)法則,dx的梯度可以表達(dá)為:

由神經(jīng)網(wǎng)絡(luò)的前向傳播中我們知道,每一個變量的維度都是一致的,這時(shí)候dx,dw,db的維度分別和x,w,b的維度都是一致的,那么這時(shí)候我們就可以得到這樣的條件:

那這時(shí)候&y/&x的導(dǎo)數(shù)就需要計(jì)算下了,這個時(shí)候我們就需要矩陣的乘法運(yùn)算來去計(jì)算分析:

1:由上文得,dx的維度是N*D,&L/&y的維度是N*M,那個根據(jù)矩陣運(yùn)算公式,我們可以計(jì)算出

那么這時(shí)候我們可以得到&y/&x的矩陣維度是M*D,那么這時(shí)候我們回頭看一看前邊的條件,W的矩陣維度是D*M,那么&y/&x的矩陣維度豈不是W矩陣的轉(zhuǎn)置?其實(shí)就是這樣.

我們最后得出一個結(jié)論:&y/&x的結(jié)果是矩陣w的轉(zhuǎn)置,然后得到以下公式:

那這個時(shí)候我們再去求dw,db就會變得非常的toy了,因?yàn)樗悸肥窍嗤?

dw的公式表示為:

再去計(jì)算一下:

dw的維度信息如下:

我們這時(shí)候可以發(fā)現(xiàn)&y/&w的維度是D*N,而x的維度是N*D,這時(shí)候其實(shí)&y/&w可以看作為一個X的轉(zhuǎn)置,這樣的話可以表示為:

那db也就可以更快的推出來了:

鏈?zhǔn)角髮?dǎo)為:

再來個矩陣乘法:

得到:

另外這里有幾篇比較好的文章推薦給大家:

http://cs231n.github.io/optimization-2/

http://blog.csdn.net/han_xiaoyang/article/details/50321873

https://zhuanlan.zhihu.com/p/25496760

希望大家可以能夠有所收獲,也請各位多多指教

最后編輯于：2017.12.10 16:15:06

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子谭跨，更是在濱河造成了極大的恐慌肆良，老刑警劉巖，帶你破解...
沈念sama閱讀 216,744評論 6贊 502
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)纹磺，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,505評論 3贊 392
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來谐丢，“玉大人爽航，你說我怎么就攤上這事∏溃” “怎么了讥珍？”我有些...
開封第一講書人閱讀 163,105評論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長窄瘟。經(jīng)常有香客問我衷佃，道長，這世上最難降的妖魔是什么蹄葱？我笑而不...
開封第一講書人閱讀 58,242評論 1贊 292
?港島之戀（遺憾婚禮）
正文為了忘掉前任氏义，我火速辦了婚禮，結(jié)果婚禮上图云，老公的妹妹穿的比我還像新娘惯悠。我一直安慰自己，他們只是感情好竣况，可當(dāng)我...
茶點(diǎn)故事閱讀 67,269評論 6贊 389
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布克婶。她就那樣靜靜地躺著，像睡著了一般丹泉。火紅的嫁衣襯著肌膚如雪情萤。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 51,215評論 1贊 299
城市分裂傳說
那天摹恨，我揣著相機(jī)與錄音筋岛，去河邊找鬼。笑死晒哄，一個胖子當(dāng)著我的面吹牛睁宰，可吹牛的內(nèi)容都是我干的肪获。我是一名探鬼主播，決...
沈念sama閱讀 40,096評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼勋陪，長吁一口氣：“原來是場噩夢啊……” “哼贪磺！你這毒婦竟也來了硫兰？” 一聲冷哼從身側(cè)響起诅愚，我...
開封第一講書人閱讀 38,939評論 0贊 274
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎劫映，沒想到半個月后违孝，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,354評論 1贊 311
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡泳赋，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,573評論 2贊 333
?白月光啟示錄
正文我和宋清朗相戀三年雌桑，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片祖今。...
茶點(diǎn)故事閱讀 39,745評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡校坑，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出千诬，到底是詐尸還是另有隱情耍目，我是刑警寧澤，帶...
沈念sama閱讀 35,448評論 5贊 344
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布徐绑，位于F島的核電站邪驮，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏傲茄。R本人自食惡果不足惜毅访，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,048評論 3贊 327
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望盘榨。院中可真熱鬧喻粹，春花似錦、人聲如沸草巡。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,683評論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽捷犹。三九已至弛饭，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間萍歉，已是汗流浹背侣颂。一陣腳步聲響...
開封第一講書人閱讀 32,838評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留枪孩，地道東北人憔晒。一個月前我還...
沈念sama閱讀 47,776評論 2贊 369
代替公主和親
正文我出身青樓藻肄，卻偏偏與公主長得像，于是被迫代替她去往敵國和親拒担。傳聞我的和親對象是個殘疾皇子嘹屯，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,652評論 2贊 354

反向傳播算法的矩陣維度分析

推薦閱讀更多精彩內(nèi)容