反向傳播算法的矩陣維度分析

各位小伙伴們大家好,這幾天我在群里看見了一位小伙伴提出了關(guān)于BP神經(jīng)網(wǎng)絡(luò)的反向傳播算法的梯度維度的問題,我對這個問題也很有興趣,所以希望通過這篇文章來去和大家探討下這方面的知識.

在我們學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的時(shí)候,我們?yōu)榱瞬粩嗟氐履繕?biāo)函數(shù),我們總是不斷地往復(fù)更新迭代神經(jīng)網(wǎng)絡(luò)中的各個參數(shù)和權(quán)值,而在實(shí)際過程中我們一般都是使用的矩陣向量化的方式去計(jì)算量化,但是如果我們能夠了解這個矩陣求導(dǎo)的過程的話,我們對于反向傳播算法中的梯度問題應(yīng)該就能夠很好的理解.(很多有疑惑的伙伴應(yīng)該是看過CS231n吧,我記得沒有讀懂他的那個反向傳播算法梯度的代碼).

神經(jīng)網(wǎng)絡(luò)前向傳播:

在這里因?yàn)樯线呉蔡岬搅?我們都是用的矩陣向量來去表示數(shù)據(jù),這里的話每一個變量都是有自己的一個維度的信息的:

神經(jīng)網(wǎng)絡(luò)的反向傳播:

在使用反向傳播去更新參數(shù)的時(shí)候,一般情況下都需要涉及到參數(shù)梯度的求解,那么根據(jù)上邊的神經(jīng)網(wǎng)絡(luò)前向傳播公式得到,我們求解的變量的話這時(shí)候有dw,dx,db.

現(xiàn)在我們不妨設(shè)損失函數(shù)loss()=L,并且這個損失函數(shù)是一個標(biāo)量(因?yàn)闃?biāo)量對于矩陣的求偏導(dǎo)數(shù)的話,矩陣的維度不會發(fā)生變化).那這時(shí)候我們挨個來,求求dx,dw,db的梯度:

1:dx的梯度:

在這里我們要用到鏈?zhǔn)角髮?dǎo)法則,如果有不熟悉的小伙伴請去:

http://61.139.105.132/gdsx/dzja/7/4.htm

回憶下知識再來看這篇文章,效果更好.

根據(jù)鏈?zhǔn)角髮?dǎo)法則,dx的梯度可以表達(dá)為:

由神經(jīng)網(wǎng)絡(luò)的前向傳播中我們知道,每一個變量的維度都是一致的,這時(shí)候dx,dw,db的維度分別和x,w,b的維度都是一致的,那么這時(shí)候我們就可以得到這樣的條件:

那這時(shí)候&y/&x的導(dǎo)數(shù)就需要計(jì)算下了,這個時(shí)候我們就需要矩陣的乘法運(yùn)算來去計(jì)算分析:

1:由上文得,dx的維度是N*D,&L/&y的維度是N*M,那個根據(jù)矩陣運(yùn)算公式,我們可以計(jì)算出

那么這時(shí)候我們可以得到&y/&x的矩陣維度是M*D,那么這時(shí)候我們回頭看一看前邊的條件,W的矩陣維度是D*M,那么&y/&x的矩陣維度豈不是W矩陣的轉(zhuǎn)置?其實(shí)就是這樣.

我們最后得出一個結(jié)論:&y/&x的結(jié)果是矩陣w的轉(zhuǎn)置,然后得到以下公式:

那這個時(shí)候我們再去求dw,db就會變得非常的toy了,因?yàn)樗悸肥窍嗤?

dw的公式表示為:

再去計(jì)算一下:

dw的維度信息如下:

我們這時(shí)候可以發(fā)現(xiàn)&y/&w的維度是D*N,而x的維度是N*D,這時(shí)候其實(shí)&y/&w可以看作為一個X的轉(zhuǎn)置,這樣的話可以表示為:

那db也就可以更快的推出來了:

鏈?zhǔn)角髮?dǎo)為:

再來個矩陣乘法:

得到:

另外這里有幾篇比較好的文章推薦給大家:

http://cs231n.github.io/optimization-2/

http://blog.csdn.net/han_xiaoyang/article/details/50321873

https://zhuanlan.zhihu.com/p/25496760

希望大家可以能夠有所收獲,也請各位多多指教

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子谭跨,更是在濱河造成了極大的恐慌肆良,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,744評論 6 502
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)纹磺,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,505評論 3 392
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來谐丢,“玉大人爽航,你說我怎么就攤上這事∏溃” “怎么了讥珍?”我有些...
    開封第一講書人閱讀 163,105評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長窄瘟。 經(jīng)常有香客問我衷佃,道長,這世上最難降的妖魔是什么蹄葱? 我笑而不...
    開封第一講書人閱讀 58,242評論 1 292
  • 正文 為了忘掉前任氏义,我火速辦了婚禮,結(jié)果婚禮上图云,老公的妹妹穿的比我還像新娘惯悠。我一直安慰自己,他們只是感情好竣况,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,269評論 6 389
  • 文/花漫 我一把揭開白布克婶。 她就那樣靜靜地躺著,像睡著了一般丹泉。 火紅的嫁衣襯著肌膚如雪情萤。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,215評論 1 299
  • 那天摹恨,我揣著相機(jī)與錄音筋岛,去河邊找鬼。 笑死晒哄,一個胖子當(dāng)著我的面吹牛睁宰,可吹牛的內(nèi)容都是我干的肪获。 我是一名探鬼主播,決...
    沈念sama閱讀 40,096評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼勋陪,長吁一口氣:“原來是場噩夢啊……” “哼贪磺!你這毒婦竟也來了硫兰?” 一聲冷哼從身側(cè)響起诅愚,我...
    開封第一講書人閱讀 38,939評論 0 274
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎劫映,沒想到半個月后违孝,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,354評論 1 311
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡泳赋,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,573評論 2 333
  • 正文 我和宋清朗相戀三年雌桑,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片祖今。...
    茶點(diǎn)故事閱讀 39,745評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡校坑,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出千诬,到底是詐尸還是另有隱情耍目,我是刑警寧澤,帶...
    沈念sama閱讀 35,448評論 5 344
  • 正文 年R本政府宣布徐绑,位于F島的核電站邪驮,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏傲茄。R本人自食惡果不足惜毅访,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,048評論 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望盘榨。 院中可真熱鬧喻粹,春花似錦、人聲如沸草巡。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,683評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽捷犹。三九已至弛饭,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間萍歉,已是汗流浹背侣颂。 一陣腳步聲響...
    開封第一講書人閱讀 32,838評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留枪孩,地道東北人憔晒。 一個月前我還...
    沈念sama閱讀 47,776評論 2 369
  • 正文 我出身青樓藻肄,卻偏偏與公主長得像,于是被迫代替她去往敵國和親拒担。 傳聞我的和親對象是個殘疾皇子嘹屯,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,652評論 2 354

推薦閱讀更多精彩內(nèi)容