反向傳播算法

吳恩達神經(jīng)網(wǎng)絡(luò)課程里衬衬,反向傳播算法最難理解的是反向傳播階段怎樣調(diào)整各層次的權(quán)值婶肩,費用函數(shù)的雙層求和符號令人無限頭大左刽,于是費用函數(shù)的偏導(dǎo)數(shù)就更難證明腰埂。而課程此處略去一萬字歪架,最開始自己被\delta 攪得一頭霧水,不明白為什么每一層的誤差是這個值挺尾。直到讀了反向傳播推導(dǎo)超簡版一文才豁然開朗变勇。

這里寫下自己理解的思路:

1. 如何調(diào)整最后一層參數(shù)?

既然是反向傳播既荚,說明對于參數(shù)的調(diào)整是從最后一層開始的稚失,根據(jù)梯度下降算法:

\theta =\theta+\alpha\cdot \frac{dJ}{d\theta}

問題在于如何計算\frac{dJ}{d\theta} 。對于最后一層的某一個假設(shè)來說恰聘,神經(jīng)網(wǎng)絡(luò)會變化為如下的形狀:


由于只有一個輸出句各,最后一層神經(jīng)網(wǎng)絡(luò)退化為logistic模型,那么費用函數(shù)會退化為:

J=-y\cdot log(h(x))-(1-y)\cdot log(1-h(x))

即:

J= -y\cdot log(a^L ) - (1-y)\cdot log(1-a^L )

a^L = g(z^L ) = g(\theta^ {L-1}a^{L-1} )

根據(jù)鏈式法則\frac{dJ}{d\theta^{L-1}} =\frac{dJ}{da^L} \times \frac{da^L}{d\theta^{L-1}}得到:

\frac{dJ}{da^L} = \frac{d(-ylog(a^L)-(1-y)log(1-a^L))}{da^L}
=-\frac{y}{a^L} + \frac{1-y}{1-a^L} = \frac{a^L-y}{a^L(1-a^L)}

\frac{da^L}{d\theta^{L-1}} = \frac{da^L}{dz^L}*\frac{dz^L}{d\theta^{L-1}}

\frac{da^L}{dz^L} = a^L*(a^L-1)

\frac{dz^L}{d\theta^{L-1}} = a^{L-1}

由以上四式可得:

\frac{dJ}{d\theta^{L-1}} = (a^L-y)a^{L-1}

這里晴叨,課程中的\delta 被叫做偏差量凿宾,其實理解為為了求梯度下降的偏導(dǎo)數(shù)而引入的中間變量更為妥當。

于是最后一層輸出層的\delta 值被定義為a^L-y

是因為每一層都可以推導(dǎo)類似的關(guān)系

2. 反向傳播的推導(dǎo)

對于\frac{dJ}{d\theta^{n-1}} = \frac{dJ}{dz^n}\times \frac{dz^n}{d\theta^{n-1}} 中兼蕊,\frac{dz^n}{d\theta^{n-1}}是系數(shù)矩陣初厚,因此要求梯度,只需要求出\frac{dJ}{dz^n}即可孙技。直接從費用函數(shù)求解太復(fù)雜产禾,于是從z^{n}z^{n-1}的關(guān)系入手:

\frac{dJ}{dz^{n-1}}=\frac{dJ}{dz^n} \times \frac {dz^n}{dz^{n-1}}

z^n = \theta^{n-1} a^{n-1} = \theta^{n-1}g(z^{n-1})

于是,\frac{dz^n}{dz^{n-1}} = \theta^{n-1} a^{n-1}(a^{n-1}-1)

定義\delta ^n = \frac {dJ}{dz^n}可得:

\delta^{n-1} = \delta^{n} \theta^{n-1}a^{n-1}(a^{n-1}-1)

這樣就可以依次求解梯度下降的梯度向量

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末牵啦,一起剝皮案震驚了整個濱河市亚情,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌蕾久,老刑警劉巖势似,帶你破解...
    沈念sama閱讀 218,386評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異僧著,居然都是意外死亡履因,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,142評論 3 394
  • 文/潘曉璐 我一進店門盹愚,熙熙樓的掌柜王于貴愁眉苦臉地迎上來栅迄,“玉大人,你說我怎么就攤上這事皆怕∫阌撸” “怎么了?”我有些...
    開封第一講書人閱讀 164,704評論 0 353
  • 文/不壞的土叔 我叫張陵愈腾,是天一觀的道長憋活。 經(jīng)常有香客問我,道長虱黄,這世上最難降的妖魔是什么悦即? 我笑而不...
    開封第一講書人閱讀 58,702評論 1 294
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上辜梳,老公的妹妹穿的比我還像新娘粱甫。我一直安慰自己,他們只是感情好作瞄,可當我...
    茶點故事閱讀 67,716評論 6 392
  • 文/花漫 我一把揭開白布茶宵。 她就那樣靜靜地躺著,像睡著了一般宗挥。 火紅的嫁衣襯著肌膚如雪乌庶。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,573評論 1 305
  • 那天属韧,我揣著相機與錄音安拟,去河邊找鬼。 笑死宵喂,一個胖子當著我的面吹牛糠赦,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播锅棕,決...
    沈念sama閱讀 40,314評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼拙泽,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了裸燎?” 一聲冷哼從身側(cè)響起顾瞻,我...
    開封第一講書人閱讀 39,230評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎德绿,沒想到半個月后荷荤,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,680評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡移稳,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,873評論 3 336
  • 正文 我和宋清朗相戀三年蕴纳,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片个粱。...
    茶點故事閱讀 39,991評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡古毛,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出都许,到底是詐尸還是另有隱情稻薇,我是刑警寧澤,帶...
    沈念sama閱讀 35,706評論 5 346
  • 正文 年R本政府宣布胶征,位于F島的核電站塞椎,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏睛低。R本人自食惡果不足惜忱屑,卻給世界環(huán)境...
    茶點故事閱讀 41,329評論 3 330
  • 文/蒙蒙 一蹬敲、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧莺戒,春花似錦、人聲如沸急波。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,910評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽澄暮。三九已至名段,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間泣懊,已是汗流浹背伸辟。 一陣腳步聲響...
    開封第一講書人閱讀 33,038評論 1 270
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留馍刮,地道東北人信夫。 一個月前我還...
    沈念sama閱讀 48,158評論 3 370
  • 正文 我出身青樓,卻偏偏與公主長得像卡啰,于是被迫代替她去往敵國和親静稻。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,941評論 2 355

推薦閱讀更多精彩內(nèi)容