2023-09-16 01 梯度

來源:深度學(xué)習(xí)——損失函數(shù)與梯度推導(dǎo)_ftmax 損失函數(shù)以及梯度推導(dǎo)計算_隔壁的NLP小哥的博客-CSDN博客

1. 均方誤差的梯度

均方誤差是一種常見的損失函數(shù)溃卡,一般在回歸問題中比較常見赏表,其基本公式為:

J =MSE=\frac{1}{C} \sum_{i=1}^L (y_{ri}-y_i)^2

其中氮墨,C是一個超參數(shù),為了便于求導(dǎo)算利,一般情況下取C=2。 y_{ri}是真實的標(biāo)簽值的第i個屬性值泳姐,y_i表示預(yù)測值的第i個屬性值效拭。

則有:

\frac{?J }{?y_{i}}  = \frac{?\frac{1}{C}\sum_{i=1}^L (y_{ri}-y_i)^2}{?y_{i}} =\frac{2}{C}(y_{ri}-y_i)*(-1) = \frac{2}{C}(y_i-y_{ri})

整理成向量的形式有:

\frac{?J}{?y}=\frac{2}{C}*\begin{matrix}y_1-y_{r1}\\y_2-y_{r2}\\......\\y_L-y_{rL}\\\end{matrix}


2. sotfmax + 交叉熵

sotfmax和交叉熵通常被用于分類任務(wù)中,其中,softmax的定義為:

其中缎患,softmax的定義為:y_i = \frac{e^{o_i}}{∑_{j=1}^Le^{o_j}}

其中借笙,o_i表示輸出單元輸出的第i個屬性值,一般情況下较锡,y_i表示屬于第i類的概率业稼。

交叉熵的損失函數(shù)定義為:

J = - ∑_{i=1}^Ly_{ri}ln(y_i)

其中y_{ri}表示真實的第i類的概率值。

一般情況下蚂蕴,softmax產(chǎn)生的是一個L維的概率分布Y低散。

而真實向量Y_r是一個0,1向量,1表示對應(yīng)的分類骡楼。0表示不是該分類熔号。

3. 梯度計算

現(xiàn)在,我們假設(shè)在真實的分類向量Y_r中鸟整,對應(yīng)的是第s個分類引镊。

y_s = 1, 則有y_{i≠s}=0

我們分成兩種情況:

1)? 當(dāng)i=s的時候,有:

J = - y_{rs}ln(y_s)

y_s = \frac{e^{o_s}}{∑_{j=1}^Le^{o_j}}

則有:\frac{?J}{?o_s}=\frac{?J}{?y_s}*\frac{?y_s}{?o_s}=\frac{?( - y_{rs}ln(y_s))}{?y_s}*\frac{?\frac{e^{o_s}}{∑_{j=1}^Le^{o_j}}}{?o_s}

根據(jù)?J和?y_s?和進一步化簡有:\frac{?( - y_{rs}ln(y_s))}{?y_s}=-y_{rs}*\frac{1}{y_s}

有:\frac{?\frac{e^{o_s}}{∑_{j=1}^Le^{o_j}}}{?o_s}=\frac{e^{o_s}*(∑_{j=1}^Le^{o_j}-e^{o_s})}{(∑_{j=1}^Le^{o_j})^2}

將上式帶入到原始的式子中篮条,有:

\frac{?J}{?o_s}=-y_{rs}*\frac{∑_{j=1}^Le^{o_j}}{e^{o_s}}*\frac{e^{o_s}*(∑_{j=1}^Le^{o_j}-e^{o_s})}{(∑_{j=1}^Le^{o_j})^2}=-y_{rs}*(1-y_s)

2) 當(dāng)i≠s的時候弟头,有:

J = - y_{rs}ln(y_s)

y_s = \frac{e^{o_s}}{∑_{j=1}^Le^{o_j}}

\frac{?J}{?o_i}=\frac{?J}{?y_s}*\frac{?y_s}{?o_i}=-y_{rs}*\frac{1}{y_s}*\frac{?y_s}{?o_i}

其中:\frac{?y_s}{?o_i}=\frac{-e^{o_s}*e^{o_i}}{(∑_{j=1}^Le^{o_j})^2}

帶入到原式子之后:\frac{?J}{?o_i}=-y_{rs}*\frac{∑_{j=1}^Le^{o_j}}{e^{o_s}}*\frac{-e^{o_s}*e^{o_i}}{(∑_{j=1}^Le^{o_j})^2}=y_{rs}*y_i


3) 最后,根據(jù)y_{rs}=1涉茧,y_{ri}=0

我們能夠發(fā)現(xiàn),上面兩種情況的計算結(jié)果可以化簡為:

當(dāng)i=s的時候赴恨,導(dǎo)數(shù)為y_s - y_{rs}

當(dāng)i≠s的時候,導(dǎo)數(shù)為y_i-y_{ri}

由此可以總結(jié)出:\frac{?J}{?o_i}=y_{i} - y_{ri}

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末伴栓,一起剝皮案震驚了整個濱河市伦连,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌钳垮,老刑警劉巖惑淳,帶你破解...
    沈念sama閱讀 218,682評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異饺窿,居然都是意外死亡歧焦,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,277評論 3 395
  • 文/潘曉璐 我一進店門短荐,熙熙樓的掌柜王于貴愁眉苦臉地迎上來倚舀,“玉大人,你說我怎么就攤上這事忍宋『勖玻” “怎么了?”我有些...
    開封第一講書人閱讀 165,083評論 0 355
  • 文/不壞的土叔 我叫張陵糠排,是天一觀的道長舵稠。 經(jīng)常有香客問我,道長,這世上最難降的妖魔是什么哺徊? 我笑而不...
    開封第一講書人閱讀 58,763評論 1 295
  • 正文 為了忘掉前任室琢,我火速辦了婚禮,結(jié)果婚禮上落追,老公的妹妹穿的比我還像新娘盈滴。我一直安慰自己,他們只是感情好轿钠,可當(dāng)我...
    茶點故事閱讀 67,785評論 6 392
  • 文/花漫 我一把揭開白布巢钓。 她就那樣靜靜地躺著,像睡著了一般疗垛。 火紅的嫁衣襯著肌膚如雪症汹。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,624評論 1 305
  • 那天贷腕,我揣著相機與錄音背镇,去河邊找鬼。 笑死泽裳,一個胖子當(dāng)著我的面吹牛瞒斩,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播诡壁,決...
    沈念sama閱讀 40,358評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼济瓢,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了妹卿?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,261評論 0 276
  • 序言:老撾萬榮一對情侶失蹤蔑鹦,失蹤者是張志新(化名)和其女友劉穎夺克,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體嚎朽,經(jīng)...
    沈念sama閱讀 45,722評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡铺纽,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,900評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了哟忍。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片狡门。...
    茶點故事閱讀 40,030評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖锅很,靈堂內(nèi)的尸體忽然破棺而出其馏,到底是詐尸還是另有隱情,我是刑警寧澤爆安,帶...
    沈念sama閱讀 35,737評論 5 346
  • 正文 年R本政府宣布叛复,位于F島的核電站,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏褐奥。R本人自食惡果不足惜咖耘,卻給世界環(huán)境...
    茶點故事閱讀 41,360評論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望撬码。 院中可真熱鬧儿倒,春花似錦、人聲如沸呜笑。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,941評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽蹈垢。三九已至慷吊,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間曹抬,已是汗流浹背溉瓶。 一陣腳步聲響...
    開封第一講書人閱讀 33,057評論 1 270
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留谤民,地道東北人堰酿。 一個月前我還...
    沈念sama閱讀 48,237評論 3 371
  • 正文 我出身青樓,卻偏偏與公主長得像张足,于是被迫代替她去往敵國和親触创。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,976評論 2 355