softmax

softmax

  • 公式

a_{j}^{L}=\frac{e^{z_{j}^{L}}}{\sum_{k} e^{z_{k}^{L}}}

? 其中持际,a_{j}^{L} 表示第L層(通常是最后一層)第j個神經(jīng)元的輸入开镣, {e^{z_{j}^{L}}} 表示第L層第j個神經(jīng)元的輸出,e 表示自然常數(shù)荚藻。注意看呻右, {\sum_{k} e^{z_{k}^{L}}} 表示了第L層所有神經(jīng)元的輸入之和。
? softmax函數(shù)最明顯的特點在于:它把每個神經(jīng)元的輸入占當(dāng)前層所有神經(jīng)元輸入之和的比值鞋喇,當(dāng)作該神經(jīng)元的輸出声滥。這樣把比較從絕對的大小變成了相對的大小,這使得輸出更容易被解釋:神經(jīng)元的輸出值越大落塑,則該神經(jīng)元對應(yīng)的類別是真實類別的可能性更高纽疟。
? 另外,softmax不僅把神經(jīng)元輸出構(gòu)造成概率分布憾赁,而且還起到了歸一化的作用污朽,適用于很多需要進行歸一化處理的分類問題。

  • softmax求導(dǎo)

?if j=i:

?\begin{aligned} \frac{\partial a_{j}}{\partial z_{i}} &=\frac{\partial}{\partial z_{i}}\left(\frac{e^{z_{j}}}{\sum_{k} e^{z_{k}}}\right) \\ &=\frac{\left(e^{z_{j}}\right)^{\prime} \cdot \sum_{k} e^{z_{k}}-e^{z_{j}} \cdot e^{z_{j}}}{\left(\sum_{k} e^{z_{k}}\right)^{2}} \\ &=\frac{e^{z_{j}}}{\sum_{k} e^{z_{k}}}-\frac{e^{z_{j}}}{\sum_{k} e^{z_{k}}} \cdot \frac{e^{z_{j}}}{\sum_{k} e^{z_{k}}} =a_{j}\left(1-a_{j}\right) \end{aligned}

?if j \neq i

?\begin{aligned} \frac{\partial a_{j}}{\partial z_{i}} &=\frac{\partial}{\partial z_{i}}\left(\frac{e^{z_{j}}}{\sum_{k} e^{z_{k}}}\right) \\ &=\frac{0 \cdot \sum_{k} e^{z_{k}}-e^{z_{j}} \cdot e^{z_{i}}}{\left(\sum_{k} e^{z_{k}}\right)^{2}} \\ &=-\frac{e^{z_{j}}}{\sum_{k} e^{z_{k}}} \cdot \frac{e^{z_{i}}}{\sum_{k} e^{z_{k}}} = -a_{j} a_{i} \end{aligned}

  • 代價函數(shù)

?二次代價函數(shù)在訓(xùn)練ANN時可能會導(dǎo)致訓(xùn)練速度變慢的問題龙考。那就是蟆肆,初始的輸出值離真實值越遠(yuǎn),訓(xùn)練速度就越慢晦款。這個問題可以通過采用交叉熵代價函數(shù)來解決炎功。其實,這個問題也可以采用另外一種方法解決缓溅,那就是采用softmax激活函數(shù)蛇损,并采用log似然代價函數(shù)(log-likelihood cost function)來解決。

? C=-\sum_{k} y_{k} \log a_{k}

其中坛怪,\log a_{k} 表示第k個神經(jīng)元的輸出值淤齐,y_{k} 表示第k個神經(jīng)元對應(yīng)的真實值,取值為0或1袜匿。我們來簡單理解一下這個代價函數(shù)的含義更啄。在ANN中輸入一個樣本,那么只有一個神經(jīng)元對應(yīng)了該樣本的正確類別居灯;若這個神經(jīng)元輸出的概率值越高祭务,則按照以上的代價函數(shù)公式,其產(chǎn)生的代價就越心潞尽待牵;反之其屏,則產(chǎn)生的代價就越高喇勋。以b為例來偏導(dǎo):

\begin{aligned} \frac{\partial C}{\partial b_{j}} &=\frac{\partial C}{\partial z_{j}} \cdot \frac{\partial z_{j}}{\partial b_{j}} \\ &=\frac{\partial C}{\partial z_{j}} \cdot \frac{\partial\left(w_{j k} a_{k}+b_{j}\right)}{\partial b_{j}} \\ &=\frac{\partial}{\partial z_{j}}\left(-\sum_{k} y_{k} \log a_{k}\right) \\ &=-\sum_{k} y_{k} \frac{1}{a_{k}} \cdot \frac{\partial a_{k}}{\partial z_{j}} \end{aligned}

(use softmax derivative)
=-y_{j} \frac{1}{a_{j}} \cdot \frac{\partial a_{j}}{\partial z_{j}}-\sum_{k \neq j} y_{k} \frac{1}{a_{k}} \cdot \frac{\partial a_{k}}{\partial z_{j}}

=-y_{j} \frac{1}{a_{j}} \cdot a_{j}\left(1-a_{j}\right)-\sum_{k \neq j} y_{k} \frac{1}{a_{k}} \cdot\left(-a_{j} a_{k}\right)

=-y_{j}+y_{j} a_{j}+\sum_{k \neq j} y_{k} a_{j}

=-y_{j}+a_{j} \sum_{k} y_{k}

=a_{j}-y_{j}

同理可得\frac{\partial C}{\partial w_{jk}} = {a_{K}^{L-1}}(a_{j}^{L}-y_{j})

?從上述梯度公式可知,softmax函數(shù)配合log似然代價函數(shù)可以很好地訓(xùn)練ANN偎行,不存在學(xué)習(xí)速度變慢的問題川背。

  • 本文參考

?_ 鴻 的博客

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市蛤袒,隨后出現(xiàn)的幾起案子熄云,更是在濱河造成了極大的恐慌,老刑警劉巖妙真,帶你破解...
    沈念sama閱讀 211,348評論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件缴允,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機练般,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,122評論 2 385
  • 文/潘曉璐 我一進店門矗漾,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人薄料,你說我怎么就攤上這事敞贡。” “怎么了摄职?”我有些...
    開封第一講書人閱讀 156,936評論 0 347
  • 文/不壞的土叔 我叫張陵誊役,是天一觀的道長。 經(jīng)常有香客問我谷市,道長蛔垢,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,427評論 1 283
  • 正文 為了忘掉前任歌懒,我火速辦了婚禮啦桌,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘及皂。我一直安慰自己甫男,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 65,467評論 6 385
  • 文/花漫 我一把揭開白布验烧。 她就那樣靜靜地躺著板驳,像睡著了一般。 火紅的嫁衣襯著肌膚如雪碍拆。 梳的紋絲不亂的頭發(fā)上若治,一...
    開封第一講書人閱讀 49,785評論 1 290
  • 那天,我揣著相機與錄音感混,去河邊找鬼端幼。 笑死,一個胖子當(dāng)著我的面吹牛弧满,可吹牛的內(nèi)容都是我干的婆跑。 我是一名探鬼主播,決...
    沈念sama閱讀 38,931評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼庭呜,長吁一口氣:“原來是場噩夢啊……” “哼滑进!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起募谎,我...
    開封第一講書人閱讀 37,696評論 0 266
  • 序言:老撾萬榮一對情侶失蹤扶关,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后数冬,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體节槐,經(jīng)...
    沈念sama閱讀 44,141評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,483評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了铜异。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片地来。...
    茶點故事閱讀 38,625評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖熙掺,靈堂內(nèi)的尸體忽然破棺而出未斑,到底是詐尸還是另有隱情,我是刑警寧澤币绩,帶...
    沈念sama閱讀 34,291評論 4 329
  • 正文 年R本政府宣布蜡秽,位于F島的核電站,受9級特大地震影響缆镣,放射性物質(zhì)發(fā)生泄漏芽突。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,892評論 3 312
  • 文/蒙蒙 一董瞻、第九天 我趴在偏房一處隱蔽的房頂上張望寞蚌。 院中可真熱鬧,春花似錦钠糊、人聲如沸挟秤。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,741評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽艘刚。三九已至,卻和暖如春截珍,著一層夾襖步出監(jiān)牢的瞬間攀甚,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,977評論 1 265
  • 我被黑心中介騙來泰國打工岗喉, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留秋度,地道東北人。 一個月前我還...
    沈念sama閱讀 46,324評論 2 360
  • 正文 我出身青樓钱床,卻偏偏與公主長得像荚斯,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子诞丽,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,492評論 2 348