softmax函數(shù)與交叉熵函數(shù)詳解

一驴党、二分類(lèi)以上的任務(wù)與二分類(lèi)任務(wù)在網(wǎng)絡(luò)結(jié)構(gòu)上的區(qū)別:

在邏輯回歸模型中跪楞,模型最終輸出的是樣本屬于正例的概率p刨啸,用1-p表示反例的概率堡赔,該模型在輸出端具有單個(gè)輸出結(jié)點(diǎn)。那么设联,對(duì)于多分類(lèi)任務(wù)善已,輸出端可以有多個(gè)結(jié)點(diǎn)灼捂,每個(gè)結(jié)點(diǎn)代表屬于某一類(lèi)的概率,滿(mǎn)足約束條件:所有結(jié)點(diǎn)的概率和為1换团。這個(gè)約束條件將輸出結(jié)點(diǎn)的輸出值變成一個(gè)概率分布悉稠。【概率分布用于表述隨機(jī)變量取值的概率規(guī)律艘包,隨機(jī)事件的所有可能值(隨機(jī)變量)+對(duì)應(yīng)的概率值的猛,稱(chēng)為該事件的概率分布】


二、 softmax函數(shù)的使用

由一可知想虎,多結(jié)點(diǎn)完成多分類(lèi)任務(wù)需要滿(mǎn)足的約束條件是:每個(gè)結(jié)點(diǎn)輸出值范圍是[0,1] & 所有結(jié)點(diǎn)輸出值的和等于1卦尊。

能夠滿(mǎn)足這個(gè)約束要求的函數(shù)就是softmax函數(shù)。softmax常作為最后一層的激活函數(shù)使用舌厨。

softmax包含兩部分:soft和max(求數(shù)據(jù)的最大值),與soft相對(duì)的就是hard岂却,hardmax的作用就是直接計(jì)算出數(shù)據(jù)的最大值(唯一性)。softmax會(huì)為每個(gè)類(lèi)別計(jì)算出一個(gè)概率值

softmax的計(jì)算原理:

softmax函數(shù)表達(dá)式:

單一節(jié)點(diǎn)輸出結(jié)果與所有節(jié)點(diǎn)輸出結(jié)果的比值裙椭,計(jì)算出每個(gè)節(jié)點(diǎn)輸出值所占的比例值躏哩。

對(duì)softmax的求導(dǎo):( 對(duì)每個(gè)輸出結(jié)點(diǎn)求偏導(dǎo))

分兩種情況:i=j 與 i≠j? ,求偏導(dǎo)推導(dǎo)過(guò)程如下:


交叉熵?fù)p失函數(shù)與softmax之間的關(guān)系

在執(zhí)行多分類(lèi)任務(wù)中骇陈,經(jīng)常是使用softmax激活函數(shù)和交叉熵?fù)p失函數(shù)的搭配方式震庭。因?yàn)榻徊骒孛枋隽藘蓚€(gè)概率分布的差異,然而神經(jīng)網(wǎng)絡(luò)輸出的是向量你雌,所以需要softmax激活函數(shù)先將一個(gè)向量進(jìn)行’歸一化‘成概率分布的形式器联,然后再采用交叉熵?fù)p失函數(shù)對(duì)計(jì)算最終的loss。

softmax損失函數(shù)? 重點(diǎn):假設(shè)此時(shí)第i個(gè)輸出節(jié)點(diǎn)為正確類(lèi)別對(duì)應(yīng)的輸出節(jié)點(diǎn)婿崭,則p_{i} 是正確類(lèi)別對(duì)應(yīng)輸出節(jié)點(diǎn)的概率值拨拓,對(duì)p_{i} 添加log運(yùn)算,不影響函數(shù)的單調(diào)性氓栈,我們期望p_{i} 的值越大越好(小于1),通常情況下使用梯度下降法來(lái)迭代求解渣磷,因此只需要為\lg p_{i}  添加一個(gè)負(fù)號(hào)就變成損失函數(shù)。現(xiàn)在授瘦,希望該損失函數(shù)越小越好醋界。所以,softmax的損失函數(shù)式子為:

記為式子(1)

交叉熵?fù)p失函數(shù)與softmax損失函數(shù)的轉(zhuǎn)換關(guān)系:

softmax損失函數(shù)是只針對(duì)正確類(lèi)別對(duì)應(yīng)的輸出節(jié)點(diǎn)提完,將這個(gè)節(jié)點(diǎn)的softmax值最大化形纺;而交叉熵?fù)p失函數(shù)是直接衡量真實(shí)分布和實(shí)際輸出的分布之間的距離。

交叉熵式子:L = -\sum_{c=1}^C y_{c}  \log p_{c}  ,?y_{c} 代表真實(shí)樣本的標(biāo)簽值徒欣。? (2)

在分類(lèi)任務(wù)中逐样,樣本的真實(shí)標(biāo)簽通常表示為one-hot形式,比如三分類(lèi),第三個(gè)類(lèi)別表示為[0,0,1]脂新,僅正確類(lèi)別的位置為1挪捕,其他位置都為0,將[0,0,1]代入式子(2),最終結(jié)果為L = -1 * \log (p_{2} ) 争便。再對(duì)照式子(1),可以愉快的發(fā)現(xiàn)级零,(1)和(2)最終表達(dá)形式是一樣的,那么始花,接下來(lái)計(jì)算損失函數(shù)的導(dǎo)數(shù)使用大家常見(jiàn)的式子(2),接下來(lái)將推導(dǎo)這個(gè)最終損失函數(shù)L對(duì)網(wǎng)絡(luò)輸出變量z_{i} 的偏導(dǎo)數(shù):

交叉熵?fù)p失函數(shù)對(duì)輸出節(jié)點(diǎn)的偏導(dǎo)數(shù)等于該節(jié)點(diǎn)概率與該節(jié)點(diǎn)標(biāo)簽值之差妄讯。按照這個(gè)式子得到每個(gè)輸出節(jié)點(diǎn)的梯度值,從而對(duì)原節(jié)點(diǎn)輸出值進(jìn)行更新酷宵。

模擬一個(gè)三分類(lèi)使用softmax與交叉熵的結(jié)果:

第一行亥贸,是每個(gè)節(jié)點(diǎn)的輸出值,第二行浇垦,是經(jīng)過(guò)softmax之后的節(jié)點(diǎn)輸出值(概率值)炕置,第三行,是每個(gè)節(jié)點(diǎn)對(duì)應(yīng)的真實(shí)標(biāo)簽值男韧,第四行朴摊,代入交叉熵公式,-y_{2} \log(p_{2} ),y_{2} =1,p_{2} = 0.2689,也就是計(jì)算出的loss值此虑,第五行甚纲,是交叉熵?fù)p失函數(shù)對(duì)每個(gè)節(jié)點(diǎn)求偏導(dǎo)的結(jié)果(根據(jù)p_{i}  - y_{i} 公式計(jì)算)‘,第六行朦前,是根據(jù)計(jì)算的梯度值對(duì)每個(gè)節(jié)點(diǎn)的原始輸出值進(jìn)行更新介杆,?最后結(jié)果可以記為’推所有拉一個(gè)。后續(xù)就是循環(huán)計(jì)算韭寸。直至最終得到的loss值最小春哨。

softmax+交叉熵?fù)p失函數(shù)對(duì)參數(shù)的更新規(guī)則,可以分為兩步來(lái)記恩伺,第一步:每個(gè)節(jié)點(diǎn)的值減去對(duì)應(yīng)的softmax結(jié)果赴背;第二步,將真正類(lèi)別的輸出節(jié)點(diǎn)處的值加一晶渠。

參考以下文章:

多分類(lèi)問(wèn)題的交叉熵? ? ?一文詳解softmax函數(shù)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末凰荚,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子褒脯,更是在濱河造成了極大的恐慌浇揩,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,744評(píng)論 6 502
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件憨颠,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)爽彤,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,505評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門(mén)养盗,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人适篙,你說(shuō)我怎么就攤上這事往核。” “怎么了嚷节?”我有些...
    開(kāi)封第一講書(shū)人閱讀 163,105評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵聂儒,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我硫痰,道長(zhǎng)衩婚,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,242評(píng)論 1 292
  • 正文 為了忘掉前任效斑,我火速辦了婚禮非春,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘缓屠。我一直安慰自己奇昙,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,269評(píng)論 6 389
  • 文/花漫 我一把揭開(kāi)白布敌完。 她就那樣靜靜地躺著储耐,像睡著了一般。 火紅的嫁衣襯著肌膚如雪滨溉。 梳的紋絲不亂的頭發(fā)上什湘,一...
    開(kāi)封第一講書(shū)人閱讀 51,215評(píng)論 1 299
  • 那天,我揣著相機(jī)與錄音业踏,去河邊找鬼禽炬。 笑死,一個(gè)胖子當(dāng)著我的面吹牛勤家,可吹牛的內(nèi)容都是我干的腹尖。 我是一名探鬼主播,決...
    沈念sama閱讀 40,096評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼伐脖,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼热幔!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起讼庇,我...
    開(kāi)封第一講書(shū)人閱讀 38,939評(píng)論 0 274
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤绎巨,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后蠕啄,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體场勤,經(jīng)...
    沈念sama閱讀 45,354評(píng)論 1 311
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡戈锻,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,573評(píng)論 2 333
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了和媳。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片格遭。...
    茶點(diǎn)故事閱讀 39,745評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖留瞳,靈堂內(nèi)的尸體忽然破棺而出拒迅,到底是詐尸還是另有隱情,我是刑警寧澤她倘,帶...
    沈念sama閱讀 35,448評(píng)論 5 344
  • 正文 年R本政府宣布璧微,位于F島的核電站,受9級(jí)特大地震影響硬梁,放射性物質(zhì)發(fā)生泄漏前硫。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,048評(píng)論 3 327
  • 文/蒙蒙 一靶溜、第九天 我趴在偏房一處隱蔽的房頂上張望开瞭。 院中可真熱鬧,春花似錦罩息、人聲如沸嗤详。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,683評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)葱色。三九已至,卻和暖如春娘香,著一層夾襖步出監(jiān)牢的瞬間苍狰,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,838評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工烘绽, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留淋昭,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,776評(píng)論 2 369
  • 正文 我出身青樓安接,卻偏偏與公主長(zhǎng)得像翔忽,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子盏檐,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,652評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容