交叉熵的含義以及為什么可以用作損失函數(shù)

概念

熵的本質(zhì)是香農(nóng)信息量的期望。


香農(nóng)信息量

現(xiàn)有關(guān)于樣本集的2個(gè)概率分布p和q隔躲,其中p為真實(shí)分布穗泵,q非真實(shí)分布瓮孙。按照真實(shí)分布p來衡量識別一個(gè)樣本的所需要的編碼長度的期望(即平均編碼長度)為:H(p)=


H(p)

如果使用錯(cuò)誤分布q來表示來自真實(shí)分布p的平均編碼長度坊秸,則應(yīng)該是:H(p,q)=


H(p,q)

因?yàn)橛胵來編碼的樣本來自分布p麸祷,所以期望H(p,q)中概率是p(i)。H(p,q)我們稱之為“交叉熵”妇斤。

比如含有4個(gè)字母(A,B,C,D)的數(shù)據(jù)集中摇锋,真實(shí)分布p=(1/2, 1/2, 0, 0)丹拯,即A和B出現(xiàn)的概率均為1/2站超,C和D出現(xiàn)的概率都為0。計(jì)算H(p)為1乖酬,即只需要1位編碼即可識別A和B死相。如果使用分布Q=(1/4, 1/4, 1/4, 1/4)來編碼則得到H(p,q)=2,即需要2位編碼來識別A和B(當(dāng)然還有C和D咬像,盡管C和D并不會出現(xiàn)算撮,因?yàn)檎鎸?shí)分布p中C和D出現(xiàn)的概率為0,這里就欽定概率為0的事件不會發(fā)生啦)县昂。

可以看到上例中根據(jù)非真實(shí)分布q得到的平均編碼長度H(p,q)大于根據(jù)真實(shí)分布p得到的平均編碼長度H(p)肮柜。事實(shí)上,根據(jù)Gibbs' inequality可知倒彰,H(p,q)>=H(p)恒成立审洞,當(dāng)q為真實(shí)分布p時(shí)取等號。我們將由q得到的平均編碼長度比由p得到的平均編碼長度多出的bit數(shù)稱為“相對熵”:D(p||q)=H(p,q)-H(p)=

相對熵

其又被稱為KL散度(Kullback–Leibler divergence待讳,KLD) Kullback–Leibler divergence芒澜。它表示2個(gè)函數(shù)或概率分布的差異性:差異越大則相對熵越大,差異越小則相對熵越小创淡,特別地痴晦,若2者相同則熵為0。注意琳彩,KL散度的非對稱性誊酌。

為什么可以用作損失函數(shù)

交叉熵可在神經(jīng)網(wǎng)絡(luò)(機(jī)器學(xué)習(xí))中作為損失函數(shù)部凑,p表示真實(shí)標(biāo)記的分布,q則為訓(xùn)練后的模型的預(yù)測標(biāo)記分布碧浊,交叉熵?fù)p失函數(shù)可以衡量p與q的相似性砚尽。交叉熵作為損失函數(shù)還有一個(gè)好處是使用sigmoid函數(shù)在梯度下降時(shí)能避免均方誤差損失函數(shù)學(xué)習(xí)速率降低的問題,因?yàn)閷W(xué)習(xí)速率可以被輸出的誤差所控制辉词。

個(gè)人理解

把p(i)看作是真實(shí)的概率分布必孤,q(i)看作是預(yù)測的概率分布,如果把交叉熵作為loss函數(shù)瑞躺,當(dāng)我們最小化它時(shí)敷搪,可以使q(i)逐漸逼近p(i),也就達(dá)到了擬合的目的幢哨。

文章出處

作者:知乎用戶
鏈接:https://www.zhihu.com/question/41252833/answer/108777563
來源:知乎
著作權(quán)歸作者所有赡勘。商業(yè)轉(zhuǎn)載請聯(lián)系作者獲得授權(quán),非商業(yè)轉(zhuǎn)載請注明出處捞镰。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末闸与,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子岸售,更是在濱河造成了極大的恐慌践樱,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,277評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件凸丸,死亡現(xiàn)場離奇詭異拷邢,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)屎慢,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,689評論 3 393
  • 文/潘曉璐 我一進(jìn)店門瞭稼,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人腻惠,你說我怎么就攤上這事环肘。” “怎么了集灌?”我有些...
    開封第一講書人閱讀 163,624評論 0 353
  • 文/不壞的土叔 我叫張陵悔雹,是天一觀的道長。 經(jīng)常有香客問我绝页,道長荠商,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,356評論 1 293
  • 正文 為了忘掉前任续誉,我火速辦了婚禮莱没,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘酷鸦。我一直安慰自己饰躲,他們只是感情好牙咏,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,402評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著嘹裂,像睡著了一般妄壶。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上寄狼,一...
    開封第一講書人閱讀 51,292評論 1 301
  • 那天丁寄,我揣著相機(jī)與錄音,去河邊找鬼泊愧。 笑死伊磺,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的删咱。 我是一名探鬼主播屑埋,決...
    沈念sama閱讀 40,135評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼痰滋!你這毒婦竟也來了摘能?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,992評論 0 275
  • 序言:老撾萬榮一對情侶失蹤敲街,失蹤者是張志新(化名)和其女友劉穎团搞,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體聪富,經(jīng)...
    沈念sama閱讀 45,429評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡莺丑,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,636評論 3 334
  • 正文 我和宋清朗相戀三年著蟹,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了墩蔓。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,785評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡萧豆,死狀恐怖奸披,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情涮雷,我是刑警寧澤阵面,帶...
    沈念sama閱讀 35,492評論 5 345
  • 正文 年R本政府宣布,位于F島的核電站洪鸭,受9級特大地震影響样刷,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜览爵,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,092評論 3 328
  • 文/蒙蒙 一置鼻、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧蜓竹,春花似錦箕母、人聲如沸储藐。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,723評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽钙勃。三九已至,卻和暖如春聂喇,著一層夾襖步出監(jiān)牢的瞬間辖源,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,858評論 1 269
  • 我被黑心中介騙來泰國打工希太, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留同木,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,891評論 2 370
  • 正文 我出身青樓跛十,卻偏偏與公主長得像彤路,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子芥映,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,713評論 2 354

推薦閱讀更多精彩內(nèi)容