損失函數(shù)之交叉熵

一馏臭、交叉熵的由來

  1. 信息量
    香農(nóng)提出的“信息熵”, 是用來解決信息量化問題讼稚。信息的不確定性越強括儒, 需要用來表達的數(shù)據(jù)量也就越多。事件的不確定性通常是概率分布P來表示锐想, 所以信息的量化也是通過概率來實現(xiàn)帮寻。
    信息量的計算公式如下:


    信息量

2.熵
用來表示所有信息量的期望值,表示樣本概率分布P赠摇,表達這些樣本所需的最小編碼長度:


  1. 交叉熵
    假設(shè)現(xiàn)在有一個樣本集中兩個概率分布p,q规婆,其中p為真實分布,q為非真實分布蝉稳。假如抒蚜,按照真實分布p來衡量表達一個樣本所需要的編碼長度的期望為:
交叉熵公式

4.相對熵或KL散列
類似于交叉熵,有兩個概率分布p,q耘戚,其中p為真實分布嗡髓,q為非真實分布,表達兩個分布之間的相對熵概率收津,計算公式如下:


相對熵

接下來饿这, 我們推到分析下相對熵、熵以及交叉熵之間的關(guān)系:


相對熵撞秋、熵與交叉熵之間關(guān)系

上面公式中第一部分是熵的計算长捧, 第二部分是交叉熵(實際差一個負號,不影響比較暫時忽略)吻贿。簡單概括:相對熵等于交叉熵減去熵(注意負號)串结,物理含義是相對熵表達信息比熵需多出的編碼長度。重點:如果p(x)的分布接近q(x)舅列, 相對熵接近于0.
通過上面的分析可知:相對熵是非常適合作為機器學習和深度學習領(lǐng)域目標優(yōu)化的評估指標(主要是分類場景)肌割,p(x)作為訓練樣本的真實分布, q(x)表示訓練出模型預(yù)測樣本的分布帐要,模型訓練的目標量化是讓模型預(yù)測樣本的分布盡量接近訓練樣本的真實分布把敞。
如果訓練的樣本已經(jīng)確定,概率分布也就確定榨惠,上面公式第一部分是固定的奋早,優(yōu)化的目標可以集中在第二部分盛霎, 也就是交叉熵部分,讓交叉熵的值盡量的小耽装。

二摩渺、交叉熵的使用場景
交叉熵可在神經(jīng)網(wǎng)絡(luò)(機器學習)中作為損失函數(shù),p表示真實標記的分布剂邮,q則為訓練后的模型的預(yù)測標記分布摇幻,交叉熵損失函數(shù)可以衡量p與q的相似性。交叉熵作為損失函數(shù)還有一個好處是使用sigmoid函數(shù)在梯度下降時能避免均方誤差損失函數(shù)學習速率降低的問題挥萌,因為學習速率可以被輸出的誤差所控制绰姻。

在特征工程中,可以用來衡量兩個隨機變量之間的相似度引瀑。

在語言模型中(NLP)中狂芋,由于真實的分布p是未知的,在語言模型中憨栽,模型是通過訓練集得到的帜矾,交叉熵就是衡量這個模型在測試集上的正確率。

【參考文章】
詳解機器學習中的熵屑柔、條件熵屡萤、相對熵和交叉熵 https://www.cnblogs.com/kyrieng/p/8694705.html
一文搞懂交叉熵在機器學習中的使用,透徹理解交叉熵背后的直覺https://blog.csdn.net/tsyccnh/article/details/79163834

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末掸宛,一起剝皮案震驚了整個濱河市死陆,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌唧瘾,老刑警劉巖措译,帶你破解...
    沈念sama閱讀 221,635評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異饰序,居然都是意外死亡领虹,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,543評論 3 399
  • 文/潘曉璐 我一進店門求豫,熙熙樓的掌柜王于貴愁眉苦臉地迎上來塌衰,“玉大人,你說我怎么就攤上這事注祖』伲” “怎么了?”我有些...
    開封第一講書人閱讀 168,083評論 0 360
  • 文/不壞的土叔 我叫張陵是晨,是天一觀的道長。 經(jīng)常有香客問我舔箭,道長罩缴,這世上最難降的妖魔是什么蚊逢? 我笑而不...
    開封第一講書人閱讀 59,640評論 1 296
  • 正文 為了忘掉前任,我火速辦了婚禮箫章,結(jié)果婚禮上烙荷,老公的妹妹穿的比我還像新娘。我一直安慰自己檬寂,他們只是感情好终抽,可當我...
    茶點故事閱讀 68,640評論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著桶至,像睡著了一般昼伴。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上镣屹,一...
    開封第一講書人閱讀 52,262評論 1 308
  • 那天圃郊,我揣著相機與錄音,去河邊找鬼女蜈。 笑死持舆,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的伪窖。 我是一名探鬼主播逸寓,決...
    沈念sama閱讀 40,833評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼覆山!你這毒婦竟也來了席覆?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,736評論 0 276
  • 序言:老撾萬榮一對情侶失蹤汹买,失蹤者是張志新(化名)和其女友劉穎佩伤,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體晦毙,經(jīng)...
    沈念sama閱讀 46,280評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡生巡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,369評論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了见妒。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片孤荣。...
    茶點故事閱讀 40,503評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖须揣,靈堂內(nèi)的尸體忽然破棺而出盐股,到底是詐尸還是另有隱情,我是刑警寧澤耻卡,帶...
    沈念sama閱讀 36,185評論 5 350
  • 正文 年R本政府宣布疯汁,位于F島的核電站,受9級特大地震影響卵酪,放射性物質(zhì)發(fā)生泄漏幌蚊。R本人自食惡果不足惜谤碳,卻給世界環(huán)境...
    茶點故事閱讀 41,870評論 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望溢豆。 院中可真熱鬧蜒简,春花似錦、人聲如沸漩仙。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,340評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽队他。三九已至卷仑,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間漱挎,已是汗流浹背系枪。 一陣腳步聲響...
    開封第一講書人閱讀 33,460評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留磕谅,地道東北人私爷。 一個月前我還...
    沈念sama閱讀 48,909評論 3 376
  • 正文 我出身青樓,卻偏偏與公主長得像膊夹,于是被迫代替她去往敵國和親衬浑。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,512評論 2 359

推薦閱讀更多精彩內(nèi)容