交叉熵

1.信息量

信息量與事件發(fā)生的概率成反比逼蒙。
如:
事件1:明天太陽正常升起。該事件發(fā)生的概率P=1,因此信息量為0是牢。
事件2:天氣預(yù)報(bào)說明天要下雨僵井。本來我們不知道明天天氣,但是通過這句話消除了部分不確定性驳棱,因此它具有一定的信息量批什。

信息量的計(jì)算:
I(x)=-log(P(x))
其中I(x)表示信息量,log表示以e為底社搅。

2.信息熵

信息熵是所有信息量的期望驻债。
H(X)=\sum\limits_{i=1}^nP(x_i)*I(x_i)=-\sum\limits_{i=1}^nP(x_i)*log(P(x_i))

事件序號(hào) 事件 概率 信息量
1 明天下雨 0.6 -log(0.6)
2 明天不下雨 0.4 -log(0.4)

H(X)=-P(x)log(P(x))-(1-P(x))*log(1-P(x))
=-0.6*log(0.6)-0.4*log(0.4)

3.相對(duì)熵(KL熵)

衡量同一變量在不同概率分布上的差異。比如隨機(jī)變量X在測(cè)試集上的概率分布為P(x),驗(yàn)證集上的概率分布為Q(x),相對(duì)熵計(jì)算公式為:
D_{KL}(p||q)=\sum\limits_{i=1}^np(x_i)log(\frac{p(x_i)}{q(x_i)})

例如機(jī)器學(xué)習(xí)的分類問題:

事件序號(hào) 事件 預(yù)測(cè)概率 實(shí)際情況
1 明天下雨 0.6 1
2 明天不下雨 0.4 0

D_{KL}(p||q)=1*log(\frac{1}{0.6})+0*log(\frac{0}{0.6})
=1*log(\frac{1}{0.6})

4.交叉熵

拆分KL散度公式:
D_{KL}(p||q)=\sum\limits_{i=1}^np(x_i)log(\frac{p(x_i)}{q(x_i)})
=\sum\limits_{i=1}^np(x_i)log(p(x_i))-\sum\limits_{i=1}^np(x_i)log(q(x_i))
=-H(p(x))+[\sum\limits_{i=1}^np(x_i)log(q(x_i))]

H(p(x))即信息熵形葬,后者為交叉熵合呐。KL散度=信息熵-交叉熵。交叉熵公式為:
H(p,q)=-\sum\limits_{i=1}^np(x_i)log(q(x_i))

在機(jī)器學(xué)習(xí)訓(xùn)練網(wǎng)絡(luò)時(shí)笙以,輸入數(shù)據(jù)與標(biāo)簽常常已經(jīng)確定淌实,那么真實(shí)概率分布P(x) 也就確定下來了,所以信息熵在這里就是一個(gè)常量猖腕。
由于KL散度的值表示真實(shí)概率分布P(x) 與預(yù)測(cè)概率分布Q(x) 之間的差異拆祈,值越小表示預(yù)測(cè)的結(jié)果越好,所以需要最小化KL散度倘感,而交叉熵等于KL散度加上一個(gè)常量(信息熵)放坏,且公式相比KL散度更加容易計(jì)算,所以在機(jī)器學(xué)習(xí)中常常使用交叉熵?fù)p失函數(shù)來計(jì)算loss就行了老玛。

事件序號(hào) 事件 預(yù)測(cè)概率 實(shí)際情況
1 明天下雨 0.6 1
2 明天不下雨 0.4 0

loss=-1*log(0.6)-0*log(0.4)=-log(0.6)

交叉熵在分類問題中常常與softmax是標(biāo)配淤年,softmax將輸出的結(jié)果進(jìn)行處理,使其多個(gè)分類的預(yù)測(cè)值和為1蜡豹,再通過交叉熵來計(jì)算損失麸粮。

參考:https://blog.csdn.net/b1055077005/article/details/100152102

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市余素,隨后出現(xiàn)的幾起案子豹休,更是在濱河造成了極大的恐慌,老刑警劉巖桨吊,帶你破解...
    沈念sama閱讀 212,816評(píng)論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件威根,死亡現(xiàn)場離奇詭異,居然都是意外死亡视乐,警方通過查閱死者的電腦和手機(jī)洛搀,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,729評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來佑淀,“玉大人留美,你說我怎么就攤上這事。” “怎么了谎砾?”我有些...
    開封第一講書人閱讀 158,300評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵逢倍,是天一觀的道長。 經(jīng)常有香客問我景图,道長较雕,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,780評(píng)論 1 285
  • 正文 為了忘掉前任挚币,我火速辦了婚禮亮蒋,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘妆毕。我一直安慰自己慎玖,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,890評(píng)論 6 385
  • 文/花漫 我一把揭開白布笛粘。 她就那樣靜靜地躺著趁怔,像睡著了一般。 火紅的嫁衣襯著肌膚如雪闰蛔。 梳的紋絲不亂的頭發(fā)上痕钢,一...
    開封第一講書人閱讀 50,084評(píng)論 1 291
  • 那天图柏,我揣著相機(jī)與錄音序六,去河邊找鬼。 笑死蚤吹,一個(gè)胖子當(dāng)著我的面吹牛例诀,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播裁着,決...
    沈念sama閱讀 39,151評(píng)論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼繁涂,長吁一口氣:“原來是場噩夢(mèng)啊……” “哼!你這毒婦竟也來了二驰?” 一聲冷哼從身側(cè)響起扔罪,我...
    開封第一講書人閱讀 37,912評(píng)論 0 268
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎桶雀,沒想到半個(gè)月后矿酵,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,355評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡矗积,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,666評(píng)論 2 327
  • 正文 我和宋清朗相戀三年全肮,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片棘捣。...
    茶點(diǎn)故事閱讀 38,809評(píng)論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡辜腺,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情评疗,我是刑警寧澤测砂,帶...
    沈念sama閱讀 34,504評(píng)論 4 334
  • 正文 年R本政府宣布,位于F島的核電站百匆,受9級(jí)特大地震影響邑彪,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜胧华,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,150評(píng)論 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望矩动。 院中可真熱鬧有巧,春花似錦、人聲如沸悲没。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,882評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽示姿。三九已至甜橱,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間栈戳,已是汗流浹背岂傲。 一陣腳步聲響...
    開封第一講書人閱讀 32,121評(píng)論 1 267
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留子檀,地道東北人镊掖。 一個(gè)月前我還...
    沈念sama閱讀 46,628評(píng)論 2 362
  • 正文 我出身青樓,卻偏偏與公主長得像褂痰,于是被迫代替她去往敵國和親亩进。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,724評(píng)論 2 351

推薦閱讀更多精彩內(nèi)容