淺談交叉熵

一:定義

交叉熵(cross entropy)是深度學(xué)習(xí)中常用的一個(gè)概念带射,一般用來(lái)求目標(biāo)與預(yù)測(cè)值之間的差距丹墨。交叉熵是信息論中的一個(gè)概念,要想了解交叉熵的本質(zhì)璃谨,需要先從最基本的概念講起匠璧。

假設(shè)XX是一個(gè)離散型隨機(jī)變量桐款,其取值集合為χχ,概率分布函數(shù)p(x)=Pr(X=x),x∈χp(x)=Pr(X=x),x∈χ,則定義事件X=x0X=x0的信息量為:
image.png

由于是概率所以p(x0)的取值范圍是[0,1],繪制為圖形如下:可見(jiàn)該函數(shù)符合我們對(duì)信息量的直覺(jué)


image.png

1.1熵

另一個(gè)問(wèn)題,對(duì)于某個(gè)事件夷恍,有n種可能性厘擂,每一種可能性都有一個(gè)概率p(xi)察蹲,這樣就可以計(jì)算出某一種可能性的信息量寂嘉。舉一個(gè)例子贡耽,假設(shè)你拿出了你的電腦,按下開(kāi)關(guān)指黎,會(huì)有三種可能性朋凉,下表列出了每一種可能的概率及其對(duì)應(yīng)的信息量。


image.png

現(xiàn)在有了信息量的定義醋安,而熵用來(lái)表示所有信息量的期望杂彭,即:
image.png

其中n代表所有的n種可能性墓毒,所以上面的問(wèn)題結(jié)果就是
image.png

然而有一類(lèi)比較特殊的問(wèn)題,比如投擲硬幣只有兩種可能亲怠,字朝上或花朝上所计。買(mǎi)彩票只有兩種可能,中獎(jiǎng)或不中獎(jiǎng)团秽。我們稱之為0-1分布問(wèn)題(二項(xiàng)分布的特例)主胧,對(duì)于這類(lèi)問(wèn)題,熵的計(jì)算方法可以簡(jiǎn)化為如下算式:


image.png

1.2:相對(duì)熵

相對(duì)熵又稱KL散度,如果我們對(duì)于同一個(gè)隨機(jī)變量 x 有兩個(gè)單獨(dú)的概率分布 P(x) 和 Q(x)习勤,我們可以使用 KL 散度(Kullback-Leibler (KL) divergence)來(lái)衡量這兩個(gè)分布的差異.

維基百科定義:In the context of machine learning, DKL(P‖Q) is often called the information gain achieved if P is used instead of Q.
即如果用P來(lái)描述目標(biāo)問(wèn)題踪栋,而不是用Q來(lái)描述目標(biāo)問(wèn)題,得到的信息增量图毕。

在機(jī)器學(xué)習(xí)中己英,P往往用來(lái)表示樣本的真實(shí)分布,比如[1,0,0]表示當(dāng)前樣本屬于第一類(lèi)吴旋。Q用來(lái)表示模型所預(yù)測(cè)的分布,比如[0.7,0.2,0.1] 厢破。直觀的理解就是如果用P來(lái)描述樣本荣瑟,那么就非常完美,而用Q來(lái)描述樣本,雖然可以大致描述摩泪,但是不是那么的完美笆焰,信息量不足,需要額外的一些“信息增量”才能達(dá)到和P一樣完美的描述见坑。如果我們的Q通過(guò)反復(fù)訓(xùn)練嚷掠,也能完美的描述樣本,那么就不再需要額外的“信息增量”荞驴,Q等價(jià)于P不皆。
KL散度的計(jì)算公式:


image.png

n為事件的所有可能性,DKL的值越小,表示q分布和p分布越接近熊楼。

1.3 交叉熵

由上面公式可以推出:


image.png

等式的前一部分恰巧就是p的熵霹娄,等式的后一部分,就是交叉熵:

image.png

在機(jī)器學(xué)習(xí)中鲫骗,我們需要評(píng)估label和predicts之間的差距犬耻,使用KL散度剛剛好,即DKL(y||y^)执泰,由于KL散度中的前一部分?H(y)不變枕磁,故在優(yōu)化過(guò)程中,只需要關(guān)注交叉熵就可以了术吝。
所以一般在機(jī)器學(xué)習(xí)中直接用用交叉熵做loss计济,評(píng)估模型茸苇。

二:交叉熵的應(yīng)用

三:總結(jié)

3.1 參考

https://www.zhihu.com/question/65288314/answer/244557337
https://en.wikipedia.org/wiki/Kullback%E2%80%93Leibler_divergence
https://jamesmccaffrey.wordpress.com/2013/11/05/why-you-should-use-cross-entropy-error-instead-of-classification-error-or-mean-squared-error-for-neural-network-classifier-training/
https://www.zhihu.com/question/41252833/answer/195901726

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市峭咒,隨后出現(xiàn)的幾起案子税弃,更是在濱河造成了極大的恐慌,老刑警劉巖凑队,帶你破解...
    沈念sama閱讀 206,839評(píng)論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件则果,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡漩氨,警方通過(guò)查閱死者的電腦和手機(jī)西壮,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)叫惊,“玉大人款青,你說(shuō)我怎么就攤上這事』粽” “怎么了抡草?”我有些...
    開(kāi)封第一講書(shū)人閱讀 153,116評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)蔗坯。 經(jīng)常有香客問(wèn)我康震,道長(zhǎng),這世上最難降的妖魔是什么宾濒? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 55,371評(píng)論 1 279
  • 正文 為了忘掉前任腿短,我火速辦了婚禮,結(jié)果婚禮上绘梦,老公的妹妹穿的比我還像新娘橘忱。我一直安慰自己,他們只是感情好卸奉,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,384評(píng)論 5 374
  • 文/花漫 我一把揭開(kāi)白布钝诚。 她就那樣靜靜地躺著,像睡著了一般择卦。 火紅的嫁衣襯著肌膚如雪敲长。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 49,111評(píng)論 1 285
  • 那天秉继,我揣著相機(jī)與錄音祈噪,去河邊找鬼。 笑死尚辑,一個(gè)胖子當(dāng)著我的面吹牛辑鲤,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播杠茬,決...
    沈念sama閱讀 38,416評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼月褥,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼弛随!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起宁赤,我...
    開(kāi)封第一講書(shū)人閱讀 37,053評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤舀透,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后决左,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體愕够,經(jīng)...
    沈念sama閱讀 43,558評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,007評(píng)論 2 325
  • 正文 我和宋清朗相戀三年佛猛,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了惑芭。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,117評(píng)論 1 334
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡继找,死狀恐怖遂跟,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情婴渡,我是刑警寧澤幻锁,帶...
    沈念sama閱讀 33,756評(píng)論 4 324
  • 正文 年R本政府宣布,位于F島的核電站边臼,受9級(jí)特大地震影響越败,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜硼瓣,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,324評(píng)論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望置谦。 院中可真熱鬧堂鲤,春花似錦、人聲如沸媒峡。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,315評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)谅阿。三九已至半哟,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間签餐,已是汗流浹背寓涨。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,539評(píng)論 1 262
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留氯檐,地道東北人戒良。 一個(gè)月前我還...
    沈念sama閱讀 45,578評(píng)論 2 355
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像冠摄,于是被迫代替她去往敵國(guó)和親糯崎。 傳聞我的和親對(duì)象是個(gè)殘疾皇子几缭,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,877評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容