深度學(xué)習(xí)擴(kuò)展_信息論

首先來(lái)看離散型隨機(jī)變量被芳$直矗考慮隨機(jī)變量取某一個(gè)特定值時(shí)包含的信息量的大小。假設(shè)隨機(jī)變量取值為x畔濒,對(duì)應(yīng)的概率為P(x)剩晴。直觀來(lái)看,取這個(gè)值的可能性越小侵状,而它又發(fā)生了赞弥,則包含的信息量就越大。因此如果定義一個(gè)函數(shù)I(x)來(lái)描述隨機(jī)變量取值為的信息量的大小的話趣兄,則I(x)應(yīng)該是P(x)的單調(diào)減函數(shù)绽左。例如,一年之內(nèi)人類登陸火星艇潭,包含的信息量顯然比廣州明天要下雨大拼窥,因?yàn)榍罢叩母怕拭黠@小于后者。

滿足單調(diào)遞減要求的函數(shù)太多了暴区,我們?cè)撨x擇哪個(gè)函數(shù)呢闯团?接著考慮。假設(shè)有兩個(gè)相互獨(dú)立的隨機(jī)變量仙粱,它們的取值分別為xy,取該值的概率為P(x)P(y)彻舰。根據(jù)隨機(jī)變量的獨(dú)立性伐割,它們的聯(lián)合概率為P(x,y)=P(x)P(y)

由于這兩個(gè)隨機(jī)變量是相互獨(dú)立的,因此它們各自取某一值時(shí)包含的信息量應(yīng)該是兩個(gè)隨機(jī)變量分別取這些值的時(shí)候包含的信息量之和I(x,y)=I(x)+I(y)

這要求h(x)能把p(x)的乘法轉(zhuǎn)化為加法刃唤。在數(shù)學(xué)上隔心,滿足此要求的是對(duì)數(shù)函數(shù)。因此尚胞,可以把自信息定義為I(x)=?\ln P(x)

這個(gè)對(duì)數(shù)的底數(shù)是多少并沒有太大關(guān)系硬霍,根據(jù)換底公式,最后計(jì)算出來(lái)的結(jié)果就差了一個(gè)倍數(shù)笼裳,信息論中通常以2為底唯卖,在機(jī)器學(xué)習(xí)中通常以e為底,在后面的計(jì)算中為了方便起見我們用10為底躬柬。需要強(qiáng)調(diào)的對(duì)數(shù)函數(shù)前面加上了負(fù)號(hào)拜轨,這是因?yàn)閷?duì)數(shù)函數(shù)是增函數(shù),而我們要求I(x)P(x)的減函數(shù)允青。另外橄碾,由于0\leq P(x)\leq 1,因此\log P(x)<0,加上負(fù)號(hào)之后剛好可以保證這個(gè)信息量為正法牲。


上面只是考慮了隨機(jī)變量取某一個(gè)值時(shí)包含的信息量史汗,而隨機(jī)變量的取值是隨機(jī)的,有各種可能拒垃,那又怎么計(jì)算它取所有各種取值時(shí)所包含的信息量呢停撞?既然隨機(jī)變量取值有各種情況,而且取每個(gè)值有一個(gè)概率恶复,那我們計(jì)算它取各個(gè)值時(shí)的信息量的均值即數(shù)學(xué)期望即可怜森,這個(gè)信息量的均值,就是

離散:\begin{aligned}H(P)=\mathbb{E}_{x \sim P}[I(x)] =-\sum_{i} P(x_{i}) \ln P(x_{i})\end{aligned}

連續(xù):H(P)=-\int P(x) \ln P(x) \mathrmi8ui5pe x


根據(jù)熵的定義谤牡,隨機(jī)變量取各個(gè)值的概率相等(均勻分布)時(shí)有H(P)極大值副硅,在取某一個(gè)值的概率為1,取其他所有值的概率為0時(shí)有H(P)極小值(此時(shí)隨機(jī)變量退化成某一必然事件或者說(shuō)確定的變量)翅萤。


KL散度是兩個(gè)概率分布P和Q差別的非對(duì)稱性的度量恐疲。典型情況下,P表示數(shù)據(jù)的真實(shí)分布套么,Q表示數(shù)據(jù)的理論分布培己、估計(jì)的模型分布、或P的近似分布

Kullback-Leibler Divergence胚泌,即K-L散度省咨,是一種量化兩種概率分布P和Q之間差異的方式,又叫相對(duì)熵玷室。在概率學(xué)和統(tǒng)計(jì)學(xué)上零蓉,我們經(jīng)常會(huì)使用一種更簡(jiǎn)單的、近似的分布來(lái)替代觀察數(shù)據(jù)或太復(fù)雜的分布穷缤。K-L散度能幫助我們度量使用一個(gè)分布來(lái)近似另一個(gè)分布時(shí)所損失的信息量敌蜂。

其中,xP分布津肛、Q分布共同的樣本空間中同一個(gè)樣本點(diǎn)章喉,樣本空間的大小K

離散:

D_{K L}(P \| Q)=\mathbb{E}_{x \sim P}\left[\ln \frac{P(x)}{Q(x)}\right]=\mathbb{E}_{x \sim P}[\ln P(x)-\ln Q(x)]D_{K L}(P \| Q)=\sum_{i} P(x_{i}) \ln \frac{P(x_{i})}{Q(x_{i})}=\sum_{i}[P(x_{i}) \ln P(x_{i}) -P(x_{i}) \ln Q(x_{i})]

連續(xù):D_{K L}(P \| Q)=\left(-\int P(x) \ln Q(x) \mathrmpv46ypt x\right)-\left(-\int P(x) \ln P(x) \mathrmfwbs8wk x\right)=-\int P(x) \ln  \frac{P(x)}{Q(x)} \mathrmilmwxhq x

D_{K L}(P \| Q)=H(P,Q)-H(P)

非負(fù)D_{K L}(P \| Q)>0

只有P(x)=Q(x) 時(shí),D_{K L}(P \| Q)=0

非對(duì)稱性D_{K L}(P \| Q)≠D_{K L}(Q \| P)?


相對(duì)熵公式的前半部分H(P,Q)=-\int P(x) \ln Q(x) \mathrmnjh3kge x就是交叉熵

離散:H(P,Q)=-\mathbb{E}_{x \sim P}[ \ln Q(x)]=-\sum_{i} P(x_{i}) \ln Q(x_{i})

P(x)是數(shù)據(jù)的真實(shí)概率分布身坐,Q(x)是由數(shù)據(jù)計(jì)算得到的概率分布秸脱。機(jī)器學(xué)習(xí)的目的就是希望Q(x)盡可能地逼近甚至等于P(x),從而使得相對(duì)熵接近最小值0. 由于真實(shí)的概率分布是固定的掀亥,相對(duì)熵公式的后半部分H(P)=-\int P(x) \ln P(x) \mathrm6ibe0ry x就成了一個(gè)常數(shù)撞反。那么相對(duì)熵達(dá)到最小值的時(shí)候,也意味著交叉熵達(dá)到了最小值搪花。對(duì)Q(x)的優(yōu)化就等效于求交叉熵的最小值遏片。另外嘹害,對(duì)交叉熵求最小值,也等效于求最大似然估計(jì)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末吮便,一起剝皮案震驚了整個(gè)濱河市笔呀,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌髓需,老刑警劉巖许师,帶你破解...
    沈念sama閱讀 217,907評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異僚匆,居然都是意外死亡微渠,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,987評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門咧擂,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)逞盆,“玉大人,你說(shuō)我怎么就攤上這事松申≡坡” “怎么了?”我有些...
    開封第一講書人閱讀 164,298評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵贸桶,是天一觀的道長(zhǎng)舅逸。 經(jīng)常有香客問(wèn)我,道長(zhǎng)皇筛,這世上最難降的妖魔是什么琉历? 我笑而不...
    開封第一講書人閱讀 58,586評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮水醋,結(jié)果婚禮上善已,老公的妹妹穿的比我還像新娘。我一直安慰自己离例,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,633評(píng)論 6 392
  • 文/花漫 我一把揭開白布悉稠。 她就那樣靜靜地躺著宫蛆,像睡著了一般。 火紅的嫁衣襯著肌膚如雪的猛。 梳的紋絲不亂的頭發(fā)上耀盗,一...
    開封第一講書人閱讀 51,488評(píng)論 1 302
  • 那天,我揣著相機(jī)與錄音卦尊,去河邊找鬼叛拷。 笑死,一個(gè)胖子當(dāng)著我的面吹牛岂却,可吹牛的內(nèi)容都是我干的忿薇。 我是一名探鬼主播裙椭,決...
    沈念sama閱讀 40,275評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼署浩!你這毒婦竟也來(lái)了揉燃?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,176評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤筋栋,失蹤者是張志新(化名)和其女友劉穎炊汤,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體弊攘,經(jīng)...
    沈念sama閱讀 45,619評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡抢腐,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,819評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了襟交。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片迈倍。...
    茶點(diǎn)故事閱讀 39,932評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖婿着,靈堂內(nèi)的尸體忽然破棺而出授瘦,到底是詐尸還是另有隱情,我是刑警寧澤竟宋,帶...
    沈念sama閱讀 35,655評(píng)論 5 346
  • 正文 年R本政府宣布提完,位于F島的核電站,受9級(jí)特大地震影響丘侠,放射性物質(zhì)發(fā)生泄漏徒欣。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,265評(píng)論 3 329
  • 文/蒙蒙 一蜗字、第九天 我趴在偏房一處隱蔽的房頂上張望打肝。 院中可真熱鬧,春花似錦挪捕、人聲如沸粗梭。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,871評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)断医。三九已至,卻和暖如春奏纪,著一層夾襖步出監(jiān)牢的瞬間鉴嗤,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,994評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工序调, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留醉锅,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,095評(píng)論 3 370
  • 正文 我出身青樓发绢,卻偏偏與公主長(zhǎng)得像硬耍,于是被迫代替她去往敵國(guó)和親垄琐。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,884評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容