信息熵


信息熵

信息量:用來度量一個信息的多少蒂胞。

解釋:獲取者對它的了解程度相關樱溉,概率越大認為它的信息量越小构订,概率越小認為它的信息量越大丛塌。

用以下式子定義:

I(x)=?logp(x)

信息熵用來描述一個信源的不確定度空凸,也是信源的信息量期望嚎花。

對這個信源信號進行編碼的理論上的平均最小比特數(shù)(底數(shù)為2時)。

式子定義如下(log 的底數(shù)可以取2呀洲、e等不同的值紊选,只要底數(shù)相同啼止,一般是用于相對而言的比較):

H(X)

=Ex~X[I(x)]

=Ex~X[?logx]

=?∑x∈X[p(x)logp(x)]

意義:該式子對依據(jù)概率分布P生成的符號進行編碼所需的比特數(shù)在平均意義上的下界。

信息出現(xiàn)頻率高兵罢,分配比特數(shù)要邢追场:

同理頻率低的,分配大卖词。

概率低→定義信息量高巩那;概率低→定義編碼長度長。

信息熵范圍

接近確定的分布有較低的熵此蜈;接近均勻分布的概率分布有較高的熵即横。


分布與熵

在信源中出現(xiàn)的消息的種數(shù)一定時,這些消息出現(xiàn)的概率全都相等時裆赵,有信源的信息熵最大东囚。

推出信息熵的范圍:?

0≤H(X)≤?\sum\nolimits_{}^n 1/nlog(1/n)=log(n)

其中n是不同信息數(shù)

相對熵(KL散度)

相對熵:在信息論中度量兩個信源的信號信息量的分布差異。

機器學習中直接把其中的信息量等概念忽略了战授,當做損失函數(shù)页藻,用于比較真實和預測分布之間的差異

式子定義如下:

DKL(P||Q)

=Ex~P[logP(x)Q(x)]

=Ex~P[logP(x)?logQ(x)]

KL散度衡量的是植兰,當我們用一種能使概率分布Q產(chǎn)生的消息長度最小的編碼惕橙,發(fā)送由分布P產(chǎn)生的消息時,所需要的額外信息量钉跷。

用使得P分布產(chǎn)生消息長度最小的編碼弥鹦,來發(fā)送P分布產(chǎn)生的消息時,

對于某符號x

編碼信息量:?logP(x)

概率是:P(x)

P分布平均每個符號要編碼的信息量:∑x∈P[?P(x)logP(x)]=H(P)

即是P分布的信息熵

同理:

Q分布產(chǎn)生消息長度最小的編碼爷辙,來發(fā)送P分布產(chǎn)生的消息時

對于某符號x

編碼信息量:?logQ(x)

概率是:P(x)

P分布平均每個符號要編碼的信息量:∑x∈P[?P(x)logQ(x)]=H(P,Q)

這是P和Q的交叉熵

額外信息量即:

P分布信息熵與P和Q的交叉熵之差

兩個分布相同時彬坏,它們的KL散度為0

KL散度性質(zhì):

1.KL散度不是一個對稱量


KL散度不是一個對稱量

2.KL散度非負

由Jenson不等式可證明KL散度非負,此處不證明了膝晾。

JS散度

JS散度:度量兩個概率分布的相似度

JS散度是對稱的栓始,取值是0到1之間

公式如下

交叉熵

交叉熵式子定義:

H(P,Q)=?Ex~P(x)logQ(x)

此處是x到p(x)注意,簡書公式果然不好用(QAQ)下一次手推吧

假如P是真實分布血当,當使用DKL(P||Q) DKL(P||Q)作為損失函數(shù)

因為只含P的那一項并不會隨著擬合分布Q的改變而改變幻赚。

所以這時候損失函數(shù)可以使用H(P,Q)來代替簡化

由于H(P,Q)=DKL(P||Q)+H(P)可看出H(P,Q)比H(p)大

條件熵

條件熵H(Y|X)中X和Y不是分布而是隨機變量

H(Y|X)表示在已知隨機變量?X的條件下? 隨機變量?Y的不確定性

注意:這里的X并不是某個確定值臊旭,而是隨機變量落恼,所以在計算熵的時候要對所有H(Y|X=x)進行求和

化簡就略了吧:

實際上定義的就是在所有X的條件下,Y的混亂度的平均值离熏。?

互信息

互信息:

1.用來度量兩個隨機變量之間的相互依賴程度

2.度量能從一個隨機變量中獲取的另一個隨機變量的信息量佳谦。

3.當一個隨機變量已知時,另一個隨機變量的不確定性的減少程度

互信息值也等于Y的信息熵減去X和Y的條件熵滋戳。


聯(lián)合熵

聯(lián)合熵也是用隨機變量而不是分布來表示钻蔑,定義如下:

H(X,Y)=?∑x∑yP(x,y)log2P(x,y)

衡量隨機變量X和隨機變量Y的聯(lián)合概率密度的信息熵大小啥刻。

(數(shù)學公式功能不好用)

最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市咪笑,隨后出現(xiàn)的幾起案子可帽,更是在濱河造成了極大的恐慌,老刑警劉巖窗怒,帶你破解...
    沈念sama閱讀 219,539評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件映跟,死亡現(xiàn)場離奇詭異兜粘,居然都是意外死亡申窘,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,594評論 3 396
  • 文/潘曉璐 我一進店門孔轴,熙熙樓的掌柜王于貴愁眉苦臉地迎上來贷洲,“玉大人,你說我怎么就攤上這事”撸” “怎么了彪腔?”我有些...
    開封第一講書人閱讀 165,871評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長进栽。 經(jīng)常有香客問我德挣,道長,這世上最難降的妖魔是什么快毛? 我笑而不...
    開封第一講書人閱讀 58,963評論 1 295
  • 正文 為了忘掉前任格嗅,我火速辦了婚禮,結果婚禮上唠帝,老公的妹妹穿的比我還像新娘屯掖。我一直安慰自己,他們只是感情好没隘,可當我...
    茶點故事閱讀 67,984評論 6 393
  • 文/花漫 我一把揭開白布懂扼。 她就那樣靜靜地躺著,像睡著了一般右蒲。 火紅的嫁衣襯著肌膚如雪阀湿。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,763評論 1 307
  • 那天瑰妄,我揣著相機與錄音陷嘴,去河邊找鬼。 笑死间坐,一個胖子當著我的面吹牛灾挨,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播竹宋,決...
    沈念sama閱讀 40,468評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼劳澄,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了蜈七?” 一聲冷哼從身側響起秒拔,我...
    開封第一講書人閱讀 39,357評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎飒硅,沒想到半個月后砂缩,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,850評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡三娩,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,002評論 3 338
  • 正文 我和宋清朗相戀三年庵芭,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片雀监。...
    茶點故事閱讀 40,144評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡双吆,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出会前,到底是詐尸還是另有隱情好乐,我是刑警寧澤,帶...
    沈念sama閱讀 35,823評論 5 346
  • 正文 年R本政府宣布回官,位于F島的核電站曹宴,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏歉提。R本人自食惡果不足惜笛坦,卻給世界環(huán)境...
    茶點故事閱讀 41,483評論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望苔巨。 院中可真熱鬧版扩,春花似錦、人聲如沸侄泽。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,026評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至柿扣,卻和暖如春肖方,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背未状。 一陣腳步聲響...
    開封第一講書人閱讀 33,150評論 1 272
  • 我被黑心中介騙來泰國打工俯画, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人司草。 一個月前我還...
    沈念sama閱讀 48,415評論 3 373
  • 正文 我出身青樓艰垂,卻偏偏與公主長得像,于是被迫代替她去往敵國和親埋虹。 傳聞我的和親對象是個殘疾皇子猜憎,可洞房花燭夜當晚...
    茶點故事閱讀 45,092評論 2 355

推薦閱讀更多精彩內(nèi)容