信息理論概念

姓名:張志文 學(xué)號(hào):19021210649
【嵌牛觀察】
信息論是一個(gè)重要的領(lǐng)域饶米,它對(duì)深度學(xué)習(xí)和人工智能作出了重大貢獻(xiàn)玄捕,但很多人對(duì)它卻并不了解。信息論可以看作是微積分不瓶、概率論和統(tǒng)計(jì)學(xué)這些深度學(xué)習(xí)基本組成部分的復(fù)雜融合禾嫉。人工智能中的很多概念來(lái)自信息論或相關(guān)領(lǐng)域。
【嵌牛鼻子】
深度學(xué)習(xí)蚊丐;信息論
【嵌牛提問(wèn)】
關(guān)于深度學(xué)習(xí)的信息理論有哪些熙参?
【嵌牛正文】

信息論簡(jiǎn)史

image

在20世紀(jì)初期,科學(xué)家和工程師們努力解決這樣的問(wèn)題:“如何量化信息麦备?有沒(méi)有一種分析方法或數(shù)學(xué)方法可以告訴我們信息的內(nèi)容孽椰?”

例如昭娩,考慮以下兩句話:

布魯諾是一條狗。

布魯諾是一條大棕狗黍匾。

第二句話給了我們更多的信息栏渺,因?yàn)樗€告訴布魯諾除了是“狗”之外還是“大的”和“棕色的”。我們?nèi)绾瘟炕瘍蓚€(gè)句子之間的差異锐涯?我們能否有一個(gè)數(shù)學(xué)測(cè)量方法告訴我們第二句話與第一句話相比多了多少信息磕诊?

科學(xué)家們一直在努力解決這些問(wèn)題。語(yǔ)義纹腌,域和數(shù)據(jù)形式只會(huì)增加問(wèn)題的復(fù)雜性霎终。數(shù)學(xué)家和工程師克勞德·香農(nóng)提出了“熵”的概念,它永遠(yuǎn)改變了我們的世界升薯,這標(biāo)志著數(shù)字信息時(shí)代的開(kāi)始莱褒。

image

克勞德·香農(nóng)提出“數(shù)據(jù)的語(yǔ)義方面是無(wú)關(guān)緊要的”,數(shù)據(jù)的性質(zhì)和含義在信息內(nèi)容方面并不重要涎劈。相反保礼,他根據(jù)概率分布和"不確定性"來(lái)量化信息。香農(nóng)還引入了“bit”這個(gè)詞责语,這一革命性的想法不僅奠定了信息論的基礎(chǔ)炮障,而且為人工智能等領(lǐng)域的進(jìn)步開(kāi)辟了新的途徑。

下面將討論深度學(xué)習(xí)和數(shù)據(jù)科學(xué)中四種流行的坤候,廣泛使用的和必須已知的信息論概念:

也可以稱為信息熵或香農(nóng)熵胁赢。

image

熵給出了實(shí)驗(yàn)中不確定性的度量。讓我們考慮兩個(gè)實(shí)驗(yàn):

拋出一枚無(wú)偏硬幣(P(H)= 0.5)并觀察它的輸出白筹,假設(shè)H

拋出一枚有偏硬幣(P(H)= 0.99)并觀察其輸出智末,假設(shè)H

如果我們比較兩個(gè)實(shí)驗(yàn),與實(shí)驗(yàn)1相比徒河,實(shí)驗(yàn)2更容易預(yù)測(cè)結(jié)果系馆。因此,我們可以說(shuō)實(shí)驗(yàn)1本質(zhì)上比實(shí)驗(yàn)2更不確定或不可預(yù)測(cè)顽照。實(shí)驗(yàn)中的這種不確定性是使用熵度量的由蘑。

因此,如果實(shí)驗(yàn)中存在更多固有的不確定性代兵,那么它的熵更大尼酿。或者說(shuō)實(shí)驗(yàn)越不可預(yù)測(cè)熵越大植影。實(shí)驗(yàn)的概率分布用于計(jì)算熵裳擎。

一個(gè)完全可預(yù)測(cè)的確定性實(shí)驗(yàn),即投擲P(H)= 1的硬幣的熵為零思币。一個(gè)完全隨機(jī)的實(shí)驗(yàn)鹿响,比如滾動(dòng)無(wú)偏骰子羡微,是最不可預(yù)測(cè)的,具有最大的不確定性惶我,在這些實(shí)驗(yàn)中熵最大拷淘。

image

另一種觀察熵的方法是我們觀察隨機(jī)實(shí)驗(yàn)結(jié)果時(shí)獲得的平均信息。將實(shí)驗(yàn)結(jié)果獲得的信息定義為該結(jié)果發(fā)生概率的函數(shù)指孤。結(jié)果越罕見(jiàn)启涯,從觀察中獲得的信息就越多。

例如恃轩,在確定性實(shí)驗(yàn)中结洼,我們總是知道結(jié)果,因此通過(guò)觀察結(jié)果沒(méi)有獲得新信息叉跛,因此熵為零松忍。

數(shù)學(xué)定義

對(duì)于離散隨機(jī)變量X,可能的結(jié)果(狀態(tài))x_1筷厘,...鸣峭,x_n,熵(以位為單位)定義為:

image

其中p(x_i)是X的第i個(gè)結(jié)果的概率酥艳。

應(yīng)用

熵用于自動(dòng)決策樹(shù)構(gòu)造摊溶。在樹(shù)構(gòu)建的每個(gè)步驟中,使用熵標(biāo)準(zhǔn)來(lái)完成特征選擇充石。

基于最大熵原理選擇模型莫换,從對(duì)比的模型中選出熵最大的模型為最佳模型。

交叉熵

交叉熵用于比較兩個(gè)概率分布骤铃。它告訴我們兩個(gè)分布有多相似拉岁。

數(shù)學(xué)定義

在相同的結(jié)果集上定義的兩個(gè)概率分布p和q之間的交叉熵由下式給出:

image

應(yīng)用

image

基于卷積神經(jīng)網(wǎng)絡(luò)的分類器通常使用softmax層作為最后一層,并使用交叉熵?fù)p失函數(shù)進(jìn)行訓(xùn)練

交叉熵?fù)p失函數(shù)廣泛用于邏輯回歸等分類模型惰爬,隨著預(yù)測(cè)偏離真實(shí)輸出喊暖,交叉熵?fù)p失函數(shù)會(huì)增大。

在諸如卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)架構(gòu)中撕瞧,最終輸出的softmax層經(jīng)常使用交叉熵作為損失函數(shù)陵叽。

交互信息

交互信息是兩種概率分布或隨機(jī)變量之間相互依賴性的度量。它告訴我們另一個(gè)變量有多少關(guān)于該變量的信息风范。

交互信息獲取隨機(jī)變量之間的依賴性咨跌,比一般的相關(guān)系數(shù)更具廣義性,后者只表現(xiàn)線性關(guān)系硼婿。

數(shù)學(xué)定義

兩個(gè)離散隨機(jī)變量X和Y的交互信息定義為:

image

其中p(x,y)是X和Y的聯(lián)合概率分布,p(x)和p(y)分別是X和Y的邊緣概率分布禽车。

應(yīng)用

image

在貝葉斯網(wǎng)絡(luò)中寇漫,可以使用交互信息來(lái)確定變量之間的關(guān)系結(jié)構(gòu)

特征選擇:使用交互信息刊殉,而不是使用相關(guān)性。相關(guān)性僅表現(xiàn)線性依賴性而忽略非線性依賴性州胳,但交互信息不會(huì)记焊。零的交互獨(dú)立性保證隨機(jī)變量是獨(dú)立的,但零相關(guān)不是栓撞。

在貝葉斯網(wǎng)絡(luò)中遍膜,交互信息用于學(xué)習(xí)隨機(jī)變量之間的關(guān)系結(jié)構(gòu),并定義這些關(guān)系的強(qiáng)度瓤湘。

Kullback Leibler(KL)散度

也稱為相對(duì)熵瓢颅。

image

KL散度是另一種表示兩個(gè)概率分布之間相似性的方法。它衡量一個(gè)分布與另一個(gè)分布的差異弛说。

假設(shè)我們有一些數(shù)據(jù)挽懦,它的真實(shí)分布是P。但是我們不知道P木人,所以我們選擇一個(gè)新的分布Q來(lái)近似這個(gè)數(shù)據(jù)信柿。由于Q只是一個(gè)近似值,它無(wú)法像P那樣準(zhǔn)確地逼近數(shù)據(jù)醒第,會(huì)造成一些信息的丟失渔嚷。這個(gè)信息損失由KL散度給出。

P和Q之間的KL散度告訴我們稠曼,當(dāng)我們?cè)噲D用P和Q來(lái)近似數(shù)據(jù)時(shí)圃伶,我們損失了多少信息。

數(shù)學(xué)定義

一個(gè)概率分布Q與另一個(gè)概率分布P的KL散度定義為:

image

應(yīng)用

KL散度通常用于無(wú)監(jiān)督機(jī)器學(xué)習(xí)技術(shù)中的變分自編碼器蒲列。

信息論最初是由數(shù)學(xué)家和電氣工程師克勞德·香農(nóng)窒朋,在1948年的開(kāi)創(chuàng)性論文“通信的數(shù)學(xué)理論”中提出的。

本文內(nèi)容為轉(zhuǎn)載蝗岖,版權(quán)歸作者所有

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末侥猩,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子抵赢,更是在濱河造成了極大的恐慌欺劳,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,188評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件铅鲤,死亡現(xiàn)場(chǎng)離奇詭異划提,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)邢享,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,464評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門鹏往,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人骇塘,你說(shuō)我怎么就攤上這事伊履『荩” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 165,562評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵唐瀑,是天一觀的道長(zhǎng)群凶。 經(jīng)常有香客問(wèn)我奴紧,道長(zhǎng)扫步,這世上最難降的妖魔是什么塘幅? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,893評(píng)論 1 295
  • 正文 為了忘掉前任颜武,我火速辦了婚禮淮捆,結(jié)果婚禮上电爹,老公的妹妹穿的比我還像新娘宙址。我一直安慰自己齐疙,他們只是感情好睛廊,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,917評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布形真。 她就那樣靜靜地躺著,像睡著了一般超全。 火紅的嫁衣襯著肌膚如雪咆霜。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 51,708評(píng)論 1 305
  • 那天嘶朱,我揣著相機(jī)與錄音蛾坯,去河邊找鬼。 笑死疏遏,一個(gè)胖子當(dāng)著我的面吹牛脉课,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播财异,決...
    沈念sama閱讀 40,430評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼倘零,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了戳寸?” 一聲冷哼從身側(cè)響起呈驶,我...
    開(kāi)封第一講書(shū)人閱讀 39,342評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎疫鹊,沒(méi)想到半個(gè)月后袖瞻,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,801評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡拆吆,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,976評(píng)論 3 337
  • 正文 我和宋清朗相戀三年聋迎,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片枣耀。...
    茶點(diǎn)故事閱讀 40,115評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡霉晕,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情娄昆,我是刑警寧澤佩微,帶...
    沈念sama閱讀 35,804評(píng)論 5 346
  • 正文 年R本政府宣布缝彬,位于F島的核電站萌焰,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏谷浅。R本人自食惡果不足惜扒俯,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,458評(píng)論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望一疯。 院中可真熱鬧撼玄,春花似錦、人聲如沸墩邀。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,008評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)眉睹。三九已至荔茬,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間竹海,已是汗流浹背慕蔚。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,135評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留斋配,地道東北人孔飒。 一個(gè)月前我還...
    沈念sama閱讀 48,365評(píng)論 3 373
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像艰争,于是被迫代替她去往敵國(guó)和親坏瞄。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,055評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • 摘要:在深度學(xué)習(xí)之前已經(jīng)有很多生成模型狮崩,但苦于生成模型難以描述難以建模,科研人員遇到了很多挑戰(zhàn)鹿寻,而深度學(xué)習(xí)的出現(xiàn)幫...
    肆虐的悲傷閱讀 11,291評(píng)論 1 21
  • 轉(zhuǎn)載自 https://mp.weixin.qq.com/s/OXXtPoBrCADbwxVyEbfbYg 25....
    _龍雀閱讀 1,680評(píng)論 0 0
  • 1 信息量 信息量即信息多少的度量睦柴。跟我們認(rèn)識(shí)中秒是時(shí)間多少的度量,米是長(zhǎng)度多少的量度是一樣的意思毡熏。 百度百科上定...
    chao6510閱讀 431評(píng)論 0 0
  • 基礎(chǔ)概念:? 邏輯:??邏輯可以在給定某些命題是真或假的假設(shè)下坦敌,判斷另外一些命題是真還是假。? 概率:??概率可以...
    交大小浪花閱讀 1,503評(píng)論 0 6
  • 今天是我上班的第54天,天氣有點(diǎn)陰 狱窘,我領(lǐng)導(dǎo)這些日子有事沒(méi)來(lái)單位上班杜顺,我們放假了三天,因?yàn)闆](méi)有塑料袋撿了蘸炸,我們才放...
    昵稱陽(yáng)光青年莒縣閱讀 22評(píng)論 0 1