AI學(xué)習(xí)筆記之?dāng)?shù)學(xué)基礎(chǔ)四(信息論)

信息論在AI中也扮演著重要的角色

  • 意義:不確定性才是客觀世界的本質(zhì)屬性谊却。
  • 克勞德·香農(nóng)發(fā)表了著名論文《通信的數(shù)學(xué)理論》畜吊,給出了對(duì)信息這一定性概念的定量分析方法,標(biāo)志著信息論作為一門學(xué)科的正式誕生。
  • 信息熵:對(duì)單個(gè)信源的信息量和通信中傳遞信息的數(shù)量與效率等問(wèn)題做出了解釋刨啸,并在世界的不確定性和信息的可測(cè)量性之間搭建起一座橋梁。
  • 熵的本質(zhì):一個(gè)系統(tǒng)內(nèi)在的混亂程度砌些。
  • 自信息量的定義:
    • 如果事件 A發(fā)生的概率為 p(A)呜投,自信息量為:
  • 信源的信息熵:信源可能發(fā)出的各個(gè)符號(hào)的自信息量在信源構(gòu)成的概率空間上的統(tǒng)計(jì)平均值。
    • 如果一個(gè)離散信源 X 包含 n個(gè)符號(hào)存璃,每個(gè)符號(hào) ai的取值為 p(ai)仑荐,則 X 的信源熵為
    • 當(dāng)信源中的每個(gè)符號(hào)的取值概率相等時(shí),信源熵取到最大值 log2n纵东,意味著信源的隨機(jī)程度最高粘招。
  • 條件熵:將條件概率擴(kuò)展到信息論中,如果兩個(gè)信源之間具有相關(guān)性偎球,那么在已知其中一個(gè)信源 X 的條件下洒扎,另一個(gè)信源 Y 的信源熵就會(huì)減小。
    • 條件熵 H(Y|X) 表示的是在已知隨機(jī)變量 X 的條件下另一個(gè)隨機(jī)變量 Y 的不確定性衰絮,也就是在給定 X 時(shí)袍冷,根據(jù) Y 的條件概率計(jì)算出的熵再對(duì) X 求解數(shù)學(xué)期望:

    • 條件熵的意義在于先按照變量 X 的取值對(duì)變量 Y進(jìn)行了一次分類,對(duì)每個(gè)分出來(lái)的類別計(jì)算其單獨(dú)的信息熵猫牡,再將每個(gè)類的信息熵按照 X 的分布計(jì)算其數(shù)學(xué)期望胡诗。

  • 互信息:等于 Y 的信源熵減去已知 X 時(shí) Y 的條件熵,即由 X 提供的關(guān)于 Y 的不確定性的消除,也可以看成是 X 給 Y帶來(lái)的信息增益煌恢。
    • 互信息這個(gè)名稱在通信領(lǐng)域經(jīng)常使用骇陈,信息增益則在機(jī)器學(xué)習(xí)領(lǐng)域中經(jīng)常使用,兩者的本質(zhì)是一樣的瑰抵。


    • 在機(jī)器學(xué)習(xí)中你雌,信息增益常常被用于分類特征的選擇。
    • 對(duì)于給定的訓(xùn)練數(shù)據(jù)集 Y二汛,H(Y) 表示在未給定任何特征時(shí)婿崭,對(duì)訓(xùn)練集進(jìn)行分類的不確定性;
    • H(Y|X) 則表示了使用特征 X 對(duì)訓(xùn)練集 Y進(jìn)行分類的不確定性习贫。
    • 信息增益表示的就是特征 X 帶來(lái)的對(duì)訓(xùn)練集 Y 分類不確定性的減少程度逛球,也就是特征 X 對(duì)訓(xùn)練集 Y 的區(qū)分度。
    • 信息增益更大的特征具有更強(qiáng)的分類能力苫昌。但信息增益的值很大程度上依賴于數(shù)據(jù)集的信息熵 H(Y)颤绕,因而并不具有絕對(duì)意義。
  • 信息增益比:g(X,Y)=I(X;Y)/H(Y)
  • Kullback-Leibler 散度:
    • KL 散度描述兩個(gè)概率分布 P 和 Q 之間的差異的一種方法祟身,其定義為:
    • KL 散度是對(duì)額外信息量的衡量奥务。給定一個(gè)信源,其符號(hào)的概率分布為 P(X)袜硫,就可以設(shè)計(jì)一種針對(duì) P(X) 的最優(yōu)編碼氯葬,使得表示該信源所需的平均比特?cái)?shù)最少(等于該信源的信源熵)
    • KL 散度用來(lái)衡量這種情況下平均每個(gè)字符多用的比特?cái)?shù),也可以表示兩個(gè)分布之間的距離婉陷。
    • KL 散度的兩個(gè)重要性質(zhì)是非負(fù)性和非對(duì)稱性帚称。
      • 非負(fù)性是指 KL 散度是大于或等于 0 的,等號(hào)只在兩個(gè)分布完全相同時(shí)取到秽澳。
      • 非對(duì)稱性則是指 DKL(P||Q)≠DKL(Q||P)闯睹,即用 P(X)P(X) 去近似 Q(X) 和用 Q(X)去近似 P(X)得到的偏差是不同的,因此 KL 散度并不滿足數(shù)學(xué)意義上對(duì)距離的定義
  • 最大熵原理:確定隨機(jī)變量統(tǒng)計(jì)特性時(shí)力圖最符合客觀情況的一種準(zhǔn)則担神。對(duì)于一個(gè)未知的概率分布楼吃,最壞的情況就是它以等可能性取到每個(gè)可能的取值。
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末妄讯,一起剝皮案震驚了整個(gè)濱河市孩锡,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌亥贸,老刑警劉巖躬窜,帶你破解...
    沈念sama閱讀 206,013評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異炕置,居然都是意外死亡荣挨,警方通過(guò)查閱死者的電腦和手機(jī)溜族,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)垦沉,“玉大人,你說(shuō)我怎么就攤上這事仍劈〔薇叮” “怎么了?”我有些...
    開(kāi)封第一講書人閱讀 152,370評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵贩疙,是天一觀的道長(zhǎng)讹弯。 經(jīng)常有香客問(wèn)我,道長(zhǎng)这溅,這世上最難降的妖魔是什么组民? 我笑而不...
    開(kāi)封第一講書人閱讀 55,168評(píng)論 1 278
  • 正文 為了忘掉前任,我火速辦了婚禮悲靴,結(jié)果婚禮上臭胜,老公的妹妹穿的比我還像新娘。我一直安慰自己癞尚,他們只是感情好耸三,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,153評(píng)論 5 371
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著浇揩,像睡著了一般仪壮。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上胳徽,一...
    開(kāi)封第一講書人閱讀 48,954評(píng)論 1 283
  • 那天积锅,我揣著相機(jī)與錄音,去河邊找鬼养盗。 笑死缚陷,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的爪瓜。 我是一名探鬼主播蹬跃,決...
    沈念sama閱讀 38,271評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼铆铆!你這毒婦竟也來(lái)了蝶缀?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書人閱讀 36,916評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤薄货,失蹤者是張志新(化名)和其女友劉穎翁都,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體谅猾,經(jīng)...
    沈念sama閱讀 43,382評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡柄慰,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,877評(píng)論 2 323
  • 正文 我和宋清朗相戀三年鳍悠,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片坐搔。...
    茶點(diǎn)故事閱讀 37,989評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡藏研,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出概行,到底是詐尸還是另有隱情蠢挡,我是刑警寧澤,帶...
    沈念sama閱讀 33,624評(píng)論 4 322
  • 正文 年R本政府宣布凳忙,位于F島的核電站业踏,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏涧卵。R本人自食惡果不足惜勤家,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,209評(píng)論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望柳恐。 院中可真熱鬧伐脖,春花似錦、人聲如沸乐设。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 30,199評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)伤提。三九已至巫俺,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間肿男,已是汗流浹背介汹。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 31,418評(píng)論 1 260
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留舶沛,地道東北人嘹承。 一個(gè)月前我還...
    沈念sama閱讀 45,401評(píng)論 2 352
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像如庭,于是被迫代替她去往敵國(guó)和親叹卷。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,700評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容