什么是信息熵呆抑、條件熵和信息增益

信息增益描述了一個特征帶來的信息量的多少陵霉,往往用于特征選擇

信息增益 = 信息熵 - 條件熵

一個特征往往會使一個隨機變量Y的信息量減少说搅,減少的部分就是信息增益

一個例子

如圖所示,目標值是:playtennis律歼,也就是是否打球

有四個特征:天氣民镜、溫度、濕度险毁、風

信息熵

信息熵的公式:

H(X)=?∑i=1np(xi)logp(xi)

以上圖為例制圈,設是否打球這一隨機變量為Y,則

p(y=yes)=514

p(y=no)=914

所以H(Y)=?514?log(514)?914?log(914)=0.6518

條件熵

條件熵表示在條件X下Y的信息熵畔况。公式如下:

H(Y|X)=∑x∈Xp(x)H(Y|X=x)

在上圖的例子中鲸鹦,設humidity濕度為隨機變量X

則,p(x=high)=7/14=1/2=p1

p(x=normal)=7/14=1/2=p2

所以跷跪,H(Y|X)=p1*H(Y|X=high)+p2*H(Y|X=normal)

而接下來就是計算H(Y|X=high)和H(Y|X=normal)

根據(jù)信息熵的計算方法可以得出:

H(Y|X=high)=-4/7*log(4/7)-3/7*log(3/7) = 0.6829

H(Y|X=normal)=-1/7*log(1/7)-6/7*log(6/7) = 0.4101

因此馋嗜,條件熵為:1/2*0.6829+1/2*0.4101=0.5465

信息增益

信息增益 = 信息熵 - 條件熵=0.6518-0.5465=0.1053

也就是說,引入了濕度humidity這個變量之后吵瞻,就使得是否打球這個變量的信息量就從0.6518減小到了0.5465

信息量是描述變量的不確定性的葛菇,值越大,就表示這個事件越不確定

因此橡羞,濕度這個變量的引進眯停,使得這種不確定性降低了,有利于做決定

信息增益常用于決策樹的構(gòu)建卿泽,和特征選擇

最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末莺债,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子又厉,更是在濱河造成了極大的恐慌九府,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,997評論 6 502
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件覆致,死亡現(xiàn)場離奇詭異侄旬,居然都是意外死亡,警方通過查閱死者的電腦和手機煌妈,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,603評論 3 392
  • 文/潘曉璐 我一進店門儡羔,熙熙樓的掌柜王于貴愁眉苦臉地迎上來宣羊,“玉大人,你說我怎么就攤上這事汰蜘〕鸱耄” “怎么了?”我有些...
    開封第一講書人閱讀 163,359評論 0 353
  • 文/不壞的土叔 我叫張陵族操,是天一觀的道長苛坚。 經(jīng)常有香客問我,道長色难,這世上最難降的妖魔是什么泼舱? 我笑而不...
    開封第一講書人閱讀 58,309評論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮枷莉,結(jié)果婚禮上娇昙,老公的妹妹穿的比我還像新娘。我一直安慰自己笤妙,他們只是感情好冒掌,可當我...
    茶點故事閱讀 67,346評論 6 390
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著蹲盘,像睡著了一般股毫。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上辜限,一...
    開封第一講書人閱讀 51,258評論 1 300
  • 那天皇拣,我揣著相機與錄音,去河邊找鬼薄嫡。 笑死氧急,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的毫深。 我是一名探鬼主播吩坝,決...
    沈念sama閱讀 40,122評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼哑蔫!你這毒婦竟也來了钉寝?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,970評論 0 275
  • 序言:老撾萬榮一對情侶失蹤闸迷,失蹤者是張志新(化名)和其女友劉穎嵌纲,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體腥沽,經(jīng)...
    沈念sama閱讀 45,403評論 1 313
  • 正文 獨居荒郊野嶺守林人離奇死亡逮走,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,596評論 3 334
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了今阳。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片师溅。...
    茶點故事閱讀 39,769評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡茅信,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出墓臭,到底是詐尸還是另有隱情蘸鲸,我是刑警寧澤,帶...
    沈念sama閱讀 35,464評論 5 344
  • 正文 年R本政府宣布窿锉,位于F島的核電站酌摇,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏嗡载。R本人自食惡果不足惜妙痹,卻給世界環(huán)境...
    茶點故事閱讀 41,075評論 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望鼻疮。 院中可真熱鬧,春花似錦琳轿、人聲如沸判沟。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,705評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽挪哄。三九已至,卻和暖如春琉闪,著一層夾襖步出監(jiān)牢的瞬間迹炼,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,848評論 1 269
  • 我被黑心中介騙來泰國打工颠毙, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留斯入,地道東北人。 一個月前我還...
    沈念sama閱讀 47,831評論 2 370
  • 正文 我出身青樓蛀蜜,卻偏偏與公主長得像刻两,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子滴某,可洞房花燭夜當晚...
    茶點故事閱讀 44,678評論 2 354

推薦閱讀更多精彩內(nèi)容

  • 請聽題:什么是熵磅摹?什么是交叉熵?什么是聯(lián)合熵霎奢?什么是條件熵户誓?什么是相對熵?它們的聯(lián)系與區(qū)別是什么幕侠? 如果你感到回答...
    工程師milter閱讀 11,927評論 5 57
  • 保留初心橙依,砥礪前行 這一章節(jié)講解的是關于信息的某些度量证舟。 我們常常說信息很多硕旗,或者信息較少,但卻很難說清楚信息到底...
    加勒比海鮮王閱讀 1,269評論 2 15
  • 熵通常被認為描述一個系統(tǒng)或者分布的不確定性女责,熵越大漆枚,系統(tǒng)越混亂,不確定性越大抵知。機器學習與數(shù)據(jù)挖掘的算法中大量的應用...
    sylvainwang閱讀 4,394評論 0 50
  • 喜歡浪漫和奔放的人群基礎一定是厚實的墙基。根據(jù)現(xiàn)有定論,楚辭開浪漫之先風刷喜,所以不喜歡楚辭是有些武斷了残制。 或許有很多的人...
    昏塵居士閱讀 184評論 2 1
  • 一 秋來了初茶,感覺離你也近了。 一色青浊闪,一色黃恼布,歲月便在季節(jié)的更替里漸漸蒼老了起來。 你曾說搁宾,若你老了折汞,就拿出那些沾...
    言禾雨閱讀 1,742評論 29 40