吳軍信息論筆記|如何利用互信息解決問(wèn)題

1. 什么是互信息许昨,互信息vs相關(guān)性的關(guān)系

吳軍老師講的概念本身不難懂盐,信息之間是有相關(guān)性的,互信息是度量相關(guān)性的尺子糕档。簡(jiǎn)單的理解莉恼,互信息越高,相關(guān)性也越高速那。

相關(guān)系數(shù) vs 互信息:

  • 線性相關(guān)系數(shù)俐银,從統(tǒng)計(jì)學(xué)出發(fā)度量信息A、B的關(guān)系端仰,范圍在-1到1捶惜,即有正相關(guān)和負(fù)相關(guān)。0表示相關(guān)
  • 互信息荔烧,從聯(lián)合概率的角度計(jì)算吱七,可以理解為A出現(xiàn)的時(shí)候B出現(xiàn)的概率,概率范圍是從0到1鹤竭,即完全不確定到完全確定

2. 穩(wěn)定的強(qiáng)相關(guān)性才值得關(guān)注

大數(shù)據(jù)的維度非常多踊餐,例如個(gè)人信息包括:籍貫、學(xué)歷臀稚、工作吝岭、房產(chǎn)、收入吧寺、身高窜管、體重等等,分別計(jì)算這些數(shù)據(jù)與財(cái)富水平的互信息稚机。顯然學(xué)歷和收入會(huì)是強(qiáng)相關(guān)幕帆,但體重?cái)?shù)據(jù)和財(cái)富水平的互信息也不會(huì)是0,例如0.1抒钱,這樣的相關(guān)性我們要不要關(guān)注呢蜓肆?通過(guò)體重判斷一個(gè)人的財(cái)富顯然是不合理的颜凯。

數(shù)據(jù)和指標(biāo)都不缺,值得關(guān)注的是強(qiáng)相關(guān)性仗扬,而且要穩(wěn)定症概。一些時(shí)靈時(shí)不靈的指標(biāo),實(shí)際上是噪音早芭,信貸機(jī)構(gòu)的風(fēng)控模型需要定時(shí)更新彼城,因?yàn)橹笜?biāo)的有效性會(huì)改變。例如退个,淘寶按一個(gè)人支付的頻率判斷是不是刷單募壕,商家發(fā)現(xiàn)這樣的規(guī)則之后,可能找更多的人分布刷單语盈,那么原來(lái)的指標(biāo)就不靈了舱馅。

3. 利用互信息,就是尋找代理變量

互信息的利用刀荒,就是要用容易獲取的數(shù)據(jù)代嗤,推斷難以觀測(cè)的數(shù)據(jù)。用廉價(jià)的數(shù)據(jù)作為代理變量缠借,推斷更有價(jià)值的信息干毅。

例如,宏觀經(jīng)濟(jì)的走勢(shì)對(duì)于資產(chǎn)配置很重要泼返,但難以直接獲取硝逢,香帥老師提出用社融、PPI绅喉、固定投資等公開(kāi)數(shù)據(jù)來(lái)推斷宏觀走勢(shì)渠鸽。更進(jìn)一步,等到央行數(shù)據(jù)公開(kāi)霹疫,信息就會(huì)反映在價(jià)格中拱绑,所以很多金融機(jī)構(gòu)會(huì)用其他信息(房產(chǎn)交易量综芥、汽車銷售量)等信息去推斷社融的增速丽蝎,因此往往在官方數(shù)據(jù)公布之前,市場(chǎng)價(jià)格就會(huì)發(fā)生變化膀藐。

總結(jié):尋找強(qiáng)相關(guān)性屠阻,挖掘代理變量,利用信息獲利额各。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末国觉,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子虾啦,更是在濱河造成了極大的恐慌麻诀,老刑警劉巖痕寓,帶你破解...
    沈念sama閱讀 211,348評(píng)論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異蝇闭,居然都是意外死亡呻率,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,122評(píng)論 2 385
  • 文/潘曉璐 我一進(jìn)店門呻引,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)礼仗,“玉大人,你說(shuō)我怎么就攤上這事逻悠≡” “怎么了?”我有些...
    開(kāi)封第一講書人閱讀 156,936評(píng)論 0 347
  • 文/不壞的土叔 我叫張陵童谒,是天一觀的道長(zhǎng)单旁。 經(jīng)常有香客問(wèn)我,道長(zhǎng)饥伊,這世上最難降的妖魔是什么慎恒? 我笑而不...
    開(kāi)封第一講書人閱讀 56,427評(píng)論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮撵渡,結(jié)果婚禮上融柬,老公的妹妹穿的比我還像新娘。我一直安慰自己趋距,他們只是感情好粒氧,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,467評(píng)論 6 385
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著节腐,像睡著了一般外盯。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上翼雀,一...
    開(kāi)封第一講書人閱讀 49,785評(píng)論 1 290
  • 那天饱苟,我揣著相機(jī)與錄音,去河邊找鬼狼渊。 笑死箱熬,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的狈邑。 我是一名探鬼主播城须,決...
    沈念sama閱讀 38,931評(píng)論 3 406
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼米苹!你這毒婦竟也來(lái)了糕伐?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書人閱讀 37,696評(píng)論 0 266
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤蘸嘶,失蹤者是張志新(化名)和其女友劉穎良瞧,沒(méi)想到半個(gè)月后陪汽,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,141評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡褥蚯,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,483評(píng)論 2 327
  • 正文 我和宋清朗相戀三年掩缓,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片遵岩。...
    茶點(diǎn)故事閱讀 38,625評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡你辣,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出尘执,到底是詐尸還是另有隱情舍哄,我是刑警寧澤,帶...
    沈念sama閱讀 34,291評(píng)論 4 329
  • 正文 年R本政府宣布誊锭,位于F島的核電站表悬,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏丧靡。R本人自食惡果不足惜蟆沫,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,892評(píng)論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望温治。 院中可真熱鬧饭庞,春花似錦、人聲如沸熬荆。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 30,741評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)卤恳。三九已至累盗,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間突琳,已是汗流浹背若债。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 31,977評(píng)論 1 265
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留拆融,地道東北人蠢琳。 一個(gè)月前我還...
    沈念sama閱讀 46,324評(píng)論 2 360
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像冠息,于是被迫代替她去往敵國(guó)和親挪凑。 傳聞我的和親對(duì)象是個(gè)殘疾皇子孕索,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,492評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容