Python 相關分析與實現

相關分析最常用的方法就是用相關系數直接衡量連續(xù)值的相關性,而離散屬性的相關性是用熵增益轉換成相關性的形式來衡量琐驴。

一、分析連續(xù)值的相關性:

Pearson相關系數及Spearman相關系數如下:

相關系數計算公式
代碼實現
藍色區(qū)域表示具有明顯相關性搀崭,橙色區(qū)域表示有明顯的負相關性

二悬钳、分析離散值的相關性:

熵的相關公式

說明:

1.熵是衡量不確定的值,值越接近于0棘捣,說明不確定性越泄枷佟;數據的類別越多熵越大乍恐。

2.互信息(熵增益):缺點:對分類數目多的特征有不正確的偏向评疗,也就是說不具有歸一化的特點,它的不確定性是上不封頂的茵烈,所以對于我們相關性的界定是不方便的百匆,為了解決這個問題,有了熵增益率呜投。

3.熵增益率:是不對稱的加匈,即X對Y的增益率與Y對X的增益率是不等的,所以要進行轉換仑荐,轉換成相關性雕拼。

4.相關性:解決了X和Y的對稱性。

以下為舉例說明:

分析X與Y相關性

代碼實現如下:

代碼實現


代碼實現


輸出結果
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末粘招,一起剝皮案震驚了整個濱河市啥寇,隨后出現的幾起案子,更是在濱河造成了極大的恐慌洒扎,老刑警劉巖,帶你破解...
    沈念sama閱讀 210,914評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件袍冷,死亡現場離奇詭異,居然都是意外死亡胡诗,警方通過查閱死者的電腦和手機,發(fā)現死者居然都...
    沈念sama閱讀 89,935評論 2 383
  • 文/潘曉璐 我一進店門乃戈,熙熙樓的掌柜王于貴愁眉苦臉地迎上來褂痰,“玉大人,你說我怎么就攤上這事症虑。” “怎么了匪蝙?”我有些...
    開封第一講書人閱讀 156,531評論 0 345
  • 文/不壞的土叔 我叫張陵主籍,是天一觀的道長。 經常有香客問我逛球,道長千元,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,309評論 1 282
  • 正文 為了忘掉前任幸海,我火速辦了婚禮奥务,結果婚禮上物独,老公的妹妹穿的比我還像新娘氯葬。我一直安慰自己,他們只是感情好帚称,可當我...
    茶點故事閱讀 65,381評論 5 384
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著戏羽,像睡著了一般瞻坝。 火紅的嫁衣襯著肌膚如雪蛛壳。 梳的紋絲不亂的頭發(fā)上所刀,一...
    開封第一講書人閱讀 49,730評論 1 289
  • 那天捞挥,我揣著相機與錄音,去河邊找鬼斩披。 笑死,一個胖子當著我的面吹牛垦沉,可吹牛的內容都是我干的仍劈。 我是一名探鬼主播厕倍,決...
    沈念sama閱讀 38,882評論 3 404
  • 文/蒼蘭香墨 我猛地睜開眼讹弯,長吁一口氣:“原來是場噩夢啊……” “哼况既!你這毒婦竟也來了?” 一聲冷哼從身側響起棒仍,我...
    開封第一講書人閱讀 37,643評論 0 266
  • 序言:老撾萬榮一對情侶失蹤臭胜,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后耸三,有當地人在樹林里發(fā)現了一具尸體,經...
    沈念sama閱讀 44,095評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡蛋褥,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,448評論 2 325
  • 正文 我和宋清朗相戀三年睛驳,在試婚紗的時候發(fā)現自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片乏沸。...
    茶點故事閱讀 38,566評論 1 339
  • 序言:一個原本活蹦亂跳的男人離奇死亡蹬跃,死狀恐怖匙瘪,靈堂內的尸體忽然破棺而出蝶缀,到底是詐尸還是另有隱情,我是刑警寧澤翁都,帶...
    沈念sama閱讀 34,253評論 4 328
  • 正文 年R本政府宣布柄慰,位于F島的核電站鳍悠,受9級特大地震影響坐搔,放射性物質發(fā)生泄漏。R本人自食惡果不足惜概行,卻給世界環(huán)境...
    茶點故事閱讀 39,829評論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望袒哥。 院中可真熱鬧,春花似錦堡称、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,715評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽断凶。三九已至巫俺,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間介汹,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,945評論 1 264
  • 我被黑心中介騙來泰國打工窗价, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留叹卷,地道東北人撼港。 一個月前我還...
    沈念sama閱讀 46,248評論 2 360
  • 正文 我出身青樓帝牡,卻偏偏與公主長得像,于是被迫代替她去往敵國和親否灾。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,440評論 2 348

推薦閱讀更多精彩內容

  • 決策樹理論在決策樹理論中惩阶,有這樣一句話挎狸,“用較少的東西断楷,照樣可以做很好的事情。越是小的決策樹,越優(yōu)于大的決策樹”茅主。...
    制杖灶灶閱讀 5,839評論 0 25
  • 簡書公式支持不太好土榴,歡迎跳轉到機器學習深度學習面試題總結GitHub看完整的總結诀姚,GitHub總結比較全玷禽,大多數是...
    MrMiaow閱讀 3,814評論 1 8
  • 以西瓜書為主線,以其他書籍作為參考進行補充,例如《統(tǒng)計學習方法》火窒,《PRML》等 第一章 緒論 1.2 基本術語 ...
    danielAck閱讀 4,500評論 0 6
  • 1 前言 在了解樹模型之前,自然想到樹模型和線性模型够庙,他們有什么區(qū)別呢咪啡? 樹形模型是一個一個特征進行處理,之前線性...
    高永峰_GYF閱讀 1,376評論 0 1
  • 課時之余撤摸,晴好周末。幾縷閑情准夷,牽引著我們穿過“吳中勝景”的石坊,來到久聞卻未見的石湖衫嵌。既是閑逛,我們也未曾想到...
    邱秋1729閱讀 353評論 0 0