Python學(xué)習(xí)筆記-3群18組-杜杜狼-2017.8.10

Review Lesson 14 自動摘要

review的代碼及注釋

Lesson 15 相關(guān)分析

相關(guān)性系數(shù)(correlation coefficient)

相關(guān)系數(shù)是變量間關(guān)聯(lián)程度的最基本測量度之一

相關(guān)分析(correlation analysis)

是研究現(xiàn)象之間是否存在某種依存關(guān)系,并對具體有依存關(guān)系的現(xiàn)象探討其相關(guān)方向以及相關(guān)程度廷蓉,是研究隨機(jī)變量之間的相關(guān)關(guān)系的一種統(tǒng)計方法

相關(guān)系數(shù)基本特征

方向(direction)
正相關(guān)(positive correlation):兩個變量變化方向相同
負(fù)相關(guān)(negative correlation):兩個變量變化方向相反

量級(magnitude)
低度相關(guān) 0 <= |r| < 0.3
中度相關(guān) 0.3 <= |r| < 0.8
高度相關(guān) 0.8 <= |r| <= 1

計算相關(guān)系數(shù)公式

協(xié)方差的公式為
S_{xy}=\sum_i^N \frac{(x_i-\mu_x)(y_i - \mu_y)}{N-1}

相關(guān)系數(shù)的公式為
r = \frac{S_{xy}}{S_x S_y}

匿乃,其中Sx皆串,Sy分別表示x和y的標(biāo)準(zhǔn)差。

如果用之前學(xué)過的z分?jǐn)?shù)表示杭朱,則為:

r-coefficient.png

r: 相關(guān)系數(shù)
Zx: 變量x的Z分?jǐn)?shù)
Zy: 變量y的Z分?jǐn)?shù)
N: X和Y取值的配對個數(shù)

代碼實現(xiàn)相關(guān)系數(shù)的計算

#均值
XMean = numpy.mean(X);
YMean = numpy.mean(Y);

#標(biāo)準(zhǔn)差
XSD = numpy.std(X);
YSD = numpy.std(Y);

#z分?jǐn)?shù)
ZX = (X-XMean)/XSD;
ZY = (Y-YMean)/YSD;

#相關(guān)系數(shù),套用第三個公式
r = numpy.sum(ZX*ZY)/(len(X));
r
#直接調(diào)用Python的內(nèi)置的方法計算,返回的是相關(guān)系數(shù)2D Array
numpy.corrcoef(X, Y)

#使用pandas包的DF內(nèi)置方法計算谍椅,返回相關(guān)系數(shù)矩陣
import pandas;

data = pandas.DataFrame({
    'X': X, 
    'Y': Y
})
data.corr()

安斯庫姆四重奏(anscombe’s quartet

這是個相關(guān)性分析的陷阱
數(shù)據(jù)可視化里最經(jīng)典的案例:四組不同的數(shù)據(jù)做線性相關(guān),得到相關(guān)系數(shù)一樣(0.816)但實際作圖可以看出很大差異古话。

在四幅圖中雏吭,由第一組數(shù)據(jù)繪制的圖表(左上圖)是看起來最“正常”的陪踩,可以看出兩個隨機(jī)變量之間的相關(guān)性杖们。從第二組數(shù)據(jù)的圖表(右上圖)則可以明顯地看出兩個隨機(jī)變量間的關(guān)系是非線性的。第三組中(左下圖)肩狂,雖然存在著線性關(guān)系摘完,但由于一個離群值的存在,改變了線性回歸線孝治,也使得相關(guān)系數(shù)從1降至0.81。最后,在第四個例子中(右下圖)荆秦,盡管兩個隨機(jī)變量間沒有線性關(guān)系篱竭,但僅僅由于一個離群值的存在就使得相關(guān)系數(shù)變得很高步绸。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末掺逼,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子瓤介,更是在濱河造成了極大的恐慌吕喘,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,884評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件刑桑,死亡現(xiàn)場離奇詭異氯质,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)祠斧,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,347評論 3 385
  • 文/潘曉璐 我一進(jìn)店門闻察,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人琢锋,你說我怎么就攤上這事辕漂。” “怎么了吴超?”我有些...
    開封第一講書人閱讀 157,435評論 0 348
  • 文/不壞的土叔 我叫張陵钉嘹,是天一觀的道長。 經(jīng)常有香客問我鲸阻,道長跋涣,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,509評論 1 284
  • 正文 為了忘掉前任鸟悴,我火速辦了婚禮陈辱,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘遣臼。我一直安慰自己性置,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 65,611評論 6 386
  • 文/花漫 我一把揭開白布揍堰。 她就那樣靜靜地躺著鹏浅,像睡著了一般。 火紅的嫁衣襯著肌膚如雪屏歹。 梳的紋絲不亂的頭發(fā)上隐砸,一...
    開封第一講書人閱讀 49,837評論 1 290
  • 那天,我揣著相機(jī)與錄音蝙眶,去河邊找鬼季希。 笑死褪那,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的式塌。 我是一名探鬼主播博敬,決...
    沈念sama閱讀 38,987評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼峰尝!你這毒婦竟也來了偏窝?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,730評論 0 267
  • 序言:老撾萬榮一對情侶失蹤武学,失蹤者是張志新(化名)和其女友劉穎祭往,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體火窒,經(jīng)...
    沈念sama閱讀 44,194評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡硼补,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,525評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了熏矿。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片已骇。...
    茶點故事閱讀 38,664評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖曲掰,靈堂內(nèi)的尸體忽然破棺而出疾捍,到底是詐尸還是另有隱情,我是刑警寧澤栏妖,帶...
    沈念sama閱讀 34,334評論 4 330
  • 正文 年R本政府宣布,位于F島的核電站奖恰,受9級特大地震影響吊趾,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜瑟啃,卻給世界環(huán)境...
    茶點故事閱讀 39,944評論 3 313
  • 文/蒙蒙 一论泛、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧蛹屿,春花似錦屁奏、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,764評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至犹撒,卻和暖如春折联,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背识颊。 一陣腳步聲響...
    開封第一講書人閱讀 31,997評論 1 266
  • 我被黑心中介騙來泰國打工诚镰, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 46,389評論 2 360
  • 正文 我出身青樓清笨,卻偏偏與公主長得像月杉,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子抠艾,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,554評論 2 349

推薦閱讀更多精彩內(nèi)容