1.理論部分
Pearson(默認(rèn))
最常規(guī)的線性分析剪侮。計(jì)算公式
適用條件
- 變量線性關(guān)系钳吟、連續(xù)
- 兩個(gè)變量總體符合正態(tài)分布
- 標(biāo)準(zhǔn)差不能為0
- 異常值較敏感
Spearman(秩相關(guān)系數(shù))
其值與兩個(gè)相關(guān)變量的具體值無關(guān),而僅僅與其值之間的大小關(guān)系有關(guān)考传。
即
(1招拙,10,100喇勋,101)->(1缨该,2,3川背,4)
(21贰拿,10,15熄云,13)->(4膨更,1,3缴允,2)
再利用Pearson公式對(duì)轉(zhuǎn)換后的(1,2,3,4,)計(jì)算相關(guān)性.
適用條件:
- 等級(jí)變量之間的相關(guān)系數(shù)
- 對(duì)處理異常比較好荚守,因?yàn)樽畲笾底钚≈档木唧w數(shù)值對(duì)整體數(shù)據(jù)影響較大,但是排序通常不會(huì)有明顯變化
Kendall(和諧系數(shù))
其值與兩個(gè)相關(guān)變量的具體值無關(guān)癌椿,而僅僅與其值之間的大小關(guān)系有關(guān)健蕊。
對(duì)于X,Y的兩對(duì)觀察值Xi,Yi和Xj,Yj,如果Xi<Yi并且Xj<Yj,或者Xi>Yi并且Xj>Yj,則稱這兩對(duì)觀察值是和諧的,否則就是不和諧的。偏向一致性評(píng)價(jià)
計(jì)算公式
顯著性檢測(cè)
進(jìn)行相關(guān)性檢測(cè)時(shí)數(shù)據(jù)量越大踢俄,相關(guān)系數(shù)越小缩功,所以相關(guān)系數(shù)和顯著性應(yīng)該同時(shí)說明。
計(jì)算公式:
查表確定顯著性水平α
以上理論知識(shí)相關(guān)參考:https://www.cnblogs.com/kemaswill/archive/2012/11/01/2749842.html
2.R實(shí)現(xiàn)部分
require(xlsx);
require(psych);
require(corrplot);
require(corrgram);
require(PerformanceAnalytics);
data<-"E:\\corr\\CorrM_1000.xlsx";
M1<-read.xlsx(data,1,encoding='UTF-8');
##計(jì)算相關(guān)系數(shù)都办,并繪制相關(guān)系數(shù)矩陣
##corr<-cor(M1,method="pearson");
##無法生成散點(diǎn)圖
##corrplot.mixed(corr,upper="circle",lower="shade",addCoef.col = "black");
##計(jì)算顯著性水平
##corr.test(M1, adjust = "none", use = "complete")
##有上下兩個(gè)部分嫡锌,但是無法生成相關(guān)系數(shù)的圓圈
##corrgram(M1,lower.panel=panel.fill,upper.panel=panel.pts,text.panel=panel.txt)
##也無法生成相關(guān)系數(shù)的圓圈
chart.Correlation(M1, histogram=TRUE, pch=30);
效果圖
其中,1個(gè)點(diǎn)代表90%的置信度琳钉,1顆星代表95%的置信度势木,2顆代表99%的置信度,3顆星代表99.9%的置信度
一直想繪制散點(diǎn)圖在下(或下)歌懒,相關(guān)性圓圈在上(或下)啦桌,并標(biāo)注出相關(guān)性大小和顯著性,但一直沒有成功及皂。知道的評(píng)論區(qū)教教我呀~~~
另甫男,panel所有函數(shù):