R語言學(xué)習(xí)筆記之相關(guān)性矩陣分析及其可視化

TaoYan

計(jì)算相關(guān)矩陣

R內(nèi)置函數(shù)cor()可以用來計(jì)算相關(guān)系數(shù)：cor(x, method = c("pearson", "kendall", "spearman"))澜公，如果數(shù)據(jù)有缺失值弦讽，用cor(x, method = "pearson", use = "complete.obs")。

導(dǎo)入數(shù)據(jù)

如果數(shù)據(jù)格式是txt示弓，用my_data <- read.delim(file.choose())
csv則用my_data <- read.csv(file.choose())導(dǎo)入。
這里我們利用R內(nèi)置數(shù)據(jù)集mtcars呵萨。

data(mtcars)#加載數(shù)據(jù)集
mydata <- mtcars[, c(1,3,4,5,6,7)]
head(mydata, 6)#查看數(shù)據(jù)前6行

計(jì)算相關(guān)系數(shù)矩陣

res <- cor(mydata)
round(res, 2)#保留兩位小數(shù)

cor()只能計(jì)算出相關(guān)系數(shù)奏属，無法給出顯著性水平p-value,Hmisc
包里的rcorr()函數(shù)能夠同時給出相關(guān)系數(shù)以及顯著性水平p-value。rcorr(x, type = c(“pearson”,“spearman”))潮峦。

The output of the function rcorr() is a list containing the following elements : - r : the correlation matrix - n : the matrix of the number of observations used in analyzing each pair of variables - P : the p-values corresponding to the significance levels of correlations.

library(Hmisc)#加載包
res2 <- rcorr(as.matrix(mydata))
res2

#可以用res2$r囱皿、res2$P來提取相關(guān)系數(shù)以及顯著性p-value
res2$r

res2$P

如何將相關(guān)系數(shù)以及顯著性水平p-value整合進(jìn)一個矩陣內(nèi)勇婴，可以自定義一個函數(shù)flattenCorrMatrix。

# ++++++++++++++++++++++++++++
# flattenCorrMatrix
# ++++++++++++++++++++++++++++
# cormat : matrix of the correlation coefficients
# pmat : matrix of the correlation p-values
flattenCorrMatrix <- function(cormat, pmat) {
ut <- upper.tri(cormat) data.frame( row = rownames(cormat)[row(cormat)[ut]], 
column = rownames(cormat)[col(cormat)[ut]], cor =(cormat)[ut], p = pmat[ut] )
}
#舉個栗子
res3 <- rcorr(as.matrix(mtcars[,1:7]))
flattenCorrMatrix(res3$r, res3$P)

可視化相關(guān)系數(shù)矩陣

有不同的方法來可視化嘱腥，主要有下面四種：

symnum() function
corrplot() function to plot a correlogram
scatter plots
heatmap

symnum() function

主要用法：

symnum(x, cutpoints = c(0.3, 0.6, 0.8, 0.9, 0.95), symbols = c(" “,”.“,”,“,”+“,”*“,”B“), 
abbr.colnames = TRUE) #很好理解耕渴，0-0.3用空格表示， 0.3-0.6用.表示齿兔， 以此類推橱脸。

舉個栗子

symnum(res, abbr.colnames = FALSE)#abbr.colnames用來控制列名

corrplot() function to plot a correlogram

這個函數(shù)來自于包c(diǎn)orrplot()
,通過顏色深淺來顯著相關(guān)程度。參數(shù)主要有：

type: “upper”, “l(fā)ower”, “full”,顯示上三角還是下三角還是全部
order:用什么方法分苇，這里是hclust
tl.col (for text label color) and tl.srt (for text label string rotation) :控制文本顏色以及旋轉(zhuǎn)角度

library(corrplot)#先加載包
corrplot(res, type = "upper", order = "hclust", tl.col = "black", tl.srt = 45)

也可以結(jié)合顯著性繪制

# Insignificant correlations are leaved blank
corrplot(res2$r, type="upper", order="hclust", p.mat = res2$P, sig.level = 0.01, insig = "blank")

Use chart.Correlation(): Draw scatter plots

chart.Correlation()來自于包PerformanceAnalytics

library(PerformanceAnalytics)#加載包
chart.Correlation(mydata, histogram=TRUE, pch=19)

解釋一下上圖：

對角線上顯示的是分布圖
左下部顯示的是具有擬合線的雙變量散點(diǎn)圖
右上部顯示的是相關(guān)系數(shù)以及顯著性水平

heatmap()

col<- colorRampPalette(c("blue", "white", "red"))(20)#調(diào)用顏色版自定義顏色
heatmap(x = res, col = col, symm = TRUE)#symm表示是否對稱

最后編輯于：2017.12.08 01:22:04

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末添诉，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子医寿，更是在濱河造成了極大的恐慌吻商，老刑警劉巖，帶你破解...
沈念sama閱讀 216,372評論 6贊 498
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件糟红，死亡現(xiàn)場離奇詭異艾帐，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)盆偿，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,368評論 3贊 392
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門柒爸，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人事扭，你說我怎么就攤上這事捎稚。” “怎么了求橄？”我有些...
開封第一講書人閱讀 162,415評論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵今野，是天一觀的道長。經(jīng)常有香客問我罐农，道長条霜，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,157評論 1贊 292
?港島之戀（遺憾婚禮）
正文為了忘掉前任涵亏，我火速辦了婚禮宰睡，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘气筋。我一直安慰自己拆内，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 67,171評論 6贊 388
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布宠默。她就那樣靜靜地躺著麸恍，像睡著了一般。火紅的嫁衣襯著肌膚如雪搀矫。梳的紋絲不亂的頭發(fā)上抹沪，一...
開封第一講書人閱讀 51,125評論 1贊 297
城市分裂傳說
那天刻肄，我揣著相機(jī)與錄音，去河邊找鬼采够。笑死肄方，一個胖子當(dāng)著我的面吹牛冰垄，可吹牛的內(nèi)容都是我干的蹬癌。我是一名探鬼主播，決...
沈念sama閱讀 40,028評論 3贊 417
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼虹茶，長吁一口氣：“原來是場噩夢啊……” “哼逝薪！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起蝴罪，我...
開封第一講書人閱讀 38,887評論 0贊 274
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤董济，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后要门，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體虏肾，經(jīng)...
沈念sama閱讀 45,310評論 1贊 310
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,533評論 2贊 332
?白月光啟示錄
正文我和宋清朗相戀三年欢搜，在試婚紗的時候發(fā)現(xiàn)自己被綠了封豪。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 39,690評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡炒瘟，死狀恐怖吹埠，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情疮装，我是刑警寧澤缘琅，帶...
沈念sama閱讀 35,411評論 5贊 343
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站廓推，受9級特大地震影響刷袍，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜樊展，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,004評論 3贊 325
男人毒藥：我在死后第九天來索命
文/蒙蒙一做个、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧滚局，春花似錦居暖、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,659評論 0贊 22
一樁弒父案太闺，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至嘁圈，卻和暖如春省骂，著一層夾襖步出監(jiān)牢的瞬間蟀淮，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 32,812評論 1贊 268
情欲美人皮
我被黑心中介騙來泰國打工钞澳，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留怠惶，地道東北人。一個月前我還...
沈念sama閱讀 47,693評論 2贊 368
代替公主和親
正文我出身青樓轧粟，卻偏偏與公主長得像策治，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子兰吟，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,577評論 2贊 353