《Discovering Statistics Using R》筆記8-Spearman相關(guān)系數(shù)和Kendall’s tau相關(guān)系數(shù)

筆記說明

讀《Discovering Statistics Using R》第六章 Correlation中的6.5.5-6.5.6節(jié)做的筆記塑娇。主要是介紹Spearman相關(guān)系數(shù)和Kendall’s tau相關(guān)系數(shù)。

示例數(shù)據(jù)

設(shè)我們想要驗(yàn)證一個(gè)理論:創(chuàng)造力更強(qiáng)的人可以講出更厲害的故事州叠。有這么一個(gè)比賽“the World's Biggest Liar competition”每年舉辦一次即硼。作者收集了68個(gè)參賽者的比賽名次數(shù)據(jù)并讓他們做了一份考察創(chuàng)造力的量表,滿分60分。數(shù)據(jù)在這里:The Biggest Liar.dat

library(rio)
liarData <- import("data/The Biggest Liar.dat")
str(liarData)
## 'data.frame':    68 obs. of  3 variables:
##  $ Creativity: int  53 36 31 43 30 41 32 54 47 50 ...
##  $ Position  : int  1 3 4 2 4 1 4 1 2 2 ...
##  $ Novice    : int  0 1 0 0 1 0 0 1 1 0 ...

Position即為比賽名次傻唾,Creativity即為創(chuàng)造力評分。
由于position變量為定序變量承耿,而Pearson相關(guān)系數(shù)要求數(shù)據(jù)為定距變量冠骄,不適合使用Pearson相關(guān)系數(shù)。
仍然是先做一個(gè)散點(diǎn)圖看一下數(shù)據(jù)情況:

#散點(diǎn)圖
library(ggplot2)
scatter <- ggplot(liarData, aes(Creativity, Position)) + geom_point()

Spearman相關(guān)系數(shù)

Spearman相關(guān)系數(shù) r_s是一個(gè)非參數(shù)統(tǒng)計(jì)量加袋,也稱為Spearman's rho凛辣,可用于數(shù)據(jù)違反參數(shù)假設(shè)(例如正態(tài)性假設(shè))的情形。計(jì)算Spearman相關(guān)系數(shù)時(shí)首先將原始數(shù)據(jù)從小到達(dá)排序編秩职烧,對排序后的秩次計(jì)算Pearson相關(guān)系數(shù)即為原數(shù)據(jù)的Spearman相關(guān)系數(shù)扁誓。
和Pearson相關(guān)系數(shù)一樣,Spearman相關(guān)系數(shù)可以使用cor()蚀之、cor.test()進(jìn)行計(jì)算和檢驗(yàn)蝗敢,只需指定method='spearman'即可:

cor(liarData$Creativity, liarData$Position, method = 'spearman')
## [1] -0.3732184
cor.test(liarData$Creativity, liarData$Position,method = 'spearman')
##  Spearman's rank correlation rho
## 
## data:  liarData$Creativity and liarData$Position
## S = 71948, p-value = 0.00172
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##        rho 
## -0.3732184 
## 
## Warning message:
## In cor.test.default(liarData$Creativity, liarData$Position, method = "spearman") :
##   無法給連結(jié)計(jì)算精確p值

cor.test()對Spearman相關(guān)系數(shù)的結(jié)果和Pearson相關(guān)系數(shù)的很像。但沒有置信區(qū)間(如果需要計(jì)算置信區(qū)間可以用bootstrap法足删,見之后章節(jié)的筆記)

Kendall's tau相關(guān)系數(shù)

Kendall's tau, \tau寿谴,也是一個(gè)非參數(shù)相關(guān)系數(shù),當(dāng)樣本量較小失受,排序編秩時(shí)相同秩次的數(shù)又比較多時(shí)使用讶泰。
Spearman相關(guān)系數(shù)和Kendall's tau相關(guān)系數(shù)都是非參數(shù)相關(guān)系數(shù)咏瑟,雖然Spearman相關(guān)系數(shù)更多見,有文獻(xiàn)(Howell,1997)表明Kendall's tau相關(guān)系數(shù)實(shí)際上是總體相關(guān)關(guān)系更好的估計(jì)痪署。
示例數(shù)據(jù)中Position變量有很多值都是編秩時(shí)秩次相同的码泞,上面用cor.test()計(jì)算并檢驗(yàn)Spearman相關(guān)系數(shù)時(shí)結(jié)果中有一條warning中所說的“連結(jié)”就是指tied ranks,秩次相同的情況有些多惠桃。
和之前介紹的其他兩個(gè)相關(guān)系數(shù)一樣浦夷,Kendall's tau相關(guān)系數(shù)可以使用cor()cor.test()進(jìn)行計(jì)算和檢驗(yàn)辜王,只需指定method='kendall'即可:

#Kendall's tau相關(guān)系數(shù)
cor(liarData$Creativity, liarData$Position, method = 'kendall')
cor.test(liarData$Creativity, liarData$Position,method = 'kendall')
##  Kendall's rank correlation tau
## 
## data:  liarData$Creativity and liarData$Position
## z = -3.2252, p-value = 0.001259
## alternative hypothesis: true tau is not equal to 0
## sample estimates:
##        tau 
## -0.3002413 
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末劈狐,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子呐馆,更是在濱河造成了極大的恐慌肥缔,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,126評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件汹来,死亡現(xiàn)場離奇詭異续膳,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)收班,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評論 2 382
  • 文/潘曉璐 我一進(jìn)店門坟岔,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人摔桦,你說我怎么就攤上這事社付。” “怎么了邻耕?”我有些...
    開封第一講書人閱讀 152,445評論 0 341
  • 文/不壞的土叔 我叫張陵鸥咖,是天一觀的道長。 經(jīng)常有香客問我兄世,道長啼辣,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,185評論 1 278
  • 正文 為了忘掉前任御滩,我火速辦了婚禮鸥拧,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘艾恼。我一直安慰自己住涉,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,178評論 5 371
  • 文/花漫 我一把揭開白布钠绍。 她就那樣靜靜地躺著舆声,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上媳握,一...
    開封第一講書人閱讀 48,970評論 1 284
  • 那天碱屁,我揣著相機(jī)與錄音,去河邊找鬼蛾找。 笑死娩脾,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的打毛。 我是一名探鬼主播柿赊,決...
    沈念sama閱讀 38,276評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼幻枉!你這毒婦竟也來了碰声?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,927評論 0 259
  • 序言:老撾萬榮一對情侶失蹤熬甫,失蹤者是張志新(化名)和其女友劉穎胰挑,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體椿肩,經(jīng)...
    沈念sama閱讀 43,400評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡瞻颂,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,883評論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了郑象。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片贡这。...
    茶點(diǎn)故事閱讀 37,997評論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖厂榛,靈堂內(nèi)的尸體忽然破棺而出藕坯,到底是詐尸還是另有隱情,我是刑警寧澤噪沙,帶...
    沈念sama閱讀 33,646評論 4 322
  • 正文 年R本政府宣布,位于F島的核電站吐根,受9級特大地震影響正歼,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜拷橘,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,213評論 3 307
  • 文/蒙蒙 一局义、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧冗疮,春花似錦萄唇、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春四敞,著一層夾襖步出監(jiān)牢的瞬間泛源,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評論 1 260
  • 我被黑心中介騙來泰國打工忿危, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留达箍,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,423評論 2 352
  • 正文 我出身青樓铺厨,卻偏偏與公主長得像缎玫,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子解滓,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,722評論 2 345

推薦閱讀更多精彩內(nèi)容