R | 卡方檢驗(yàn)

χ2檢驗(yàn)主要有三個(gè)用途:單樣本方差的同質(zhì)性檢驗(yàn)獨(dú)立性檢驗(yàn)適合性檢驗(yàn)。適合性檢驗(yàn)和獨(dú)立性檢驗(yàn)都是應(yīng)用于離散型資料的假設(shè)檢驗(yàn),其基本原理是通過χ2值的大小來檢驗(yàn)觀測(cè)值(observed value, O理論值(expected value, E之間的偏離程度。

在本文中,我們先介紹獨(dú)立性檢驗(yàn)適合性檢驗(yàn)在R語(yǔ)言當(dāng)中的應(yīng)用冈爹。


在R中,卡方檢驗(yàn)的函數(shù)是chisq.test()

chisq.test() :
chisq.test performs chi-squared contingency table tests and goodness-of-fit tests

chisq.test(x, y = NULL, correct = TRUE,
           p = rep(1/length(x), length(x)), rescale.p = FALSE,
           simulate.p.value = FALSE, B = 2000)

x : 進(jìn)行檢驗(yàn)的數(shù)據(jù)欧引,可以是vector或matrix

y : 進(jìn)行檢驗(yàn)的數(shù)據(jù)频伤,當(dāng)x是matrix時(shí),y會(huì)被忽略芝此,x和y可同時(shí)為factor憋肖。

correct : 該邏輯參數(shù)控制2x2列聯(lián)表的獨(dú)立性檢驗(yàn)時(shí),是否進(jìn)行連續(xù)性矯正婚苹,即對(duì)所以|O-E| - 0.5

p : 為輸入的概率值岸更,應(yīng)與x變量的長(zhǎng)度一致。注意p不可以為負(fù)數(shù)

rescale.p : 該邏輯參數(shù)控制是否將p的和重新調(diào)整為1

simulate.p.value : 控制是否以蒙特卡洛采樣的方法模擬p值

B : 為蒙特卡洛采樣的重復(fù)次數(shù)膊升。


使用chisq.test要更加注意在卡方檢驗(yàn)中:

  • 零假設(shè)H0就是觀測(cè)值與理論值無顯著差別怎炊。

  • 備擇假設(shè)HA是觀測(cè)值與理論值有顯著差別。

具體到適合性檢驗(yàn)的話廓译,H0:觀測(cè)值符合某個(gè)理論分布评肆;HA:觀測(cè)值不符合某個(gè)理論分布。

對(duì)于獨(dú)立性檢驗(yàn)而言非区,H0:事件A與事件B無顯著關(guān)系瓜挽,即A與B相互獨(dú)立;HA:事件A與事件B相關(guān)征绸。

適合性檢驗(yàn)

適合性檢驗(yàn)(compatibility test)是比較觀測(cè)值與理論值是否符合的假設(shè)檢驗(yàn)久橙。在生物學(xué)研究中,有很多情況都會(huì)使用到適合性檢驗(yàn)管怠,也成為擬合優(yōu)度檢驗(yàn)淆衷,下面我們以孟德爾經(jīng)典的例子來展示chisq.test() 在適合性檢驗(yàn)方面的應(yīng)用。

【例1】 孟德爾用豌豆的兩對(duì)相對(duì)性狀進(jìn)行雜交實(shí)驗(yàn)渤弛,黃色圓滑種子與綠色皺縮種子的豌豆雜交后祝拯,F(xiàn)2代分離的情況為:黃圓315、黃皺101暮芭、綠圓108鹿驼、綠皺32,共556粒畜晰,問此結(jié)果是否符合自由組合定律9:3:3:1?

> x <- c(315, 101, 108, 32)  #輸入樣本資料
> p <- c(9/16, 3/16, 3/16, 1/16)  #輸入待檢驗(yàn)的比例
> chisq.test(x, p = p)

    Chi-squared test for given probabilities

data:  x
X-squared = 0.47002, df = 3, p-value = 0.9254

chisq.test直接的輸出值包括了:卡方值瑞筐、自由度和p值凄鼻。

從以上的p值來看聚假,這次檢驗(yàn)也是接受H0膘格,即實(shí)驗(yàn)結(jié)果符合自由組合定律的。

獨(dú)立性檢驗(yàn)

獨(dú)立性檢驗(yàn)(independent test)是判斷兩個(gè)或兩個(gè)以上因素之間是否具有關(guān)聯(lián)關(guān)系的假設(shè)檢驗(yàn)菜秦,常用列聯(lián)表進(jìn)行檢驗(yàn)嚣州。而列聯(lián)表又可分為2 x 2避诽,2 x c 佳吞, r x c的形式(r ≥ 3底扳, c ≥ 3)蒲赂,然而實(shí)則上三種列聯(lián)表的計(jì)算大同小異若皱,不同的只是2 x 2列聯(lián)表需要進(jìn)行連續(xù)性矯正走触。下面將分別以幾個(gè)例子展示chisq.test() 在獨(dú)立性檢驗(yàn)方面的應(yīng)用卧土。

2 x 2列聯(lián)表

【例2】 現(xiàn)隨機(jī)抽樣對(duì)吸煙人群和不吸煙人群是否患有氣管炎進(jìn)行調(diào)查,試檢驗(yàn)吸煙與患?xì)夤苎子袩o關(guān)聯(lián)?

> tab <- as.table(cbind(c(50,5), c(250,195)))  #創(chuàng)建列聯(lián)表
> dimnames(tab) <- list(c("smoker", "non-smoker"),
+                       c("illness", "un-illness"))
> tab
           illness un-illness
smoker          50        250
non-smoker       5        195
> tab_Xsqtest <- chisq.test(tab)
> tab_Xsqtest

    Pearson's Chi-squared test with Yates' continuity correction

data:  tab
X-squared = 23.174, df = 1, p-value = 1.48e-06

在本例中:

H0:吸煙與患?xì)夤苎谉o關(guān)进苍。

HA:吸煙與患?xì)夤苎子嘘P(guān)杠人。

另外,由于是2 x 2列聯(lián)表獨(dú)立性檢驗(yàn)罩引,自由度小于2各吨,因此進(jìn)行了連續(xù)性矯正。檢驗(yàn)的p值小于0.01蜒程,說明吸煙與患?xì)夤苎子嘘P(guān)聯(lián)绅你。同時(shí)伺帘,我們還可以注意到chisq.test還會(huì)輸出其他的內(nèi)容(但并沒有直接打印出來)



包括了:

  • 樣本的觀測(cè)值
  • 樣本的理論值
  • 計(jì)算的殘差和標(biāo)準(zhǔn)化后的殘差

當(dāng)我們需要使用這些數(shù)據(jù)時(shí)昭躺,不妨將檢驗(yàn)的結(jié)果保存在一變量中,以便調(diào)用伪嫁。

2 x c列聯(lián)表

【例3】 現(xiàn)隨機(jī)抽樣對(duì)性別和參與的黨派進(jìn)行調(diào)查领炫,檢驗(yàn)性別與黨派是否有關(guān)。

> M <- as.table(rbind(c(762, 327, 468), c(484, 239, 477)))
> dimnames(M) <- list(gender = c("F", "M"),
+                     party = c("Democrat","Independent", "Republican"))
> M
      party
gender Democrat Independent Republican
     F      762         327        468
     M      484         239        477
> Xsq <- chisq.test(M)
> Xsq

    Pearson's Chi-squared test

data:  M
X-squared = 30.07, df = 2, p-value = 2.954e-07

卡方檢驗(yàn)的p值小于0.01张咳,說明性別與黨派是有顯著關(guān)系的帝洪。

可以注意到,2 x c 列聯(lián)表和2 x 2的代碼脚猾,除了輸入數(shù)據(jù)的差別外葱峡,其他也是幾乎一致的。而r x c的代碼也是更換輸入數(shù)據(jù)的差別而已龙助。

最后

獨(dú)立性分析反過來想的話砰奕,其實(shí)就是相關(guān)性分析,因此卡方檢驗(yàn)也可以在相關(guān)性分析中有用武之地提鸟。

當(dāng)然军援,Pearson Correlation和Fisher's exact test也是更為常用的相關(guān)性分析,有機(jī)會(huì)的話也會(huì)在后續(xù)的文章中向大家介紹這些方法称勋。

卡方檢驗(yàn)的R語(yǔ)言實(shí)例就介紹到這了胸哥,如有不足,請(qǐng)各位指出赡鲜。

完空厌。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市银酬,隨后出現(xiàn)的幾起案子蝇庭,更是在濱河造成了極大的恐慌,老刑警劉巖捡硅,帶你破解...
    沈念sama閱讀 218,682評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件哮内,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)北发,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,277評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門纹因,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人琳拨,你說我怎么就攤上這事瞭恰。” “怎么了狱庇?”我有些...
    開封第一講書人閱讀 165,083評(píng)論 0 355
  • 文/不壞的土叔 我叫張陵惊畏,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我密任,道長(zhǎng)颜启,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,763評(píng)論 1 295
  • 正文 為了忘掉前任浪讳,我火速辦了婚禮缰盏,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘淹遵。我一直安慰自己口猜,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,785評(píng)論 6 392
  • 文/花漫 我一把揭開白布透揣。 她就那樣靜靜地躺著济炎,像睡著了一般。 火紅的嫁衣襯著肌膚如雪辐真。 梳的紋絲不亂的頭發(fā)上须尚,一...
    開封第一講書人閱讀 51,624評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音拆祈,去河邊找鬼恨闪。 笑死,一個(gè)胖子當(dāng)著我的面吹牛放坏,可吹牛的內(nèi)容都是我干的咙咽。 我是一名探鬼主播,決...
    沈念sama閱讀 40,358評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼淤年,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼钧敞!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起麸粮,我...
    開封第一講書人閱讀 39,261評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤溉苛,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后弄诲,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體愚战,經(jīng)...
    沈念sama閱讀 45,722評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡娇唯,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,900評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了寂玲。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片塔插。...
    茶點(diǎn)故事閱讀 40,030評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖拓哟,靈堂內(nèi)的尸體忽然破棺而出想许,到底是詐尸還是另有隱情,我是刑警寧澤断序,帶...
    沈念sama閱讀 35,737評(píng)論 5 346
  • 正文 年R本政府宣布流纹,位于F島的核電站,受9級(jí)特大地震影響违诗,放射性物質(zhì)發(fā)生泄漏漱凝。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,360評(píng)論 3 330
  • 文/蒙蒙 一较雕、第九天 我趴在偏房一處隱蔽的房頂上張望碉哑。 院中可真熱鬧挚币,春花似錦亮蒋、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,941評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至笛粘,卻和暖如春趁怔,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背薪前。 一陣腳步聲響...
    開封第一講書人閱讀 33,057評(píng)論 1 270
  • 我被黑心中介騙來泰國(guó)打工润努, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人示括。 一個(gè)月前我還...
    沈念sama閱讀 48,237評(píng)論 3 371
  • 正文 我出身青樓铺浇,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親垛膝。 傳聞我的和親對(duì)象是個(gè)殘疾皇子鳍侣,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,976評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容