R | 簡單的學(xué)生檢驗(yàn)(t-test)

Student's test —— 簡稱t-test郭宝,據(jù)說是作者當(dāng)年為避風(fēng)頭而用‘’學(xué)生”這一筆名,所以就將該種方法稱為學(xué)生檢驗(yàn)了廷蓉。

百度百科t-test 主要用于樣本含量較腥狻(例如n < 30),總體標(biāo)準(zhǔn)差σ未知的正態(tài)分布桃犬。t-test 是用t分布理論來推論差異發(fā)生的概率刹悴,從而比較兩個(gè)平均數(shù)的差異是否顯著。

關(guān)于t-test的原理在此處就不過多贅述了,主要還是看在R語言里面怎么用以及何時(shí)用攒暇。首先土匀,我們要注意做t-test的目的是為了檢驗(yàn)在符合正態(tài)分布的樣本中兩個(gè)平均數(shù)是否有顯著的差異,且該樣本的總體方差也是未知的扯饶,否則可以用u檢驗(yàn)恒削。

在R語言中,t-test的函數(shù)為t.test()尾序,如下所示

t.test(x, ...)

## Default S3 method:
t.test(x, y = NULL,
       alternative = c("two.sided", "less", "greater"),
       mu = 0, paired = FALSE, var.equal = FALSE,
       conf.level = 0.95, ...)

x,y :為進(jìn)行檢驗(yàn)的數(shù)據(jù)钓丰。
alternative:該參數(shù)設(shè)定備擇假設(shè),默認(rèn)為雙尾檢驗(yàn)每币。
mu:單樣本檢驗(yàn)時(shí)携丁,需要設(shè)定的平均值。
paired:為邏輯參數(shù),是否進(jìn)行配對(duì)t-test梦鉴。
var.equal:雙樣本檢驗(yàn)時(shí)李茫,總體方差是否相等
conf.level:設(shè)定顯著性水平,默認(rèn)α=0.05肥橙。

以下將以實(shí)例展示不同情況下的t-test如何使用魄宏。

單樣本均值檢驗(yàn)

【例1】一魚塘多年水中含氧量平均值為4.5 mg/L,現(xiàn)隨機(jī)在該魚塘采集10個(gè)樣本存筏,試檢驗(yàn)該次抽樣的均值是否與多年均值有顯著差別宠互。

> X <- c(4.33, 4.62, 3.89, 4.14, 4.78, 4.64, 4.52, 4.55, 4.48, 4.26)
> t.test(X, mu=4.5)

    One Sample t-test

data:  X
t = -0.93574, df = 9, p-value = 0.3738
alternative hypothesis: true mean is not equal to 4.5
95 percent confidence interval:
 4.230016 4.611984
sample estimates:
mean of x 
    4.421 

假設(shè)檢驗(yàn)一般都是以四段進(jìn)行,分別為:
(1)給出假設(shè)H0, HA
(2)確定顯著水平
(3)計(jì)算統(tǒng)計(jì)檢驗(yàn)值
(4)作出推斷

在以上結(jié)果中椭坚,我們可以看到t.test函數(shù)給出的結(jié)果中包含了計(jì)算出的檢驗(yàn)值予跌、自由度、p值以及結(jié)論等善茎。很明顯券册,我們看到本次抽樣的均值與總體均值是沒有顯著差異的。

雙樣本均值檢驗(yàn)

當(dāng)要比較的兩個(gè)樣本的總體方差未知垂涯,但相等時(shí)(判斷方差是否相等可以借助方差同質(zhì)性檢驗(yàn)F-test)烁焙,可以使用t-test。

成組數(shù)據(jù)的均值檢驗(yàn)--獨(dú)立樣本

成組數(shù)據(jù)(pooled data)是兩個(gè)樣本的各個(gè)變量從各自總體中抽取集币,也就是說兩個(gè)樣本間的變量沒有任何關(guān)聯(lián)考阱,兩個(gè)抽樣樣本彼此獨(dú)立。成組數(shù)據(jù)的兩個(gè)樣本的容量未必相同鞠苟,但是方差需要相等才能進(jìn)行t-test乞榨。

【例2】用高蛋白和低蛋白兩種飼料養(yǎng)1月齡大白鼠,在3個(gè)月時(shí)当娱,測定兩組大白鼠的增重量(g)吃既,檢驗(yàn)兩組數(shù)據(jù)均值有無顯著性差異。

> X <- c(134, 146, 106, 119, 124, 161, 107, 83, 113, 129, 97, 123)
> Y <- c(70, 118, 101, 85, 107, 132, 94)
> t.test(X, Y, var.equal = T)

    Two Sample t-test

data:  X and Y
t = 1.9157, df = 17, p-value = 0.07238
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -1.942543 40.275876
sample estimates:
mean of x mean of y 
 120.1667  101.0000 

由于本篇文章不展開F-test跨细,因此我們先跳過方差同質(zhì)性檢驗(yàn)這步(但兩總體的方差是相等的)鹦倚。此時(shí)所用的自由度為(n1+n2-2),且由于默認(rèn)上mu=0冀惭,所以在結(jié)果中備擇假設(shè)就打印出:
alternative hypothesis: true difference in means is not equal to 0

但是細(xì)看p值的話震叙,p>0.05,即接受H0散休,兩者無顯著差異媒楼,所以進(jìn)行雙總體均值檢驗(yàn)時(shí),要以p值為判斷基準(zhǔn)戚丸。

配對(duì)樣本檢驗(yàn)

配對(duì)樣本(paired data)的比較要求兩個(gè)樣本間配偶成對(duì)划址,每一對(duì)樣本除隨機(jī)地給予不同處理外,其他實(shí)驗(yàn)條件應(yīng)盡量一致。即為配對(duì)夺颤,兩樣本的容量必定相等痢缎。

配對(duì)樣本檢驗(yàn)在研究中也是較為常用的,如高血壓病人在服藥前后血壓變化是否有顯著差異等世澜,都可以使用該法檢驗(yàn)独旷。

【例3】用正常飼料和維生素E缺乏飼料飼養(yǎng)兩組配對(duì)的實(shí)驗(yàn)動(dòng)物一段時(shí)間后,檢測其肝臟中維生素A含量是否有顯著性差異宜狐。

> X <- c(3550, 2000, 3000, 3950, 3800, 3750, 3450, 3050)
> Y <- c(2450, 2400, 1800, 3200, 3250, 2700, 2500, 1750)
> t.test(X, Y, var.equal = T, paired = T)

    Paired t-test

data:  X and Y
t = 4.207, df = 7, p-value = 0.004001
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
  355.8207 1269.1793
sample estimates:
mean of the differences 
                  812.5 

由于是進(jìn)行配對(duì)檢驗(yàn)势告,因此paired = T。p<0.05抚恒,證明兩組均值有顯著性差異。

R語言中的統(tǒng)計(jì)檢驗(yàn)還是較為簡單和直接的络拌,但作為數(shù)據(jù)分析者俭驮,我們的任務(wù)除了敲出這幾行代碼之外,還要對(duì)我們的結(jié)果作出解答春贸。統(tǒng)計(jì)檢驗(yàn)是研究結(jié)論的守門人混萝,務(wù)必要保證該流程的嚴(yán)謹(jǐn)性,以給出令人信服的結(jié)論萍恕。

最后逸嘀,正如Holmes所言:
When you have eliminated the impossible, whatever remains, however improbable, must be the truth。

假設(shè)檢驗(yàn)也是如此允粤,即使結(jié)果與預(yù)設(shè)不符合崭倘,但只要任何一步都是嚴(yán)謹(jǐn)?shù)剡M(jìn)行的時(shí)候,我們都應(yīng)當(dāng)采信得出的結(jié)論类垫。

P.S. 以上例子出于李春喜老師的《生物統(tǒng)計(jì)學(xué)》(第五版)

完司光。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市悉患,隨后出現(xiàn)的幾起案子残家,更是在濱河造成了極大的恐慌,老刑警劉巖售躁,帶你破解...
    沈念sama閱讀 218,858評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件坞淮,死亡現(xiàn)場離奇詭異,居然都是意外死亡陪捷,警方通過查閱死者的電腦和手機(jī)回窘,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,372評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來揩局,“玉大人毫玖,你說我怎么就攤上這事。” “怎么了付枫?”我有些...
    開封第一講書人閱讀 165,282評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵烹玉,是天一觀的道長。 經(jīng)常有香客問我阐滩,道長二打,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,842評(píng)論 1 295
  • 正文 為了忘掉前任掂榔,我火速辦了婚禮继效,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘装获。我一直安慰自己瑞信,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,857評(píng)論 6 392
  • 文/花漫 我一把揭開白布穴豫。 她就那樣靜靜地躺著凡简,像睡著了一般。 火紅的嫁衣襯著肌膚如雪精肃。 梳的紋絲不亂的頭發(fā)上秤涩,一...
    開封第一講書人閱讀 51,679評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音司抱,去河邊找鬼筐眷。 笑死,一個(gè)胖子當(dāng)著我的面吹牛习柠,可吹牛的內(nèi)容都是我干的匀谣。 我是一名探鬼主播,決...
    沈念sama閱讀 40,406評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼津畸,長吁一口氣:“原來是場噩夢(mèng)啊……” “哼振定!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起肉拓,我...
    開封第一講書人閱讀 39,311評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤后频,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后暖途,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體卑惜,經(jīng)...
    沈念sama閱讀 45,767評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,945評(píng)論 3 336
  • 正文 我和宋清朗相戀三年驻售,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了露久。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,090評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡欺栗,死狀恐怖毫痕,靈堂內(nèi)的尸體忽然破棺而出征峦,到底是詐尸還是另有隱情,我是刑警寧澤消请,帶...
    沈念sama閱讀 35,785評(píng)論 5 346
  • 正文 年R本政府宣布栏笆,位于F島的核電站,受9級(jí)特大地震影響臊泰,放射性物質(zhì)發(fā)生泄漏蛉加。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,420評(píng)論 3 331
  • 文/蒙蒙 一缸逃、第九天 我趴在偏房一處隱蔽的房頂上張望针饥。 院中可真熱鬧,春花似錦需频、人聲如沸丁眼。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,988評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽户盯。三九已至,卻和暖如春饲化,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背吗伤。 一陣腳步聲響...
    開封第一講書人閱讀 33,101評(píng)論 1 271
  • 我被黑心中介騙來泰國打工吃靠, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人足淆。 一個(gè)月前我還...
    沈念sama閱讀 48,298評(píng)論 3 372
  • 正文 我出身青樓巢块,卻偏偏與公主長得像,于是被迫代替她去往敵國和親巧号。 傳聞我的和親對(duì)象是個(gè)殘疾皇子族奢,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,033評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容