我們比較的對象是南方和非南方各州,因變量為監(jiān)禁的概率晾匠。一個針對兩組的獨立樣本t檢驗可以用于檢驗兩個總體的均值相等的假設啦桌。這里的假設兩組數(shù)據(jù)是獨立的,并且是從正態(tài)總體中抽取的镣屹。檢驗的格式為
t.test(y ~ x, data),其中圃郊,y是一個數(shù)值型變量,x是一個二分變量
> library(MASS)
> t.test(Prob ~ So, data= UScrime)
? ? ? ? Welch Two Sample t-test
data:? Prob by So
t = -3.8954, df = 24.925, p-value = 0.0006506
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.03852569 -0.01187439
sample estimates:
mean in group 0 mean in group 1
? ? 0.03851265? ? ? 0.06371269
> #結果表明:南方各州的非南方各州擁有的監(jiān)禁概率是顯著不同的女蜈。其中p=0.000
> library(MASS)
> sapply(UScrime[c("U1","U2")],function(x)(c(mean=mean(x),sd=sd(x))))
? ? ? ? ? U1? ? ? U2
mean 95.46809 33.97872
sd? 18.02878? 8.44545
非獨立樣本樣本t檢驗的檢驗假定組間的差異描沟,格式為:
t.test(y1,y2,paried=TRUE)
其中,y1和y2為兩個非獨立的數(shù)值向量
> with(UScrime, t.test(U1, U2, paried=TRUE))
? ? ? ? Welch Two Sample t-test
data:? U1 and U2
t = 21.174, df = 65.261, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
55.69010 67.28862
sample estimates:
mean of x mean of y
95.46809? 33.97872
> #差異的均值(61.5)足夠大鞭光,可以保證拒絕年長和年輕男性的平均失業(yè)率相同的假設吏廉。年輕男性的失業(yè)率更高
R語言T檢驗的基本知識到這就結束了,咱們下期再見惰许!O(∩_∩)O哈哈~