這里對組間差異的方法做個匯總
1 兩組間的比較
1.1 符合參數(shù)假設(shè),例如正態(tài)分布履恩。
獨立變量 t.test()
非獨立變量 t.test() 參數(shù)paired=T
1.2 非參數(shù)假設(shè),例如嚴(yán)重偏倚或者呈現(xiàn)有序關(guān)系
獨立變量 wilcox.test()
非獨立變量 wilcox.test() 參數(shù)paired=T
2 多于兩組的比較
2.1 符合參數(shù)假設(shè)
ANOVA
2.2 非參數(shù)假設(shè)
獨立變量 kruskal.test()
非獨立變量 friedman.test()
調(diào)用這些函數(shù)的方法都是相同的碳锈,以下函數(shù)都用f()表示混稽。
# 第一種方法
f(y~ x,data)
-y: 一個數(shù)值型變量
-x: 分組變量
-data: data=上述變量的數(shù)據(jù)框
#第二種方法 (僅用于兩組之間的比較)
f(y1,y2)
-y1: 一個數(shù)值變量
-y2: 另一個數(shù)值變量
下面舉個例子
state.x77數(shù)據(jù)集包含了1977年美國50個州的人口,收入宝当,文盲率等數(shù)據(jù)视事。
我想要知道美國四個地區(qū)的文盲率是否有顯著差異
# 首先將state.region和state.x77合并成一個數(shù)據(jù)框
> mytable <- data.frame(state.x77,state.region)
# 然后使用多組比較的非參數(shù)獨立變量方法
> kruskal.test(Illiteracy ~ state.region,data=mytable)
Kruskal-Wallis rank sum test
data: Illiteracy by state.region
Kruskal-Wallis chi-squared = 22.672, df = 3, p-value = 4.726e-05
p值小于0.001,說明美國四個地區(qū)的文盲率各不相同庆揩。