方差分析是小編工作中最常用到的統(tǒng)計分析方法抑进,以往對于這個分析方法總是懵懵懂懂夕凝,在學(xué)習(xí)《R語言實戰(zhàn)》的過程中發(fā)現(xiàn)只有對統(tǒng)計知識的原理學(xué)深學(xué)透码秉,才能在運用R進(jìn)行分析時做到知其然并知其所以然转砖。因此府蔗,本文通過參考論著,百度搜索相關(guān)知識點等方式對方差分析的原理進(jìn)行了梳理不铆,且通過案例一步一步進(jìn)行最原始的計算誓斥,再在R中運行毕谴,對比結(jié)果以理解原理涝开。
方差分析的假設(shè)
原假設(shè)H0:不同組的均值相等。
備擇假設(shè)H1:至少一個樣本均值與其他均值不相等奕剃。
方差分析的3個前提假定條件
獨立性:每個樣本的個體相互獨立且隨機(jī)從總體中獲得。
正態(tài)性:每個組的值均服從正態(tài)分布操软。
方差齊性:每個組的樣本的方差之間沒有差異聂薪。
方差分析的基本思路
方差分析的基本思路是將數(shù)據(jù)波動(變異)分解為若干部分,除了有一部分代表隨機(jī)誤差翔悠,其余每個部分的變異分別代表了某個影響因素的作用(包括交互作用形成的因素)。通過比較因素所致的變異與隨機(jī)誤差的大小狞悲,借助F分布和F統(tǒng)計量做出推斷:該因素對因變量的影響是否顯著存在撮抓。F統(tǒng)計量=組間方差/組內(nèi)方差。
當(dāng)F統(tǒng)計量<1時摇锋,表示比較的樣本平均值之間沒有顯著差異丹拯,F(xiàn)統(tǒng)計量>1時站超,表示組間至少存在一組均值與其他組均值間的差異很大。
在判斷是否顯著時咽笼,常常給定顯著性水平顷编,分布對應(yīng)的臨界值為 ,當(dāng)時茅糜,拒絕。
方差分析推導(dǎo)公式
根據(jù)方差分析原理酥馍,總誤差可分解為組間誤差和組內(nèi)誤差施无,即:
:總誤差卓练,總離差平方和顽悼,其值越大甲雅,表示測定指標(biāo)值之間的差異越大妖枚;
:組間誤差,組間離差平方和,各個水平下樣本平均值與數(shù)據(jù)總平均差異的平方和,反映的是試驗因素的水平理論平均值不同而帶來的影響盯拱;
:組內(nèi)誤差蛮艰,組內(nèi)離差平方和袜刷,各個水平下钢拧,樣本觀察值與樣本均值差異的平方和。
式中,是因素的平均平方和,是對應(yīng)的自由度,為試驗因素設(shè)定的水平數(shù)。
式中,是隨機(jī)誤差的平均平方和,是對應(yīng)的自由度憋飞,為樣本數(shù)厘擂,也就是觀測值個數(shù)避凝,為因素設(shè)定的水平數(shù)倒脓。
F統(tǒng)計量的計算崎弃。
當(dāng) 時,接受原假設(shè)循集,否則接受備擇假設(shè)替蛉。是給定的顯著水平。
方差分析推導(dǎo)
以數(shù)據(jù)集df為例炼杖。 df數(shù)據(jù)集中nitrogen包含兩個水平灭返,N1和N2盗迟,試驗中測定變量v1坤邪,在兩個水平下分別測定12次,現(xiàn)在我們來檢驗試驗測定的變量v1在N1和N2條件下的均值是否差異顯著罚缕?
df <- read.table(file = "D:/Documents/R wd/df.csv", header = T, sep = ",") # 數(shù)據(jù)導(dǎo)入艇纺。
df # 查看數(shù)據(jù)。
## year nitrogen variety block v1 v2 v3 v4 v5
## 1 2020 N1 a 1 1.26 2.14 0.4 5.0 3.25
## 2 2020 N1 a 2 1.20 2.90 0.1 5.3 1.27
## 3 2020 N1 a 3 1.30 3.00 0.3 5.6 2.24
## 4 2020 N1 b 1 1.08 1.72 1.8 2.8 1.00
## 5 2020 N1 b 2 1.05 1.65 1.7 2.5 3.12
## 6 2020 N1 b 3 1.15 1.35 1.5 3.1 4.57
## 7 2020 N2 a 1 1.32 3.78 1.6 6.0 5.85
## 8 2020 N2 a 2 1.28 4.32 1.4 6.1 6.48
## 9 2020 N2 a 3 1.35 3.95 1.3 6.2 7.21
## 10 2020 N2 b 1 1.33 3.47 2.8 4.1 6.56
## 11 2020 N2 b 2 1.28 2.72 2.4 4.3 8.43
## 12 2020 N2 b 3 1.30 3.90 2.2 4.5 7.55
## 13 2021 N1 a 1 1.19 3.61 0.8 6.0 3.11
## 14 2021 N1 a 2 1.21 3.29 0.5 5.7 2.54
## 15 2021 N1 a 3 1.24 3.26 0.7 5.6 1.28
## 16 2021 N1 b 1 1.09 2.71 1.8 4.0 3.24
## 17 2021 N1 b 2 1.28 2.32 1.6 4.2 1.27
## 18 2021 N1 b 3 1.35 1.95 1.3 4.3 1.15
## 19 2021 N2 a 1 1.45 4.35 1.8 7.2 5.74
## 20 2021 N2 a 2 1.40 3.80 1.2 7.0 6.85
## 21 2021 N2 a 3 1.37 4.23 1.6 6.8 7.42
## 22 2021 N2 b 1 1.28 2.72 2.4 5.1 8.20
## 23 2021 N2 b 2 1.15 3.35 2.5 5.5 5.70
## 24 2021 N2 b 3 1.24 3.46 2.7 4.9 6.00
研究對象信息表
nitrogen | v1() | 合計 | 平均 |
---|---|---|---|
1.26 1.20 1.30 1.08 1.05 1.15 1.19 1.21 1.24 1.09 1.28 1.35 | 14.40 | 1.20 | |
1.32 1.28 1.35 1.33 1.28 1.30 1.45 1.40 1.37 1.28 1.15 1.24 | 15.75 | 1.31 | |
合計 =30.15 |
下面按照方差分析的思路進(jìn)行一步一步的推導(dǎo)邮弹。
1黔衡、提出假設(shè)
H0:v1在N1和N2條件下的均值相等。
H1:v1在N1和N2條件下的均值不相等腌乡。
2盟劫、計算各組平均值
df7 <- df[order(df$nitrogen),] # 先對df以nitrogen進(jìn)行排序。
df7 # 返回排序后結(jié)果与纽。
## year nitrogen variety block v1 v2 v3 v4 v5
## 1 2020 N1 a 1 1.26 2.14 0.4 5.0 3.25
## 2 2020 N1 a 2 1.20 2.90 0.1 5.3 1.27
## 3 2020 N1 a 3 1.30 3.00 0.3 5.6 2.24
## 4 2020 N1 b 1 1.08 1.72 1.8 2.8 1.00
## 5 2020 N1 b 2 1.05 1.65 1.7 2.5 3.12
## 6 2020 N1 b 3 1.15 1.35 1.5 3.1 4.57
## 13 2021 N1 a 1 1.19 3.61 0.8 6.0 3.11
## 14 2021 N1 a 2 1.21 3.29 0.5 5.7 2.54
## 15 2021 N1 a 3 1.24 3.26 0.7 5.6 1.28
## 16 2021 N1 b 1 1.09 2.71 1.8 4.0 3.24
## 17 2021 N1 b 2 1.28 2.32 1.6 4.2 1.27
## 18 2021 N1 b 3 1.35 1.95 1.3 4.3 1.15
## 7 2020 N2 a 1 1.32 3.78 1.6 6.0 5.85
## 8 2020 N2 a 2 1.28 4.32 1.4 6.1 6.48
## 9 2020 N2 a 3 1.35 3.95 1.3 6.2 7.21
## 10 2020 N2 b 1 1.33 3.47 2.8 4.1 6.56
## 11 2020 N2 b 2 1.28 2.72 2.4 4.3 8.43
## 12 2020 N2 b 3 1.30 3.90 2.2 4.5 7.55
## 19 2021 N2 a 1 1.45 4.35 1.8 7.2 5.74
## 20 2021 N2 a 2 1.40 3.80 1.2 7.0 6.85
## 21 2021 N2 a 3 1.37 4.23 1.6 6.8 7.42
## 22 2021 N2 b 1 1.28 2.72 2.4 5.1 8.20
## 23 2021 N2 b 2 1.15 3.35 2.5 5.5 5.70
## 24 2021 N2 b 3 1.24 3.46 2.7 4.9 6.00
xT <- mean(df7$v1) # v1總平均值侣签。
xT # 返回結(jié)果。
## [1] 1.25625
xA <- mean(df7$v1[1:12]) # N1條件下v1的平均值急迂。
xA # 返回結(jié)果影所。
## [1] 1.2
xE <- mean(df7$v1[13:24]) # N2條件下v1的平均值。
xE # 返回結(jié)果僚碎。
## [1] 1.3125
3猴娩、計算各誤差平方和
SST <- sum((df7$v1-xT)^2) # 總平方和SST。
SST # 返回結(jié)果。
## [1] 0.2383625
SSA <- 12*(xA-xT)^2+12*(xE-xT)^2 # 組間平方和卷中。
SSA # 返回結(jié)果矛双。
## [1] 0.0759375
SSE <- sum((df7$v1[1:12]-xA)^2)+sum((df7$v1[13:24]-xE)^2)# 組內(nèi)平方和。
SSE # 返回結(jié)果蟆豫。
## [1] 0.162425
4背零、計算F統(tǒng)計量
SST的自由度為,為觀測值的個數(shù)无埃;
SSA的自由度為徙瓶,為因素水平的個數(shù);
SSE的自由度為嫉称。
MSA <- SSA/(2-1) # 組間均方誤差侦镇。
MSA # 返回結(jié)果。
## [1] 0.0759375
MSE <- SSE/(24-2) # 組內(nèi)均方誤差织阅。
MSE # 返回結(jié)果壳繁。
## [1] 0.007382955
F <- MSA/MSE # 計算統(tǒng)計量F。
F # 返回F值結(jié)果荔棉。
## [1] 10.28552
經(jīng)查表闹炉,,本例中計算得10.28552润樱,大于臨界值渣触,因此拒絕原假設(shè),接受備擇假設(shè)壹若,說明v1在N1和N2條件下的平均值是有顯著差異的嗅钻。
5、p值計算
library(stats) # 調(diào)用stats包店展,這個包應(yīng)該是集成在R基礎(chǔ)包中的吧养篓。
1-pf(10.29,1,22) # pf中第一項填計算得的F值,第2項為組間自由度赂蕴,第3項為組內(nèi)差異的自由度柳弄。
## [1] 0.004056791
可以看出,p值小于0.05概说,說明v1在N1和N2條件下的平均值間差異顯著碧注。
下面按照《R語言實戰(zhàn)》中的操作步驟再來分析一下,對比一下結(jié)果席怪。
9.3 單因素方差分析
單因素方差分析中应闯,你感興趣的是比較分類因子定義的兩個或多個組別中的因變量均值。
對于完全隨機(jī)設(shè)計試驗且處理數(shù)大于2時可以用單因素方差分析(等于2 時用t檢驗)挂捻。
df # 顯示數(shù)據(jù)df碉纺。
## year nitrogen variety block v1 v2 v3 v4 v5
## 1 2020 N1 a 1 1.26 2.14 0.4 5.0 3.25
## 2 2020 N1 a 2 1.20 2.90 0.1 5.3 1.27
## 3 2020 N1 a 3 1.30 3.00 0.3 5.6 2.24
## 4 2020 N1 b 1 1.08 1.72 1.8 2.8 1.00
## 5 2020 N1 b 2 1.05 1.65 1.7 2.5 3.12
## 6 2020 N1 b 3 1.15 1.35 1.5 3.1 4.57
## 7 2020 N2 a 1 1.32 3.78 1.6 6.0 5.85
## 8 2020 N2 a 2 1.28 4.32 1.4 6.1 6.48
## 9 2020 N2 a 3 1.35 3.95 1.3 6.2 7.21
## 10 2020 N2 b 1 1.33 3.47 2.8 4.1 6.56
## 11 2020 N2 b 2 1.28 2.72 2.4 4.3 8.43
## 12 2020 N2 b 3 1.30 3.90 2.2 4.5 7.55
## 13 2021 N1 a 1 1.19 3.61 0.8 6.0 3.11
## 14 2021 N1 a 2 1.21 3.29 0.5 5.7 2.54
## 15 2021 N1 a 3 1.24 3.26 0.7 5.6 1.28
## 16 2021 N1 b 1 1.09 2.71 1.8 4.0 3.24
## 17 2021 N1 b 2 1.28 2.32 1.6 4.2 1.27
## 18 2021 N1 b 3 1.35 1.95 1.3 4.3 1.15
## 19 2021 N2 a 1 1.45 4.35 1.8 7.2 5.74
## 20 2021 N2 a 2 1.40 3.80 1.2 7.0 6.85
## 21 2021 N2 a 3 1.37 4.23 1.6 6.8 7.42
## 22 2021 N2 b 1 1.28 2.72 2.4 5.1 8.20
## 23 2021 N2 b 2 1.15 3.35 2.5 5.5 5.70
## 24 2021 N2 b 3 1.24 3.46 2.7 4.9 6.00
str(df) # 查看數(shù)據(jù)結(jié)構(gòu)。
## 'data.frame': 24 obs. of 9 variables:
## $ year : int 2020 2020 2020 2020 2020 2020 2020 2020 2020 2020 ...
## $ nitrogen: chr "N1" "N1" "N1" "N1" ...
## $ variety : chr "a" "a" "a" "b" ...
## $ block : int 1 2 3 1 2 3 1 2 3 1 ...
## $ v1 : num 1.26 1.2 1.3 1.08 1.05 1.15 1.32 1.28 1.35 1.33 ...
## $ v2 : num 2.14 2.9 3 1.72 1.65 1.35 3.78 4.32 3.95 3.47 ...
## $ v3 : num 0.4 0.1 0.3 1.8 1.7 1.5 1.6 1.4 1.3 2.8 ...
## $ v4 : num 5 5.3 5.6 2.8 2.5 3.1 6 6.1 6.2 4.1 ...
## $ v5 : num 3.25 1.27 2.24 1 3.12 4.57 5.85 6.48 7.21 6.56 ...
df$nitrogen <- as.factor(df$nitrogen) # 設(shè)置nitrogen為因子。
table(df$nitrogen) # 顯示nitrogen各組樣本大小骨田。
##
## N1 N2
## 12 12
aggregate(df$v1, by=list(df$nitrogen), FUN=mean) # nitrogen各組的均值耿导。
## Group.1 x
## 1 N1 1.2000
## 2 N2 1.3125
aggregate(df$v1, by=list(df$nitrogen), FUN=sd) # nitrogen各組的標(biāo)準(zhǔn)差。
## Group.1 x
## 1 N1 0.09332251
## 2 N2 0.07782556
fit10 <- aov(df$v1 ~ df$nitrogen) # 檢驗組間差異态贤。
summary(fit10) # 顯示結(jié)果舱呻。
## Df Sum Sq Mean Sq F value Pr(>F)
## df$nitrogen 1 0.07594 0.07594 10.29 0.00406 **
## Residuals 22 0.16243 0.00738
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
這里可以看到,前面小編一步一步核算的結(jié)果悠汽,只用一行代碼就得到了箱吕,df為自由度,組間自由度為1柿冲,組內(nèi)自由度為22茬高;組間離均差平方和Sum Sq中df-nitrogen為0.07594,對應(yīng)前面單獨核算的SSA假抄,組內(nèi)離均差平方和Sum Sq中Residuals為0.16243怎栽,對應(yīng)前面單獨核算的SSE;組間均平方和Mean Sq中df-nitrogen為0.07594宿饱,對應(yīng)前面單獨核算的MSA熏瞄,組內(nèi)均平方和Mean Sq中Residuals為0.00738,對應(yīng)前面單獨核算的MSE谬以,F(xiàn) value為10.29强饮,對應(yīng)前面單獨核算的F;Pr(>F)為0.00406蛉签,對應(yīng)前面單獨核算的1-pf(10.29,1,22) 結(jié)果胡陪。
gplots包中的plotmeans()可以用來繪制帶有置信區(qū)間的組均值圖形。
library(gplots) # 調(diào)用gplots包碍舍。
plotmeans(df$v1 ~ df$nitrogen, xlab = "nitrogen", ylab = "v1", main = "Mean Plot\nwith 95% CI") # 繪制各組均值及置信區(qū)間。
9.3.1 多重比較
多重比較(multiple comparisons)是指方差分析后對各樣本平均數(shù)間是否有顯著差異的假設(shè)檢驗的統(tǒng)稱邑雅。方差分析只能判斷各總體平均數(shù)間是否有差異片橡,多重比較可用來進(jìn)一步確定哪兩個平均數(shù)間有差異,哪兩個平均數(shù)間沒有差異淮野。比較方法有N-K(Newman-Keuls)檢驗捧书、鄧肯(DunCan)檢驗、圖基(Tukey)檢驗鄧尼特(Dunnett)檢驗骤星、最小顯著差檢驗及謝費(Scheffé)檢驗等它們的理論依據(jù)和應(yīng)用條件都有所不同经瓷。
多重比較的方法很多,根據(jù)試驗設(shè)計的目的不同有不同的應(yīng)用洞难。
若試驗設(shè)計之初舆吮,便明確要比較某幾個組均數(shù)間是否有差異,稱為事前比較。常用的事前比較方法有LSD色冀、Bonferroni和Dunnett法潭袱。
若研究目的是方差分析有統(tǒng)計學(xué)差異后,想知道哪些組間的均數(shù)有差異锋恬,便是事后比較屯换。事后比較的常用方法有SNK、Turkey与学、Scheffe 和Bonferroni法彤悔。
LSD檢驗適用于在專業(yè)上有特殊意義的樣本均數(shù)間的比較,是在設(shè)計之初索守,就已明確要比較某幾個組均數(shù)間是否有差異蜗巧。
Bonferroni檢驗用途最廣,幾乎可用于任何多重比較的情形蕾盯。一般認(rèn)為Bonferroni法是最為保守的幕屹。
Dunnett-t檢驗由multcomp包中g(shù)lht()函數(shù)實現(xiàn),適用于k-1個試驗組與一個對照組均數(shù)差異的多重比較级遭。
SNK-q檢驗適用于多個樣本均數(shù)兩兩之間的全面比較望拖,與LSD-t檢驗相似,可能存在假陽性挫鸽。
Tukey法較LSD法保守说敏,即較LSD不易發(fā)現(xiàn)顯著差異。Tukey法要求比較的樣本容量相差不大丢郊,一般用于樣本容量相同的組之間均數(shù)的比較盔沫。
Scheffe檢驗在各組樣本數(shù)相等或不等均可以使用,但是以各組樣本數(shù)不相等時使用較多枫匾。
Duncan法的全稱為Duncan's new multiple range test (MRT)架诞,也稱為新復(fù)極差法。該方法是對SNK法的修正干茉,但是提高了一類錯誤概率谴忧,降低了二類錯誤的概率,通常用于農(nóng)業(yè)研究角虫。
注意TukeyHSD()函數(shù)與本章使用的HH包存在兼容性問題:若載入HH包沾谓,TukeyHSD()函數(shù)將會失效。使用detach("package::HH")將它從搜尋路徑中刪除戳鹅,然后再調(diào)用TukeyHSD()均驶。
TukeyHSD(fit10) # 成對組間比較。
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = df$v1 ~ df$nitrogen)
##
## $`df$nitrogen`
## diff lwr upr p adj
## N2-N1 0.1125 0.03975191 0.1852481 0.0040635
par(las = 2) # 扭轉(zhuǎn)軸標(biāo)簽枫虏。
plot(TukeyHSD(fit10), xlim=c(0,0.2)) # 成對比較圖形妇穴。
圖形中置信區(qū)間包含0的療法說明差異不顯著(p>0.05)爬虱。
multcomp包中的glht()函數(shù)提供了多重均值比較更為全面的方法,既適用于線性模型伟骨,也適用于廣義線性模型饮潦。
df # 顯示數(shù)據(jù)。
## year nitrogen variety block v1 v2 v3 v4 v5
## 1 2020 N1 a 1 1.26 2.14 0.4 5.0 3.25
## 2 2020 N1 a 2 1.20 2.90 0.1 5.3 1.27
## 3 2020 N1 a 3 1.30 3.00 0.3 5.6 2.24
## 4 2020 N1 b 1 1.08 1.72 1.8 2.8 1.00
## 5 2020 N1 b 2 1.05 1.65 1.7 2.5 3.12
## 6 2020 N1 b 3 1.15 1.35 1.5 3.1 4.57
## 7 2020 N2 a 1 1.32 3.78 1.6 6.0 5.85
## 8 2020 N2 a 2 1.28 4.32 1.4 6.1 6.48
## 9 2020 N2 a 3 1.35 3.95 1.3 6.2 7.21
## 10 2020 N2 b 1 1.33 3.47 2.8 4.1 6.56
## 11 2020 N2 b 2 1.28 2.72 2.4 4.3 8.43
## 12 2020 N2 b 3 1.30 3.90 2.2 4.5 7.55
## 13 2021 N1 a 1 1.19 3.61 0.8 6.0 3.11
## 14 2021 N1 a 2 1.21 3.29 0.5 5.7 2.54
## 15 2021 N1 a 3 1.24 3.26 0.7 5.6 1.28
## 16 2021 N1 b 1 1.09 2.71 1.8 4.0 3.24
## 17 2021 N1 b 2 1.28 2.32 1.6 4.2 1.27
## 18 2021 N1 b 3 1.35 1.95 1.3 4.3 1.15
## 19 2021 N2 a 1 1.45 4.35 1.8 7.2 5.74
## 20 2021 N2 a 2 1.40 3.80 1.2 7.0 6.85
## 21 2021 N2 a 3 1.37 4.23 1.6 6.8 7.42
## 22 2021 N2 b 1 1.28 2.72 2.4 5.1 8.20
## 23 2021 N2 b 2 1.15 3.35 2.5 5.5 5.70
## 24 2021 N2 b 3 1.24 3.46 2.7 4.9 6.00
attach(df)
fit10 <- aov(v1 ~ nitrogen) # 差異顯著性檢驗携狭。
library(multcomp) # 調(diào)用multcomp包继蜡。
par(mar=c(5,4,6,2)) # 擴(kuò)展圖形邊界。
tuk <- glht(fit10, linfct=mcp(nitrogen="Tukey")) # 多重比較逛腿。
plot(cld(tuk, level=0.05), col = "red")
有相同字母的組(用箱線圖表示)說明均值差異不顯著稀并。
結(jié)果解讀:本研究中N1和N2標(biāo)注分別為a和b,無相同字母单默,說明差異顯著碘举。
9.3.2 評估檢驗的假設(shè)條件
我們對于結(jié)果的信心依賴于做統(tǒng)計檢驗時數(shù)據(jù)滿足假設(shè)條件的程度。單因素方差分析中搁廓,我們假設(shè)因變量服從正態(tài)分布引颈,各組方差相等。
正態(tài)性檢驗
library(car) # 調(diào)用car包境蜕。
qqPlot(lm(v1 ~ nitrogen), data = df, simulate=TRUE, main="Q-Q Plot", labels=FALSE) # 繪制QQ圖判斷數(shù)據(jù)正態(tài)性蝙场。
數(shù)據(jù)落在95%的置信區(qū)間范圍內(nèi),說明滿足正態(tài)性假設(shè)粱年。
結(jié)果解讀:所有數(shù)據(jù)點均落在置信區(qū)間內(nèi)售滤,說明數(shù)據(jù)符合正態(tài)分布。
方差齊性檢驗
bartlett.test(v1 ~ nitrogen, data = df) # 方差齊性檢驗台诗。
##
## Bartlett test of homogeneity of variances
##
## data: v1 by nitrogen
## Bartlett's K-squared = 0.34507, df = 1, p-value = 0.5569
結(jié)果解讀:p值為0.56完箩,說明N1和N2之間的方差并沒有顯著不同。
離群點檢測
library(car) # 調(diào)用car包拉队。
outlierTest(fit10) # 離群點檢測弊知。
## No Studentized residuals with Bonferroni p < 0.05
## Largest |rstudent|:
## rstudent unadjusted p-value Bonferroni p
## 23 -2.127769 0.045366 NA
結(jié)果解讀:(當(dāng)p>1時將產(chǎn)生NA),說明本研究中無離群點氏仗。
實際應(yīng)用中吉捶,還可以用lm進(jìn)行差異分析。
summary(lm(v1~nitrogen,data = df)) # 用lm函數(shù)進(jìn)行方差分析皆尔。
##
## Call:
## lm(formula = v1 ~ nitrogen, data = df)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.16250 -0.03687 0.00375 0.05813 0.15000
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.20000 0.02480 48.379 < 2e-16 ***
## nitrogenN2 0.11250 0.03508 3.207 0.00406 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.08592 on 22 degrees of freedom
## Multiple R-squared: 0.3186, Adjusted R-squared: 0.2876
## F-statistic: 10.29 on 1 and 22 DF, p-value: 0.004063
可以看出最后的p值結(jié)果是一致的
因為本例中只有兩個處理,小編認(rèn)為也可以用t檢驗币励。
t.test(v1~nitrogen,data = df) # 用t檢驗檢測結(jié)果慷蠕。
##
## Welch Two Sample t-test
##
## data: v1 by nitrogen
## t = -3.2071, df = 21.312, p-value = 0.004178
## alternative hypothesis: true difference in means between group N1 and group N2 is not equal to 0
## 95 percent confidence interval:
## -0.18538442 -0.03961558
## sample estimates:
## mean in group N1 mean in group N2
## 1.2000 1.3125
雖然p值不同,但結(jié)果都是差異顯著
參考資料:
- 《R語言實戰(zhàn)》(中文版)食呻,人民郵電出版社流炕,2013.
- 如何理解和使用方差分析澎现,https://zhuanlan.zhihu.com/p/49479042
- 第十四講 R-單因素方差分析1,https://mp.weixin.qq.com/s?__biz=MzU1Mzc3OTIwNg==&mid=2247488583&idx=2&sn=de31ac2282e9204f8b9500c8071f276a&chksm=fbecfd2ecc9b743815227ace281f424ca97812cc89f9103420e29dbae9117b8405904ddbab3b&scene=21#wechat_redirect
- R語言統(tǒng)計與繪圖:組間差異的多重比較每辟,https://www.sci666.com.cn/58293.html
- 方差分析之多重比較剑辫,https://zhuanlan.zhihu.com/p/44880434