單因素方差分析是用來(lái)檢驗(yàn)3組或者3組以上的數(shù)據(jù)間是否有差異的的一種統(tǒng)計(jì)分析方法。比如下面用到的示例數(shù)據(jù):
探究三種不同的肥料是否對(duì)某種作物的產(chǎn)量有影響凿掂。做實(shí)驗(yàn)的時(shí)候就是將一塊地隨機(jī)劃分成若干小塊,分別施用3種不同的肥料,最終統(tǒng)計(jì)產(chǎn)量庄萎。最后用單因素方差分析檢驗(yàn)不同組之間的均值是否相等踪少。
單因素方差分析的零假設(shè)是不同處理間的均值沒(méi)有差異,如果計(jì)算得到的P值小于0.05糠涛,則拒絕原假設(shè)援奢,即不同處理間是有差異的
以下內(nèi)容參考
https://www.scribbr.com/statistics/anova-in-r/
使用到的數(shù)據(jù)也可以在上面的鏈接處獲取。
第一步是讀入數(shù)據(jù)
df<-read.csv("one_way_anova/crop.data.csv",header=T)
head(df)
df$fertilizer<-as.factor(df$fertilizer)
summary(df)
數(shù)據(jù)是3種肥料忍捡,每種肥料30個(gè)數(shù)據(jù)
單因素方差分析
> one.way<-aov(yield~fertilizer,data = df)
> summary(one.way)
Df Sum Sq Mean Sq F value Pr(>F)
fertilizer 2 6.07 3.0340 7.863 7e-04 ***
Residuals 93 35.89 0.3859
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
p值小于0.05集漾,不同肥料對(duì)應(yīng)的產(chǎn)量是有差異的。具體誰(shuí)和誰(shuí)之間是有差異的還不知道砸脊,還需要借助多重檢驗(yàn)具篇。
tukey.test<-TukeyHSD(one.way)
plot(tukey.test)
image.png
上圖的線只要跨0那條虛線說(shuō)明沒(méi)有差異。根據(jù)上圖可以看出肥料2和和肥料1對(duì)應(yīng)的產(chǎn)量沒(méi)有差異凌埂,3和2驱显,3和1有差異。
接下來(lái)用箱線圖展示結(jié)果
library(ggplot2)
ggplot(df,aes(x=fertilizer,y=yield))+
geom_boxplot(aes(fill=fertilizer),notch=T,width=0.5)+
geom_jitter(width=0.1)+theme_bw()+
theme(legend.position = "top")
image.png
最終得出的結(jié)論就是這三種肥料中3的效果最好侨舆。
歡迎大家關(guān)注我的公眾號(hào)
小明的數(shù)據(jù)分析筆記本
公眾號(hào)二維碼.jpg