方差分析用于研究一個或多個分類型自變量與一個數(shù)值型因變量的關系籍嘹。
方差分析通過檢驗多個總體的均值是否相等來判斷一個或多個分類型自變量對數(shù)值型因變量是否由顯著影響。
一荔烧、基本概念
1.因素
因素是一個獨立的變量得封,也就是方差分析研究的對象,也稱為因子仪糖。
2.水平
因素中的內(nèi)容稱為水平柑司,它是因素的具體表現(xiàn)。
因素的每一個水平可以看作是一個總體锅劝。
3.控制變量
在方差分析中攒驰,能夠人為控制的影響因素稱為控制因素,或控制變量故爵。
4.隨機變量
在方差分析中玻粪,人為很難控制的影響因素稱為隨機因素,或隨機變量。
5.觀察變量與觀察值
在方差分析中奶段,受控制因素和隨機因素影響的事物饥瓷,稱為觀察變量。在每個水平下得到的樣本數(shù)據(jù)稱為觀察值痹籍。
二呢铆、單因素方差分析
當方差分析中只涉及一個分類型自變量時稱為單因素方差分析。
1)提出假設
通過檢驗因素的k個水平均值是否相等蹲缠,來判斷自變量與因變量是否相關棺克。
H0: μ1=μ2=...=μi=...μk (自變量對因變量沒有顯著影響)
H1: μ1,μ2,....μk不全相等。(自變量對因變量有顯著影響)
2)構(gòu)造檢驗統(tǒng)計量
需要構(gòu)件三個誤差平方和线定,總平方和(SST)娜谊、組間平方和(SSA)和組內(nèi)平方和(SSA)。
且SST=SSA+SSE
SSE:每個水平或組的樣本數(shù)據(jù)與其組均值的誤差平方和芭商。公式為:
3)計算統(tǒng)計量
各平方誤差除以它們所對應的自由度派草,稱為均方。
SST的自由度為n-1铛楣,其中n為全部觀測值個數(shù)近迁;
SSA的自由度為k-1,k為因素水平的個數(shù)
SSE的自由度為n-k簸州。
MST=SST/n-1;
MSA=SSA/k-1;
MSE=SSE/n-k;
則F=MSA/MSE~F(k-1,n-k)分布鉴竭。
4)統(tǒng)計決策
在給定顯著性水平α下,計算F(k-1,n-k)分布的Fα岸浑,如果F>Fα搏存,則拒絕原假設,表明自變量對因變量影響顯著助琐。
R2越大祭埂,表明影響越顯著。
三兵钮、雙因素方差分析
如果存在兩個分類變量,需要分析是一個分類變量對因變量起作用舌界,還是兩個變量起作用掘譬,還是都不起作用。
(1)無交互作用或無重復雙因素方差分析
兩個因素是獨立的呻拌,不存在聯(lián)系葱轩。
1)提出假設(需要分別對行因素和列因素提出假設):
H0: μ1=μ2=...=μi=...μk (行因素自變量對因變量沒有顯著影響)
H1: μ1,μ2,....μk不全相等。(行因素自變量對因變量有顯著影響)
H0: μ1=μ2=...=μi=...μr (列因素自變量對因變量沒有顯著影響)
H1: μ1,μ2,....μr不全相等。(列因素自變量對因變量有顯著影響)
2)構(gòu)造檢驗統(tǒng)計量
其中靴拱,第一項為行因素產(chǎn)生的誤差平方和SSR(自由度為k-1):
第二項為列因素產(chǎn)生的誤差平方和SSC(自由度為r-1):
第三項為隨機誤差平方和SSE(自由度為(k-1)*(r-1)):
分別構(gòu)造行檢驗和列檢驗的F統(tǒng)計量:
3)統(tǒng)計決策
在給定顯著性水評α和兩個自由度值垃喊,分別查詢用于行檢驗和列檢驗F表的臨界值Fα。
若FR>Fα袜炕,則拒絕原假設本谜,認為行因素對因變量有顯著影響;
若FC>Fα偎窘,則拒絕原假設乌助,認為列因素對因變量有顯著影響。
4)關系強度度量