1. 基礎概念及其定義
1.0 方差分析
方差分析背后的邏輯是以共同總體方差 的兩個獨立的估計量為基礎奉件。
的一個估計量是以樣本均值它們自己之間的變異性為依據(jù),
的另一個估計是每個樣本內部數(shù)據(jù)的變異性為依據(jù)惭载。通過比較
的這兩個估計量泊藕,我們能夠確定總體均值是否相等。
1.1 關鍵術語
- 因子(factor):即自變量。
- 處理(treatments):因子的不同水平胞谭。
- 單因子試驗:只涉及有
個總體或處理的一個因子的試驗垃杖。
- 響應變量:即應變量男杈。
- 完全隨機化設計:處理被隨機地指派給實驗單元的一種試驗設計。
1.2 方差分析的假定
- 對每個總體调俘,響應變量服從正態(tài)分布伶棒。
- 響應變量的方差對所有總體都是相同的。
- 觀測值必須是獨立的彩库。
1.3 完全隨機化設計的重要計算公式
假定從 個總體或處理中的每一個抽取一個容量為
的簡單隨機樣本肤无,對于得到的樣本數(shù)據(jù),令
代表第
個處理的第
個觀測值骇钦;
代表第
個處理的觀測值個數(shù)宛渐;
代表第
個處理的均值;
代表第
個處理的樣本方差眯搭;
代表第
個處理的樣本標準差窥翩。
第 個處理的樣本均值與樣本方差的計算公式如下:
總樣本均值的計算公式如下:
其中
若每個樣本的容量是相等的,都為 鳞仙,則
寇蚊,則
式簡化為
均方處理(mean square due to treatment, ):
其中,(sum of squares due to treatment)的計算公式如下:
若 為真棍好,則
給出了
的一個無偏估計仗岸。但是,如果
個總體均值不相等借笙,則
就不是
的無偏估計扒怖;在這種情形下,
將會高估總體方差
业稼。
均方誤差(mean square due to error, )
其中盗痒,(sum of squares due to error)的計算公式如下:
是以每個處理內部的變異性為依據(jù),它不受原假設是否為真的影響盼忌,因此积糯,
永遠給出
的一個無偏估計。
總平方和()
1.4 第一類錯誤概率
- 比較方式的第
類錯誤概率:與單個兩兩成對比較相聯(lián)系的犯第
類錯誤的概率谦纱。
- 實驗方式的第
類錯誤概率:若干個兩兩比較中至少有一個犯第
類錯誤的概率看成。
- 控制總的犯實驗方式第
類錯誤概率的
方法:如果我們想要檢驗
個成對的兩兩比較,并希望總的犯實驗方式第
類錯誤的最大概率為
跨嘉,那么犯比較方式錯誤概率為
川慌。
1.5 隨機化區(qū)組設計的重要計算公式
代表處理個數(shù),
代表區(qū)組個數(shù),
代表總樣本容量(
)梦重,
代表在區(qū)組
中對應于處理
的觀測值兑燥,
代表第
個處理的樣本均值,
代表第
個區(qū)組的樣本均值琴拧,
代表總樣本均值降瞳。
第 步:計算總平方和(
)
第 步:計算處理平方和(
)
第 步:計算區(qū)組平方和(
)
第 步:計算誤差平方和(
)
1.6 析因實驗的重要計算公式
代表因子
的水平數(shù)挣饥,
代表因子
的水平數(shù),
代表復制的個數(shù)沛膳,
代表實驗中觀測值的總數(shù)(
)扔枫,
對應于因子
的處理
和因子
的處理
的第
次復制的觀測值,
代表處理
(因子
)的觀測值的樣本均值锹安,
代表處理
(因子
)的觀測值的樣本均值短荐,
代表處理
(因子
)和處理
(因子
)的組合的觀測值的樣本均值,
代表總樣本均值叹哭。
第 步:計算總平方和(
)
第 步:計算因子
的平方和
第 步:計算因子
的平方和
第 步:計算交互作用的平方和
第 步:計算誤差平方和(
)
2. 完全隨機化實驗的方差分析
2.1 k個總體均值相等的檢驗
建立原假設與備擇假設
檢驗統(tǒng)計量
拒絕法則
值法:如果
值
讶踪,則拒絕
臨界值法:如果 ,則拒絕
其中泊交, 是分子自由度為
乳讥,分母自由度為
時,使
分布的上側面積或者概率為
時的
值廓俭。
2.2 方差分析表(ANOVA表)
完全隨機化設計的方差分析表
方差來源 | 平方和 | 自由度 | 均方 | F |
|
---|---|---|---|---|---|
處理 | |||||
誤差 | |||||
總計 |
2.3 多重比較的方法
多重比較方法是在成對的總體均值之間進行統(tǒng)計比較云石,以確定在 個均值之間到底哪幾個均值之間存在差異。
2.3.1 Fisher 的LSD方法
建立原假設與備擇假設
檢驗統(tǒng)計量
拒絕法則
值法:如果
值
研乒,則拒絕
臨界值法:如果 或者
汹忠,則拒絕
其中, 是自由度為
時雹熬,使
分布的上側面積為
時的
值宽菜。
2.3.2 基于檢驗統(tǒng)計量
的 Fisher 的LSD方法
建立原假設與備擇假設
檢驗統(tǒng)計量
顯著性水平 下的拒絕法則
如果 ,則拒絕
式中
其中竿报, 是自由度為
時铅乡,使
分布的上側面積為
時的
值。
2.4 應用 Fisher 的LSD方法的兩個總體均值之間的置信區(qū)間估計
式中
其中烈菌, 是自由度為
時阵幸,使
分布的上側面積為
時的
值花履。
如果式 的置信區(qū)間包含數(shù)值
,則我們不能拒絕兩個總體均值相等的原假設挚赊;如果式
的置信區(qū)間不包含數(shù)值
诡壁,則我們可以得出兩個總體均值之差存在差異的結論。
3. 隨機化區(qū)組設計的方差分析
區(qū)組劃分的過程就是對所有的處理使用相同的或者相似的實驗單元的過程荠割,區(qū)組劃分的目的是從誤差項中刪除來自外部的變異妹卿,因此給出了總體或處理均值之間是否存在差異的更有力的檢驗。
3.1 k個處理涨共,b個區(qū)組的隨機化區(qū)組設計的 ANOVA 表
方差來源 | 平方和 | 自由度 | 均方 | F |
|
---|---|---|---|---|---|
處理 | |||||
區(qū)組 | |||||
誤差 | |||||
總計 |
因為有 個區(qū)組使得自由度減少了
纽帖,所以隨機化區(qū)組設計的誤差自由度小于完全隨機化設計的誤差自由度宠漩。如果
很小举反,因為誤差自由度的減少,區(qū)組的潛在影響可能被掩蓋扒吁;當
很大時火鼻,這種影響被最小化了。
4. 析因實驗的方差分析
析因實驗的實驗設計方法允許我們得到有關兩個或者兩個以上因子同時存在的統(tǒng)計結論雕崩。
4.1 有r個復制的兩因子析因實驗的的 ANOVA 表
方差來源 | 平方和 | 自由度 | 均方 | F |
|
---|---|---|---|---|---|
因子 |
|||||
因子 |
|||||
交互作用 | |||||
誤差 | |||||
總計 |