大數(shù)據(jù)統(tǒng)計(jì)基礎(chǔ)之F分布及其應(yīng)用
1. F分布
研究A吁伺、B龄句、C三種不同學(xué)校學(xué)生的閱讀理解成績找到一種解決的辦法其障,有人可能會(huì)以為,只要多次使用Z
檢驗(yàn)或t
檢驗(yàn)犹菱,比較成對比較學(xué)校(或條件)即可。但是我們不會(huì)這樣來處理秋度。因?yàn)?code>Z檢驗(yàn)或t
檢驗(yàn)有其局限性都伪。
1.1. Z
檢驗(yàn)和t
檢驗(yàn)的局限性
當(dāng)研究中出現(xiàn)兩個(gè)以上的平均數(shù)時(shí)最欠,用Z檢驗(yàn)和t檢驗(yàn)會(huì)有以下一些不足示罗。
- 1.比較的組合次數(shù)增多
如上所述,若把三所學(xué)校成對比較芝硬,則需對A校與B校蚜点,B校與C校,C校與A校做檢驗(yàn)拌阴,這時(shí)我們所做的檢驗(yàn)是三次而不是一次绍绘。如果一次研究10個(gè)學(xué)校,其檢驗(yàn)數(shù)就會(huì)達(dá)到45個(gè)之多迟赃。事實(shí)上我們只需要一個(gè)可以讓我們同時(shí)處理兩種以上條件的單獨(dú)檢驗(yàn)陪拘。
- 2.降低可靠程度
因?yàn)閷?shù)據(jù)做得Z檢驗(yàn)或t檢驗(yàn)越多,我們更容易犯Ⅰ型錯(cuò)誤纤壁。在一個(gè)檢驗(yàn)中左刽,α=0.05,意味著有0.05的可能性犯Ⅰ型錯(cuò)誤酌媒,即有1-α=0.95的概率不犯Ⅰ型錯(cuò)誤欠痴。如果我們做兩次檢驗(yàn)迄靠,每次都為0.05的顯著性水平,那么不犯Ⅰ型錯(cuò)誤的概率就變?yōu)?.95×0.95=0.90喇辽。此時(shí)犯Ⅰ型錯(cuò)誤的概率則為1-0.90=0.10掌挚,即至少犯一次Ⅰ型錯(cuò)誤的概率翻了一倍。若做10次檢驗(yàn)的話菩咨,至少犯一次Ⅰ型錯(cuò)誤的概率將上升到0.40(1-0.952)吠式,而10次檢驗(yàn)結(jié)論中都正確的概率只有60%。所以說采用Z檢驗(yàn)或t檢驗(yàn)隨著均數(shù)個(gè)數(shù)的增加旦委,其組合次數(shù)增多奇徒,從而降低了統(tǒng)計(jì)推論可靠性的概率,增大了犯錯(cuò)誤的概率缨硝。
若想要若干檢驗(yàn)的總顯著性水平仍為0.05的話摩钙,一種做法就是為每一獨(dú)立檢驗(yàn)設(shè)置更為保守的顯著性水平。譬如查辩,若進(jìn)行5次檢驗(yàn)胖笛,為了使總的犯Ⅰ型錯(cuò)誤的風(fēng)險(xiǎn)仍為0.05,則每一個(gè)獨(dú)立檢驗(yàn)的顯著性水平需設(shè)為p=0.01(因?yàn)?-0.99×0.99×0.99×0.99×0.99=0.05)宜岛。另一種可替代的方法就是設(shè)計(jì)一種能使總顯著性水平始終0.05的單一檢驗(yàn)长踊,即方差分析。
- 3.缺少綜合或整體信息
兩個(gè)以上的平均數(shù)檢驗(yàn)中若仍采用Z檢驗(yàn)或t檢驗(yàn)都只提供了兩個(gè)組所提供的信息萍倡,而忽略了其余的綜合信息身弊。然而在許多情況下這些被忽視的信息可能對檢驗(yàn)結(jié)果產(chǎn)生更大的影響力。同時(shí)在十次檢驗(yàn)之后所得到只是零散的信息列敲,并非從總體來分析幾種不同條件的效果阱佛,也難以獲得幾種不同條件的直接答案。
1.2. 方差分析的含義與假設(shè)
所謂方差分析(analysis of variance)就是對多個(gè)平均數(shù)進(jìn)行比較的一種統(tǒng)計(jì)方法戴而,又稱變異數(shù)分析凑术,即ANOVA。它與實(shí)驗(yàn)設(shè)計(jì)緊密相聯(lián)所意,實(shí)驗(yàn)設(shè)計(jì)不同淮逊,方差分析的方法也有所不同。
以下三條假設(shè)在進(jìn)行方差分析時(shí)是非常關(guān)鍵的扶踊。否則易產(chǎn)生錯(cuò)誤的統(tǒng)計(jì)結(jié)論泄鹏。
- 1.總體分布的正態(tài)性
方差分析與Z檢驗(yàn)或t檢驗(yàn)一樣,也要求樣本必須來自正態(tài)分布的總體秧耗。在心理與教育研究領(lǐng)域命满,大多數(shù)變量是可以假設(shè)其總體服從正態(tài)分布的。因此在一般進(jìn)行方差分析時(shí)并不要求檢驗(yàn)總體的正態(tài)性绣版。
但是當(dāng)我們有確實(shí)的證據(jù)證明總體分布不正態(tài)時(shí)胶台,就需要對數(shù)據(jù)進(jìn)行一些處理歼疮,譬如采用某種方式進(jìn)行數(shù)據(jù)的轉(zhuǎn)換,轉(zhuǎn)換后的數(shù)據(jù)分布呈正態(tài)分布后再作方法分析诈唬,或者可進(jìn)行非參數(shù)的方差分析韩脏。
- 2.各個(gè)實(shí)驗(yàn)組的方差齊性
方差分析要求各總體的方差或標(biāo)準(zhǔn)差相同。如若總體方差不一致铸磅,那么方差分析得出差異顯著結(jié)論時(shí)就無法進(jìn)行很好的回因分析赡矢。譬如,某校在實(shí)驗(yàn)班和普通班進(jìn)行教學(xué)方法的實(shí)驗(yàn)阅仔,以新方法施教于實(shí)驗(yàn)班吹散,以傳統(tǒng)方法施教于普通班。實(shí)驗(yàn)結(jié)束后發(fā)現(xiàn)兩班成績差異非常顯著八酒,然而這種差異究竟是教法不同造成的空民,還是兩班學(xué)生原有學(xué)習(xí)水平不同引起的,我們無法回答這個(gè)問題羞迷。因此界轩,方差分析前需對各樣本的方差做一致性檢驗(yàn),稱方差齊性檢驗(yàn)衔瓮,只有滿足了方差齊性的條件才可做方差分析浊猾。
- 3.變異具有加可性
變異具有可加性是方差分析中的又一重要假設(shè)。眾所周知热鞍,影響事物的因素是多種多樣的葫慎,方差分析是將事物的總變異分解為各個(gè)不同變異來源,分解后的各部分變異是相互獨(dú)立薇宠,相加后又構(gòu)成總變異偷办。
1.3. 方差分析的過程
方差分析的過程有廣義與狹義之分。廣義的方差分析包括了方差的齊性檢驗(yàn)昼接,F(xiàn)檢驗(yàn)和多重比較(逐對平均數(shù)的比較)。狹義的方差分析僅指F檢驗(yàn)悴晰,其內(nèi)容有建立假設(shè)慢睡、計(jì)算檢驗(yàn)值(變異的平方和、自由度铡溪、均方和F值)漂辐、統(tǒng)計(jì)決策和制作方差分析表。
2. F分布的應(yīng)用——方差的同質(zhì)性檢驗(yàn)
2.1. 方差分析的基本原理
假設(shè)從一個(gè)學(xué)習(xí)方法實(shí)驗(yàn)中抽取了9名被試的學(xué)習(xí)成績棕硫,如表1所示髓涯。隨后又抽取了9名被試的學(xué)習(xí)成績,如表2所示哈扮。你能從這些數(shù)據(jù)發(fā)現(xiàn)什么問題嗎纬纪?
表1:第1次抽取結(jié)果:
方法 | 學(xué)生實(shí)驗(yàn)成績 | 學(xué)生實(shí)驗(yàn)成績 | 學(xué)生實(shí)驗(yàn)成績 | $\overline X $ | ${\overline X _{\rm{t}}}$ |
---|---|---|---|---|---|
A | 6 | 5 | 7 | 6 | |
B | 11 | 9 | 10 | 10 | 7 |
C | 5 | 4 | 6 | 5 |
表2:第2次抽取結(jié)果:
方法 | 學(xué)生實(shí)驗(yàn)成績 | 學(xué)生實(shí)驗(yàn)成績 | 學(xué)生實(shí)驗(yàn)成績 | $\overline X $ | ${\overline X _{\rm{t}}}$ |
---|---|---|---|---|---|
A | 1 | 7 | 4 | 4 | |
B | 6 | 2 | 8 | 6 | 5 |
C | 3 | 6 | 5 | 6 |
首先蚓再,從以上數(shù)據(jù)可看出,不僅組與組之間存在不同包各,而且同一組內(nèi)部也存在著不同摘仅。組與組之間的差異稱組間變異(variation between classes),反映在各組的平均數(shù)不同问畅。同一組內(nèi)部被試(個(gè)體)之間的差異稱組內(nèi)變異(variation within class)娃属,反映在每一個(gè)人的分?jǐn)?shù)不同。
其次护姆,從組間變異看矾端,表1的組間變異大于表2。如表1中A卵皂、B秩铆、C的組平均數(shù)與總平均數(shù)分別相差1、4渐裂、2分豺旬,表2中的三組平均數(shù)總平均差1分。
再次柒凉,從看組內(nèi)變異看(各組原始分與組平均數(shù)比較)族阅,表1各組原始分與組平均基本差1分,表2各組原始分與組平均數(shù)最大有4分之差膝捞。
綜上所述坦刀,表1組間變異較大而組內(nèi)變異較小,表2組間變異較小而組內(nèi)變異較大蔬咬±鹨#可見,組間變異的大小與組內(nèi)變異的大小并非正比關(guān)系林艘。這一現(xiàn)象表明盖奈,如果組間變異相對較大,而組內(nèi)變異相對較小狐援,則各組平均數(shù)的變異越明顯钢坦,即若組間變異與組內(nèi)變異的比率越大,各組平均數(shù)的差異越大啥酱。因此爹凹,通過組間變異和組內(nèi)變異比率大小來推論幾個(gè)相應(yīng)平均數(shù)差異顯著性的思想就是方差分析的邏輯依據(jù)或基本原理。所以說镶殷,方差分析是將實(shí)驗(yàn)中的總變異分解為組間變異和組內(nèi)變異禾酱,并通過組間變異和組內(nèi)變異比率的比較來確定影響實(shí)驗(yàn)結(jié)果因素的數(shù)學(xué)方法,其實(shí)質(zhì)是以方差來表示變異的程度。
在方差分析中颤陶,引起組間變異的主要原因是實(shí)驗(yàn)者所施加的實(shí)驗(yàn)條件和隨機(jī)誤差颗管,這種隨機(jī)誤差是由于一些偶然因素引起的。引起組內(nèi)變異的主要原因則是被試間的個(gè)體差異和實(shí)驗(yàn)誤差等指郁,也屬隨機(jī)因素的影響忙上,因此也可看作是一種隨機(jī)誤差。
總變異的分解:
總變異 = 組間變異+組內(nèi)變異
組間變異 = 實(shí)驗(yàn)條件 + 隨機(jī)誤差
組內(nèi)變異 = 個(gè)體差異 + 實(shí)驗(yàn)誤差 闲坎。組內(nèi)誤差都是隨機(jī)誤差疫粥。
如果組間與組內(nèi)變異均為隨機(jī)誤差時(shí),二者的比率為1腰懂,即實(shí)驗(yàn)因素的影響較小梗逮,由此推論總變異不存在差異。當(dāng)二者的比率較大時(shí)绣溜,則實(shí)驗(yàn)因素產(chǎn)生影響的可能性增大慷彤。
2.2. 方差分析的基本過程
- 1.各變異的內(nèi)容與表達(dá)
根據(jù)各變異的關(guān)系及方差分析可加性的特點(diǎn),有:
總變異 = 組間變異 + 組內(nèi)變異
變異(Variance怖喻,用V表示)即方差(S2)底哗,又稱均方差或均方(Mean Square,MS)锚沸,其公式為:
$$ {S^2}({\rm{or}}V,orMS) = \frac{{\sum {{(X - \overline X )}^2}}}{{n - 1}} = \frac{{SS}}{{df}} $$
其中跋选,分子為離均差平方和,簡稱平方和哗蜈,記為SS前标;分母為自由度,記為 距潘,所以總變異及各變異原因記為:
$$ M{S_t} = M{S_b} + M{S_w} $$
總變異的數(shù)學(xué)意義是每一原始分?jǐn)?shù)(X)與總平均數(shù)( $\overline X $)的離差炼列,記為 $(X - \overline X )^2 $
組間變異的數(shù)學(xué)意義是每一組的平均數(shù)($\overline {{X_{\rm{i}}}}$)與總平均數(shù)的離差,記為 $(\overline {{X_{\rm{i}}}} - {\overline X _{\rm{i}}})$
組內(nèi)變異的數(shù)學(xué)意義是每一組內(nèi)部的原始分?jǐn)?shù)與其組平均數(shù)($\overline {{X_{\rm{i}}}}$)的離差音比,記為$(X - {\overline X _{\rm{i}}})$
方差分析是一種參數(shù)檢驗(yàn)方法俭尖,因此在進(jìn)行均數(shù)差異的檢驗(yàn)時(shí)必須考慮作為參數(shù)檢驗(yàn)應(yīng)具備的條件,即應(yīng)考慮不同總體的變異水平——個(gè)體差異是否一致洞翩。只有在待檢驗(yàn)的幾個(gè)總體的方差一致的前提下稽犁,才能根據(jù)差異檢驗(yàn)的結(jié)果作出適當(dāng)?shù)慕Y(jié)論,否則對差異原因就難以歸因菱农,譬如究竟是實(shí)驗(yàn)條件不同產(chǎn)生的影響缭付,還是個(gè)體之間本身的差異造成的影響柿估。
對于樣本所來自的各個(gè)總體的方差是否一致的問題可以從兩方面著手循未。一是如果已積累了大量的經(jīng)驗(yàn),則可預(yù)先做出方差一致的判斷,進(jìn)行差異檢驗(yàn)時(shí)可以假定幾個(gè)總體的方差相等的妖。二是如果根據(jù)經(jīng)驗(yàn)不足以判斷方差是否一致绣檬,可以根據(jù)研究所搜集的資料樣本方差進(jìn)行統(tǒng)計(jì)分析,檢驗(yàn)方差相等的假設(shè)是否成立嫂粟。因此方差齊性檢驗(yàn)就是檢驗(yàn)各總體方差是否一致的統(tǒng)計(jì)方法娇未。
方差齊性檢驗(yàn)(test of homogeneity of variance)的虛無假設(shè)是假設(shè)各個(gè)總體的方差相等(即無顯著差異)或是各個(gè)樣本方差來自相同的總體,其表達(dá)方式記為:
$$Ho:{\sigma _1}^2 = {\sigma _2}^2 = {\sigma _3}^2...$$
研究假設(shè)雖然不能保證所有的方差存在顯著差異星虹,但可以假設(shè)至少有兩總體的方差存在顯著差異零抬,只要有兩種總體方差或樣本方差不一致,虛無假設(shè)各總體方差相等就不成立了宽涌。
方差齊性檢驗(yàn)的方法
檢驗(yàn)多個(gè)總體方差一致性的方法很多平夜,但是最常是哈特萊(Hartley)檢驗(yàn)法。哈特萊檢驗(yàn)法是檢驗(yàn)
$$Ho:{\sigma 1}^2 = {\sigma 2}^2 = {\sigma 3}^2...$$
這一假設(shè)的較好方法卸亮,它借助于F最大值來檢驗(yàn)忽妒。所謂F最大值就是把一系列方差中的最大方差與最小方差進(jìn)行比較的方法,即
$$ {F{\max }} = \frac{{{S^2}{(n - 1)max}}}{{{S^2}{(n - 1)min}}} $$
在虛無假設(shè) $$Ho:{\sigma _1}^2 = {\sigma _2}^2 = {\sigma 3}^2...$$ 時(shí)兼贸,最大值分布的臨界值已由哈特萊計(jì)算出來形成了F最大值理論分布表段直,見附表。查Fmax時(shí)溶诞,需根據(jù)方差數(shù)目k及方差的自由進(jìn)行鸯檬。其中,
$df = {n{\max }} - 1$ 很澄。
對例1的數(shù)據(jù)進(jìn)行方差齊性檢驗(yàn)的過程與方法如下:
1.建立假設(shè)
$Ho:{\sigma _1}^2 = {\sigma _2}^2 = {\sigma _3}^2$京闰,即三個(gè)總體的個(gè)體差異無顯著差異
Ha:至少有兩個(gè)總體的方差存在顯著差異
2.計(jì)算統(tǒng)計(jì)量
2.1求各樣本的方差
$${S^2} = \frac{{\sum {{X^2}} - {{(\sum X )}^2}/n}}{{n - 1}}$$
$$\begin{array}{l}
{S_A}^2 = 2\
{S_B}^2 = 0.8\
{S_C}^2 = 2.8
\end{array}$$
學(xué)習(xí)方法 | 成績(x1) | x2 | x3 | x4 | x5 | x6 | $\sum X$ | ${\sum X ^2}$ |
---|---|---|---|---|---|---|---|---|
A | 5 | 6 | 7 | 5 | 3 | 4 | 30 | 160 |
B | 11 | 10 | 9 | 11 | 9 | 10 | 60 | 604 |
C | 14 | 15 | 17 | 13 | 17 | 14 | 90 | 1364 |
$\sum {}$ | 180 | 2128 | ||||||
$\sum {\sum X }$ | ${\sum {\sum X } ^2}$ |
2.2求F最大值
$${F_{max}} = \frac{{2.80}}{{0.8}} = 3.5$$
2.3比較與決策
當(dāng)組數(shù)k=3,自由度df=6-1=5時(shí)甩苛,${F_{max0.05}} = 10.8$蹂楣。因?yàn)?{F_{max}} = 3.5 < {F_{\max 0.05}} = 10.8$,P>0.05讯蒲,差異不顯著痊土,接受虛無假設(shè),拒絕研究假設(shè)墨林,說明三個(gè)總體的方差一致赁酝。
3. F分布的應(yīng)用——方差分析
3.1. 單因素方差分析的意義
方差分析是在實(shí)驗(yàn)研究中產(chǎn)生的,由于一次實(shí)驗(yàn)涉及的因素多少不一而分為單因素設(shè)計(jì)和多因素設(shè)計(jì)旭等。所謂單因素設(shè)計(jì)(single factor design)就是從影響實(shí)驗(yàn)結(jié)果的眾多因素中選取一個(gè)作為自變量酌呆,其他因素都加以控制的設(shè)計(jì)類型。分析單因素設(shè)計(jì)實(shí)驗(yàn)結(jié)果的方法稱單因素方差分析搔耕,換言之隙袁,實(shí)驗(yàn)所考察的自變量只有一個(gè)的實(shí)驗(yàn)設(shè)計(jì)的方差分析。
單因素設(shè)計(jì)是最簡單、最基本的實(shí)驗(yàn)設(shè)計(jì)類型菩收,其具體設(shè)計(jì)形式有完全隨機(jī)設(shè)計(jì)梨睁、隨機(jī)區(qū)組設(shè)計(jì)和拉丁方設(shè)計(jì),因此相應(yīng)的方差分析也就有完全隨機(jī)設(shè)計(jì)的方差分析娜饵、隨機(jī)區(qū)組設(shè)計(jì)的方差分析和拉丁方設(shè)計(jì)的方差分析坡贺。本章只介紹前兩種形式。
3.2. 完全隨機(jī)設(shè)計(jì)的方差分析
3.2.1. 完全隨機(jī)設(shè)計(jì)
如例1箱舞,研究者欲研究學(xué)生在不同學(xué)習(xí)方法下的學(xué)習(xí)效果遍坟,隨機(jī)抽取各方面條件基本一致的學(xué)生18名,并隨機(jī)地將他們分為三組分別用一種學(xué)習(xí)方法學(xué)習(xí)晴股。經(jīng)過一段時(shí)間后政鼠,對不同學(xué)習(xí)方法的效果進(jìn)行統(tǒng)一測驗(yàn)。這種實(shí)驗(yàn)設(shè)計(jì)即為完全隨機(jī)設(shè)計(jì)(completely randomized design)队魏。完全隨機(jī)實(shí)驗(yàn)設(shè)計(jì)就是隨機(jī)地抽取研究對象并隨機(jī)將其分配至各種實(shí)驗(yàn)條件進(jìn)行實(shí)驗(yàn)的設(shè)計(jì)形式公般。換言之,就是每一隨機(jī)組分別接受一種實(shí)驗(yàn)處理的設(shè)計(jì)胡桨。
在完全隨機(jī)設(shè)計(jì)中由于被試是隨機(jī)抽取的官帘,并隨機(jī)分組,因此一般認(rèn)為所分的組是“等組”的昧谊。如果實(shí)驗(yàn)結(jié)果出現(xiàn)組與組之間差異顯著刽虹,就可以認(rèn)為實(shí)驗(yàn)處理的效應(yīng)顯著,亦即各種學(xué)習(xí)方法的學(xué)習(xí)效果確有不同呢诬。正因?yàn)槌闃拥碾S機(jī)性涌哲,各組之間是相互獨(dú)立的,所以這類設(shè)計(jì)也稱為獨(dú)立組設(shè)計(jì)或被試間設(shè)計(jì)尚镰。
3.2.2. 完全隨機(jī)設(shè)計(jì)的方差分析
1.樣本容量相等的方差分析
各個(gè)樣本容量相等時(shí)意味著對于每一種實(shí)驗(yàn)處理它們的被重復(fù)次數(shù)相同阀圾,如表3,每一種學(xué)習(xí)方法均重復(fù)了6次狗唉。其方差分析過程與上一節(jié)所介紹的方差分析基本方法完全一致初烘。
2.樣本容量不相等的方差分析
在完全隨機(jī)的方差分析中,究者常常使各實(shí)驗(yàn)處理組的被試數(shù)目相等分俯。這本不需要肾筐,但卻能使計(jì)算稍微容易些。像獨(dú)立樣本t檢驗(yàn)一樣缸剪,F(xiàn)檢驗(yàn)也允許樣本容量不等吗铐。
4. 小結(jié)
方差分析是比較兩個(gè)以上平均差異顯著性的方法。其邏輯思想是將總變異分解成組間(或處理間)變異和組內(nèi)(或誤差)變異杏节,通過比較組間與組內(nèi)變異率的大小來確定均數(shù)差異是來自實(shí)驗(yàn)因素或處理唬渗,還是源自隨機(jī)誤差讥此。引起組間的變異原因主要實(shí)驗(yàn)施加的影響因素(或條件)和隨機(jī)誤差,引起組內(nèi)變異的原因則為隨機(jī)誤差(其中含個(gè)體變異和實(shí)驗(yàn)變異)谣妻。根據(jù)一次實(shí)驗(yàn)因素的個(gè)數(shù)分為單因素實(shí)驗(yàn)和多因素實(shí)驗(yàn)。單因素實(shí)驗(yàn)方差分析主要有完全隨機(jī)設(shè)計(jì)的方差分析和完全隨機(jī)區(qū)組設(shè)計(jì)的方差分析卒稳。