一、t檢驗(yàn)適用場(chǎng)景
- 依據(jù)中心極限定理评凝,當(dāng)樣本量n足夠大時(shí)追葡,無(wú)論總體分布形態(tài)如何,樣本均值都服從正態(tài)分布N(μ奕短,δ2/n)宜肉。其中,μ為總體的均值翎碑,δ為總體的標(biāo)準(zhǔn)差谬返,n為樣本量。此時(shí)杈女,統(tǒng)計(jì)量服從標(biāo)準(zhǔn)正態(tài)分布朱浴。如果總體的標(biāo)準(zhǔn)差δ不知道吊圾,可以利用樣本的標(biāo)準(zhǔn)差S代替,因?yàn)闃颖緮?shù)量較大時(shí)翰蠢,總體的標(biāo)準(zhǔn)差和樣本的標(biāo)準(zhǔn)差近似项乒。
- 而當(dāng)樣本數(shù)量較少時(shí),總體的標(biāo)準(zhǔn)差和樣本的標(biāo)準(zhǔn)差相差較大梁沧,此時(shí)檀何,中心極限定理不在適用。而統(tǒng)計(jì)學(xué)家發(fā)現(xiàn)廷支,在總體服從正態(tài)分布的情況下频鉴,統(tǒng)計(jì)量服從t分布。t分布與標(biāo)準(zhǔn)正態(tài)分布如下圖所示恋拍,當(dāng)樣本數(shù)量n較大時(shí)垛孔,t分布接近標(biāo)準(zhǔn)正態(tài)分布;而當(dāng)樣本數(shù)量n較少時(shí)施敢,相比與標(biāo)準(zhǔn)正態(tài)分布周荐,t分布兩側(cè)尾部面積增加。
- 因此僵娃,t檢驗(yàn)適用于樣本量較小時(shí)的檢驗(yàn)概作。且樣本量n通過(guò)兩種方式影響p值。
1)n增加時(shí)默怨,由于分母減小讯榕,t檢驗(yàn)統(tǒng)計(jì)量趨向增加。
2)n增加時(shí)匙睹,t分布兩側(cè)尾部面積減小愚屁,同樣的t值對(duì)應(yīng)的p值會(huì)減小
二、t檢驗(yàn)的三種類型
-
單樣本t檢驗(yàn)
用于檢驗(yàn)樣本均值與某一個(gè)標(biāo)準(zhǔn)值μ0的差別垃僚。 -
成對(duì)樣本t檢驗(yàn)
用于檢驗(yàn)一組樣品在某種試驗(yàn)條件前后樣本均值是否有差別集绰。比如對(duì)一組老鼠施加某種藥劑后,生理指標(biāo)是否有變化谆棺。成對(duì)樣本t檢驗(yàn)可以轉(zhuǎn)換為單樣本t檢驗(yàn):將樣本中每個(gè)對(duì)象施加條件前后的數(shù)據(jù)相減栽燕,作為一個(gè)樣本數(shù)據(jù),從而檢驗(yàn)新的樣本數(shù)據(jù)均值是否為0改淑。 -
獨(dú)立樣本t檢驗(yàn)
用于檢驗(yàn)兩組獨(dú)立樣本碍岔,均值是否有差別。這兩組樣本的數(shù)量可能不同朵夏。
依據(jù)兩組樣本的均值是否相等蔼啦,可以分為方差相等的獨(dú)立樣本t檢驗(yàn)和方差不等的獨(dú)立樣本t檢驗(yàn)。判斷兩個(gè)樣本方差是否相等仰猖,可以利用Levene 氏檢驗(yàn)捏肢,這個(gè)檢驗(yàn)原假設(shè)時(shí)兩個(gè)樣本方差相等奈籽,很多統(tǒng)計(jì)學(xué)軟件(如spss)會(huì)給出這個(gè)檢驗(yàn)的p值,如果p值小于0.05鸵赫,可以拒絕原假設(shè)衣屏,認(rèn)為方差不等。
三辩棒、t檢驗(yàn)的注意事項(xiàng)
- 1)t檢驗(yàn)只能檢驗(yàn)最多兩組樣本的均值的差別狼忱。(超過(guò)兩組,需要用方差分析)
- 2)由于是檢驗(yàn)均值的差別一睁,因此钻弄,t檢驗(yàn)適用于離散型變量的數(shù)據(jù)檢驗(yàn),只能用于連續(xù)性變量的數(shù)據(jù)檢驗(yàn)者吁。
- 3)在樣本量較小時(shí)窘俺,t檢驗(yàn)不能用于總體不服從正態(tài)分布的假設(shè)檢驗(yàn)。
- 4)顯著性的差異不等同于差異的顯著性复凳。
例如批销,目標(biāo)是比較兩組樣本均值是否有差別。如果分別利用兩次獨(dú)立樣本t檢驗(yàn)比較各組樣本是否與標(biāo)準(zhǔn)值有差別染坯,發(fā)現(xiàn)一組顯著,另一組不顯著丘逸,則不能說(shuō)明兩組樣本均值差異一定有顯著性单鹿。必須使用直接服從目標(biāo)檢驗(yàn)的統(tǒng)計(jì)量進(jìn)行假設(shè)檢驗(yàn)(這里必須使用獨(dú)立樣本t檢驗(yàn)方法)。 - 5)樣本組內(nèi)數(shù)據(jù)點(diǎn)之間必須是獨(dú)立的深纲。
如果不獨(dú)立仲锄,那么假設(shè)檢驗(yàn)的結(jié)果是更傾向于顯著性結(jié)果,從而更容易犯第一類錯(cuò)誤湃鹊。
解決樣本不獨(dú)立的問(wèn)題儒喊,可以對(duì)嵌套結(jié)構(gòu)的數(shù)據(jù),每一層數(shù)據(jù)進(jìn)行數(shù)據(jù)平均币呵,作為一個(gè)樣本點(diǎn)怀愧;也可以使用多層模型( multilevel models,又稱分層模型 hierarchical models )余赢。這是一類專門為具有嵌套關(guān)系的數(shù)據(jù)發(fā)展出來(lái)的統(tǒng)計(jì)學(xué)方法芯义,能夠把數(shù)據(jù)收集過(guò)程中的不同層次、不同單元考慮進(jìn)來(lái)妻柒,而不需要提前取平均扛拨,避免了前一種方法損失效能的問(wèn)題。
四举塔、多大樣本算是大樣本及數(shù)據(jù)正態(tài)性的檢驗(yàn)
t檢驗(yàn)正態(tài)性的要求時(shí)針對(duì)抽樣分布而言的绑警。依據(jù)中心極限定理求泰,大樣本下,抽樣分布一定是正態(tài)分布计盒,無(wú)論總體是否正態(tài)分布渴频。但多大樣本才算大樣本?這取決于總體與正態(tài)分布相似的程度章郁,總體越趨近正態(tài)分布的形態(tài)枉氮,抽樣分布隨著樣本量的增加趨近正態(tài)分布的速度就越快。研究表明暖庄,大多數(shù)抽樣分布在樣本量大于15時(shí)聊替,已經(jīng)比較少的趨近正態(tài)分布了,這也是一些教科書上會(huì)說(shuō)樣本量大于15時(shí)培廓,可以使用t檢驗(yàn)了惹悄。
如果樣本量比較少,此時(shí)我們需要對(duì)數(shù)據(jù)進(jìn)行正態(tài)性的檢驗(yàn)肩钠,主要方法有以下三種:
-
頻率直方圖
觀察樣本的頻率直方圖是否符合正態(tài)分布泣港。 -
Q-Q圖
q-q圖是比較樣本的n分位數(shù)與正態(tài)分布的n分位數(shù)是否呈線性關(guān)系,如果qq圖為一條直線价匠,表明樣本服從正態(tài)分布当纱。此外,q-q圖可以比較樣本是否服從某種已知分布踩窖,或者兩組樣本是否來(lái)自同一分布坡氯。 -
夏皮羅-威爾克檢驗(yàn)(Shapiro-Wilk test)和科爾莫戈羅夫-斯米爾諾夫檢驗(yàn)(Kolmogorov-Smirnov test)。
這些檢驗(yàn)的原假設(shè)是數(shù)據(jù)符合正態(tài)分布洋腮,當(dāng) p 值足夠小時(shí)拒絕原假設(shè)箫柳,認(rèn)為數(shù)據(jù)不符合正態(tài)分布。使用這些檢驗(yàn)的時(shí)候要注意啥供,當(dāng)樣本足夠大時(shí)悯恍,只要數(shù)據(jù)稍有一點(diǎn)偏離正態(tài)分布,p 值就總能小于 0.05伙狐,因而檢驗(yàn)的結(jié)果總是傾向于顯示數(shù)據(jù)為非正態(tài)分布涮毫。也就是說(shuō)息拜,如果我們的樣本足夠大未荒,即使夏皮羅-威爾克檢驗(yàn)或科爾莫戈羅夫-斯米爾諾夫檢驗(yàn)給出小于 0.05 的 p 值似忧,數(shù)據(jù)來(lái)自的總體仍可能是服從正態(tài)分布的汰具。
五刊棕、數(shù)據(jù)非正態(tài)的處理方法
-
1)數(shù)據(jù)變換
對(duì)于右偏的分布老翘,可以利用遞增速率減緩的函數(shù)來(lái)進(jìn)行數(shù)據(jù)變換光羞,比如log(x)逆航,等美旧。對(duì)于左偏的分布渤滞,可以利用遞增速率增加的函數(shù)來(lái)進(jìn)行數(shù)據(jù)變換贬墩,比如ex,x3等。
(1)Box-Cox變換
該變換是依據(jù)數(shù)據(jù)自動(dòng)尋找最佳變換函數(shù)的方法妄呕,變換公式如下:
由公式可知,需要確定最佳的λ绪励。對(duì)于每個(gè)數(shù)據(jù)肿孵,經(jīng)過(guò)上述公式變換后,如果變換后數(shù)據(jù)服從正態(tài)分布疏魏,則可以確定出正態(tài)分布的均值和標(biāo)準(zhǔn)差停做,進(jìn)而確定每個(gè)變換后數(shù)據(jù)的概率密度,然后應(yīng)用極大似然估計(jì)方法來(lái)求解出λ大莫。
(2)數(shù)據(jù)變換的局限性
第1蛉腌,數(shù)據(jù)變換不能解決所有的非正態(tài)問(wèn)題,比如對(duì)于離散型變量的分布只厘,有多個(gè)峰的分布烙丛,數(shù)據(jù)變換無(wú)法將它們變成正態(tài)分布;第2羔味,數(shù)據(jù)變換后河咽,t檢驗(yàn)的意義會(huì)發(fā)生變換,對(duì)于一些復(fù)雜變換赋元,在數(shù)據(jù)解釋方面存在不足库北。 - 2)非參數(shù)檢驗(yàn)
非參數(shù)檢驗(yàn)適用于數(shù)據(jù)總體不服從正態(tài)分布的情況,包括以下兩種:
單樣本 t 檢驗(yàn)和成對(duì)樣本的 t 檢驗(yàn)對(duì)應(yīng)于威爾科克森符號(hào)秩檢驗(yàn)们陆,以下簡(jiǎn)稱符號(hào)秩檢驗(yàn);
獨(dú)立樣本的 t 檢驗(yàn)對(duì)應(yīng)于曼-惠特尼 U 檢驗(yàn)(也叫做曼-惠特尼秩和檢驗(yàn))情屹,下面簡(jiǎn)稱秩和檢驗(yàn)坪仇。
(1)秩和檢驗(yàn)的優(yōu)點(diǎn):
不要求總體服從正態(tài)分布;
離散型定序變量也適用垃你;不受個(gè)別樣本極端值的影響椅文。
(2)秩和檢驗(yàn)的缺點(diǎn):
相比與t檢驗(yàn),統(tǒng)計(jì)功效很低惜颇;
t檢驗(yàn)直接比較的是兩個(gè)樣本的均值是否一致皆刺,有著直觀的解釋,而秩和檢驗(yàn)比較的是一組數(shù)據(jù)大于另外一組數(shù)據(jù)的概率是不是大于0.5凌摄,只有當(dāng)被比較的兩組數(shù)據(jù)的分布形狀完全一樣而只是差一個(gè)平移的情況下羡蛾,秩和檢驗(yàn)才能等價(jià)于檢驗(yàn)兩組數(shù)據(jù)的中位數(shù)是否相等。因此锨亏,相比于t檢驗(yàn)痴怨,秩和檢驗(yàn)的解釋更加模糊忙干。
六、t檢驗(yàn)中效應(yīng)量的估計(jì)
-
1)點(diǎn)估計(jì)
p值大小與效應(yīng)量浪藻、樣本量有關(guān)捐迫,當(dāng)樣本量很大時(shí),即使很小的效應(yīng)量爱葵,p也會(huì)達(dá)到顯著水平施戴。因此,當(dāng)t檢驗(yàn)顯著時(shí)萌丈,還需要計(jì)算效應(yīng)量的大小赞哗。
單樣本t檢驗(yàn)常用的估計(jì)指標(biāo)是Cohen 氏 d 值:
其中,μ為總體均值浓瞪,σ為總體標(biāo)準(zhǔn)差懈玻,μ0為標(biāo)準(zhǔn)值∏洌總體的參數(shù)可以用樣本參數(shù)代替涂乌。
由于考慮了σ,因此d值可以將來(lái)自不同數(shù)據(jù)若干t檢驗(yàn)的效應(yīng)量放到同一個(gè)尺度上進(jìn)行比較英岭。
Jacob Cohen 曾經(jīng)提出過(guò)一條經(jīng)驗(yàn)準(zhǔn)則湾盒,把 d 值為 0.2,0.5 和 0.8 的效應(yīng)分別稱為小诅妹、中罚勾、大效應(yīng)。這只是粗略的劃分吭狡,也沒有考慮到不同學(xué)科之間的差異尖殃,因此只能作為一種參考。
此外划煮,成對(duì)樣本t檢驗(yàn)常用的d值:
獨(dú)立樣本t檢驗(yàn)的d值:
-
2)區(qū)間估計(jì)
在一定置信水平下構(gòu)建效應(yīng)量估計(jì)的置信區(qū)間送丰,可以更清晰的得知,效應(yīng)量估計(jì)的不確定度和估計(jì)誤差弛秋。