t檢驗(yàn)

一、t檢驗(yàn)適用場(chǎng)景

  • 依據(jù)中心極限定理评凝,當(dāng)樣本量n足夠大時(shí)追葡,無(wú)論總體分布形態(tài)如何,樣本均值\overline{\text{x}}都服從正態(tài)分布N(μ奕短,δ2/n)宜肉。其中,μ為總體的均值翎碑,δ為總體的標(biāo)準(zhǔn)差谬返,n為樣本量。此時(shí)杈女,統(tǒng)計(jì)量\frac {(\overline{\text{x}}-μ)} {δ/\sqrt{n}}服從標(biāo)準(zhǔn)正態(tài)分布朱浴。如果總體的標(biāo)準(zhǔn)差δ不知道吊圾,可以利用樣本的標(biāo)準(zhǔn)差S代替,因?yàn)闃颖緮?shù)量較大時(shí)翰蠢,總體的標(biāo)準(zhǔn)差和樣本的標(biāo)準(zhǔn)差近似项乒。
  • 而當(dāng)樣本數(shù)量較少時(shí),總體的標(biāo)準(zhǔn)差和樣本的標(biāo)準(zhǔn)差相差較大梁沧,此時(shí)檀何,中心極限定理不在適用。而統(tǒng)計(jì)學(xué)家發(fā)現(xiàn)廷支,在總體服從正態(tài)分布的情況下频鉴,統(tǒng)計(jì)量\frac {(\overline{\text{x}}-μ)} {S/\sqrt{n}}服從t分布。t分布與標(biāo)準(zhǔn)正態(tài)分布如下圖所示恋拍,當(dāng)樣本數(shù)量n較大時(shí)垛孔,t分布接近標(biāo)準(zhǔn)正態(tài)分布;而當(dāng)樣本數(shù)量n較少時(shí)施敢,相比與標(biāo)準(zhǔn)正態(tài)分布周荐,t分布兩側(cè)尾部面積增加。
  • 因此僵娃,t檢驗(yàn)適用于樣本量較小時(shí)的檢驗(yàn)概作。且樣本量n通過(guò)兩種方式影響p值。
    1)n增加時(shí)默怨,由于分母減小讯榕,t檢驗(yàn)統(tǒng)計(jì)量趨向增加。
    2)n增加時(shí)匙睹,t分布兩側(cè)尾部面積減小愚屁,同樣的t值對(duì)應(yīng)的p值會(huì)減小
    不同自由度的t分布與標(biāo)準(zhǔn)正態(tài)分布

二、t檢驗(yàn)的三種類型

  • 單樣本t檢驗(yàn)
    用于檢驗(yàn)樣本均值與某一個(gè)標(biāo)準(zhǔn)值μ0的差別垃僚。
  • 成對(duì)樣本t檢驗(yàn)
    用于檢驗(yàn)一組樣品在某種試驗(yàn)條件前后樣本均值是否有差別集绰。比如對(duì)一組老鼠施加某種藥劑后,生理指標(biāo)是否有變化谆棺。成對(duì)樣本t檢驗(yàn)可以轉(zhuǎn)換為單樣本t檢驗(yàn):將樣本中每個(gè)對(duì)象施加條件前后的數(shù)據(jù)相減栽燕,作為一個(gè)樣本數(shù)據(jù),從而檢驗(yàn)新的樣本數(shù)據(jù)均值是否為0改淑。
  • 獨(dú)立樣本t檢驗(yàn)
    用于檢驗(yàn)兩組獨(dú)立樣本碍岔,均值是否有差別。這兩組樣本的數(shù)量可能不同朵夏。
    依據(jù)兩組樣本的均值是否相等蔼啦,可以分為方差相等的獨(dú)立樣本t檢驗(yàn)方差不等的獨(dú)立樣本t檢驗(yàn)。判斷兩個(gè)樣本方差是否相等仰猖,可以利用Levene 氏檢驗(yàn)捏肢,這個(gè)檢驗(yàn)原假設(shè)時(shí)兩個(gè)樣本方差相等奈籽,很多統(tǒng)計(jì)學(xué)軟件(如spss)會(huì)給出這個(gè)檢驗(yàn)的p值,如果p值小于0.05鸵赫,可以拒絕原假設(shè)衣屏,認(rèn)為方差不等。

三辩棒、t檢驗(yàn)的注意事項(xiàng)

  • 1)t檢驗(yàn)只能檢驗(yàn)最多兩組樣本的均值的差別狼忱。(超過(guò)兩組,需要用方差分析)
  • 2)由于是檢驗(yàn)均值的差別一睁,因此钻弄,t檢驗(yàn)適用于離散型變量的數(shù)據(jù)檢驗(yàn),只能用于連續(xù)性變量的數(shù)據(jù)檢驗(yàn)者吁。
  • 3)在樣本量較小時(shí)窘俺,t檢驗(yàn)不能用于總體不服從正態(tài)分布的假設(shè)檢驗(yàn)。
  • 4)顯著性的差異不等同于差異的顯著性复凳。
    例如批销,目標(biāo)是比較兩組樣本均值是否有差別。如果分別利用兩次獨(dú)立樣本t檢驗(yàn)比較各組樣本是否與標(biāo)準(zhǔn)值有差別染坯,發(fā)現(xiàn)一組顯著,另一組不顯著丘逸,則不能說(shuō)明兩組樣本均值差異一定有顯著性单鹿。必須使用直接服從目標(biāo)檢驗(yàn)的統(tǒng)計(jì)量進(jìn)行假設(shè)檢驗(yàn)(這里必須使用獨(dú)立樣本t檢驗(yàn)方法)。
  • 5)樣本組內(nèi)數(shù)據(jù)點(diǎn)之間必須是獨(dú)立的深纲。
    如果不獨(dú)立仲锄,那么假設(shè)檢驗(yàn)的結(jié)果是更傾向于顯著性結(jié)果,從而更容易犯第一類錯(cuò)誤湃鹊。
    解決樣本不獨(dú)立的問(wèn)題儒喊,可以對(duì)嵌套結(jié)構(gòu)的數(shù)據(jù),每一層數(shù)據(jù)進(jìn)行數(shù)據(jù)平均币呵,作為一個(gè)樣本點(diǎn)怀愧;也可以使用多層模型( multilevel models,又稱分層模型 hierarchical models )余赢。這是一類專門為具有嵌套關(guān)系的數(shù)據(jù)發(fā)展出來(lái)的統(tǒng)計(jì)學(xué)方法芯义,能夠把數(shù)據(jù)收集過(guò)程中的不同層次、不同單元考慮進(jìn)來(lái)妻柒,而不需要提前取平均扛拨,避免了前一種方法損失效能的問(wèn)題。

四举塔、多大樣本算是大樣本及數(shù)據(jù)正態(tài)性的檢驗(yàn)

t檢驗(yàn)正態(tài)性的要求時(shí)針對(duì)抽樣分布而言的绑警。依據(jù)中心極限定理求泰,大樣本下,抽樣分布一定是正態(tài)分布计盒,無(wú)論總體是否正態(tài)分布渴频。但多大樣本才算大樣本?這取決于總體與正態(tài)分布相似的程度章郁,總體越趨近正態(tài)分布的形態(tài)枉氮,抽樣分布隨著樣本量的增加趨近正態(tài)分布的速度就越快。研究表明暖庄,大多數(shù)抽樣分布在樣本量大于15時(shí)聊替,已經(jīng)比較少的趨近正態(tài)分布了,這也是一些教科書上會(huì)說(shuō)樣本量大于15時(shí)培廓,可以使用t檢驗(yàn)了惹悄。
如果樣本量比較少,此時(shí)我們需要對(duì)數(shù)據(jù)進(jìn)行正態(tài)性的檢驗(yàn)肩钠,主要方法有以下三種:

  • 頻率直方圖
    觀察樣本的頻率直方圖是否符合正態(tài)分布泣港。
  • Q-Q圖
    q-q圖是比較樣本的n分位數(shù)與正態(tài)分布的n分位數(shù)是否呈線性關(guān)系,如果qq圖為一條直線价匠,表明樣本服從正態(tài)分布当纱。此外,q-q圖可以比較樣本是否服從某種已知分布踩窖,或者兩組樣本是否來(lái)自同一分布坡氯。
  • 夏皮羅-威爾克檢驗(yàn)(Shapiro-Wilk test)和科爾莫戈羅夫-斯米爾諾夫檢驗(yàn)(Kolmogorov-Smirnov test)。
    這些檢驗(yàn)的原假設(shè)是數(shù)據(jù)符合正態(tài)分布洋腮,當(dāng) p 值足夠小時(shí)拒絕原假設(shè)箫柳,認(rèn)為數(shù)據(jù)不符合正態(tài)分布。使用這些檢驗(yàn)的時(shí)候要注意啥供,當(dāng)樣本足夠大時(shí)悯恍,只要數(shù)據(jù)稍有一點(diǎn)偏離正態(tài)分布,p 值就總能小于 0.05伙狐,因而檢驗(yàn)的結(jié)果總是傾向于顯示數(shù)據(jù)為非正態(tài)分布涮毫。也就是說(shuō)息拜,如果我們的樣本足夠大未荒,即使夏皮羅-威爾克檢驗(yàn)或科爾莫戈羅夫-斯米爾諾夫檢驗(yàn)給出小于 0.05 的 p 值似忧,數(shù)據(jù)來(lái)自的總體仍可能是服從正態(tài)分布的汰具。

五刊棕、數(shù)據(jù)非正態(tài)的處理方法

  • 1)數(shù)據(jù)變換
    對(duì)于右偏的分布老翘,可以利用遞增速率減緩的函數(shù)來(lái)進(jìn)行數(shù)據(jù)變換光羞,比如log(x)逆航,\sqrt{x}等美旧。對(duì)于左偏的分布渤滞,可以利用遞增速率增加的函數(shù)來(lái)進(jìn)行數(shù)據(jù)變換贬墩,比如ex,x3等。
    (1)Box-Cox變換
    該變換是依據(jù)數(shù)據(jù)自動(dòng)尋找最佳變換函數(shù)的方法妄呕,變換公式如下:
    y(\lambda )=\left\{\begin{matrix} \frac{y_{i}^{\lambda }-1}{\lambda },如果\lambda \neq 0陶舞;\\ ln(y_{i}),如果\lambda =0\end{matrix}\right.
    由公式可知,需要確定最佳的λ绪励。對(duì)于每個(gè)數(shù)據(jù)肿孵,經(jīng)過(guò)上述公式變換后,如果變換后數(shù)據(jù)服從正態(tài)分布疏魏,則可以確定出正態(tài)分布的均值和標(biāo)準(zhǔn)差停做,進(jìn)而確定每個(gè)變換后數(shù)據(jù)的概率密度,然后應(yīng)用極大似然估計(jì)方法來(lái)求解出λ大莫。
    (2)數(shù)據(jù)變換的局限性
    第1蛉腌,數(shù)據(jù)變換不能解決所有的非正態(tài)問(wèn)題,比如對(duì)于離散型變量的分布只厘,有多個(gè)峰的分布烙丛,數(shù)據(jù)變換無(wú)法將它們變成正態(tài)分布;第2羔味,數(shù)據(jù)變換后河咽,t檢驗(yàn)的意義會(huì)發(fā)生變換,對(duì)于一些復(fù)雜變換赋元,在數(shù)據(jù)解釋方面存在不足库北。
  • 2)非參數(shù)檢驗(yàn)

非參數(shù)檢驗(yàn)適用于數(shù)據(jù)總體不服從正態(tài)分布的情況,包括以下兩種:
單樣本 t 檢驗(yàn)和成對(duì)樣本的 t 檢驗(yàn)對(duì)應(yīng)于威爾科克森符號(hào)秩檢驗(yàn)们陆,以下簡(jiǎn)稱符號(hào)秩檢驗(yàn);
獨(dú)立樣本的 t 檢驗(yàn)對(duì)應(yīng)于曼-惠特尼 U 檢驗(yàn)(也叫做曼-惠特尼秩和檢驗(yàn))情屹,下面簡(jiǎn)稱秩和檢驗(yàn)坪仇。

(1)秩和檢驗(yàn)的優(yōu)點(diǎn):
不要求總體服從正態(tài)分布;
離散型定序變量也適用垃你;不受個(gè)別樣本極端值的影響椅文。
(2)秩和檢驗(yàn)的缺點(diǎn):
相比與t檢驗(yàn),統(tǒng)計(jì)功效很低惜颇;
t檢驗(yàn)直接比較的是兩個(gè)樣本的均值是否一致皆刺,有著直觀的解釋,而秩和檢驗(yàn)比較的是一組數(shù)據(jù)大于另外一組數(shù)據(jù)的概率是不是大于0.5凌摄,只有當(dāng)被比較的兩組數(shù)據(jù)的分布形狀完全一樣而只是差一個(gè)平移的情況下羡蛾,秩和檢驗(yàn)才能等價(jià)于檢驗(yàn)兩組數(shù)據(jù)的中位數(shù)是否相等。因此锨亏,相比于t檢驗(yàn)痴怨,秩和檢驗(yàn)的解釋更加模糊忙干。

六、t檢驗(yàn)中效應(yīng)量的估計(jì)

  • 1)點(diǎn)估計(jì)
    p值大小與效應(yīng)量浪藻、樣本量有關(guān)捐迫,當(dāng)樣本量很大時(shí),即使很小的效應(yīng)量爱葵,p也會(huì)達(dá)到顯著水平施戴。因此,當(dāng)t檢驗(yàn)顯著時(shí)萌丈,還需要計(jì)算效應(yīng)量的大小赞哗。
    單樣本t檢驗(yàn)常用的估計(jì)指標(biāo)是Cohen 氏 d 值:
    d=\frac{\mu -\mu _{0}}{\sigma }
    其中,μ為總體均值浓瞪,σ為總體標(biāo)準(zhǔn)差懈玻,μ0為標(biāo)準(zhǔn)值∏洌總體的參數(shù)可以用樣本參數(shù)代替涂乌。
    由于考慮了σ,因此d值可以將來(lái)自不同數(shù)據(jù)若干t檢驗(yàn)的效應(yīng)量放到同一個(gè)尺度上進(jìn)行比較英岭。
    Jacob Cohen 曾經(jīng)提出過(guò)一條經(jīng)驗(yàn)準(zhǔn)則湾盒,把 d 值為 0.2,0.5 和 0.8 的效應(yīng)分別稱為小诅妹、中罚勾、大效應(yīng)。這只是粗略的劃分吭狡,也沒有考慮到不同學(xué)科之間的差異尖殃,因此只能作為一種參考。
    此外划煮,成對(duì)樣本t檢驗(yàn)常用的d值:
    d=\frac{\mu_{x} -\mu _{y}}{\sqrt{\sigma _{x}^{2}+\sigma _{y}^{2}-2\rho _{xy}\sigma_{x}\sigma_{y}}}
    獨(dú)立樣本t檢驗(yàn)的d值:
    d=\frac{\mu_{x} -\mu _{y}}{\sqrt{(\sigma _{x}^{2}+\sigma _{y}^{2})/2}}
  • 2)區(qū)間估計(jì)
    在一定置信水平下構(gòu)建效應(yīng)量估計(jì)的置信區(qū)間送丰,可以更清晰的得知,效應(yīng)量估計(jì)的不確定度和估計(jì)誤差弛秋。
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末器躏,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子蟹略,更是在濱河造成了極大的恐慌登失,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,126評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件挖炬,死亡現(xiàn)場(chǎng)離奇詭異揽浙,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門捏萍,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)太抓,“玉大人,你說(shuō)我怎么就攤上這事令杈∽叩校” “怎么了?”我有些...
    開封第一講書人閱讀 152,445評(píng)論 0 341
  • 文/不壞的土叔 我叫張陵逗噩,是天一觀的道長(zhǎng)掉丽。 經(jīng)常有香客問(wèn)我,道長(zhǎng)异雁,這世上最難降的妖魔是什么捶障? 我笑而不...
    開封第一講書人閱讀 55,185評(píng)論 1 278
  • 正文 為了忘掉前任,我火速辦了婚禮纲刀,結(jié)果婚禮上项炼,老公的妹妹穿的比我還像新娘。我一直安慰自己示绊,他們只是感情好锭部,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,178評(píng)論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著面褐,像睡著了一般拌禾。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上展哭,一...
    開封第一講書人閱讀 48,970評(píng)論 1 284
  • 那天湃窍,我揣著相機(jī)與錄音,去河邊找鬼匪傍。 笑死您市,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的役衡。 我是一名探鬼主播墨坚,決...
    沈念sama閱讀 38,276評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼映挂!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起盗尸,我...
    開封第一講書人閱讀 36,927評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤柑船,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后泼各,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體鞍时,經(jīng)...
    沈念sama閱讀 43,400評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,883評(píng)論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了逆巍。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片及塘。...
    茶點(diǎn)故事閱讀 37,997評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖锐极,靈堂內(nèi)的尸體忽然破棺而出笙僚,到底是詐尸還是另有隱情,我是刑警寧澤灵再,帶...
    沈念sama閱讀 33,646評(píng)論 4 322
  • 正文 年R本政府宣布肋层,位于F島的核電站,受9級(jí)特大地震影響翎迁,放射性物質(zhì)發(fā)生泄漏栋猖。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,213評(píng)論 3 307
  • 文/蒙蒙 一汪榔、第九天 我趴在偏房一處隱蔽的房頂上張望蒲拉。 院中可真熱鬧,春花似錦痴腌、人聲如沸雌团。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)辱姨。三九已至,卻和暖如春戚嗅,著一層夾襖步出監(jiān)牢的瞬間雨涛,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評(píng)論 1 260
  • 我被黑心中介騙來(lái)泰國(guó)打工懦胞, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留替久,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,423評(píng)論 2 352
  • 正文 我出身青樓躏尉,卻偏偏與公主長(zhǎng)得像蚯根,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子胀糜,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,722評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容