?之前我們介紹了t檢驗(yàn)的基本思想-t分布,知道了t分布的含義票从,那接下來(lái)我們就要知道t檢驗(yàn)是干嘛的漫雕,使用t檢驗(yàn)的前提條件是什么。
一峰鄙、t檢驗(yàn)是干嘛的浸间?
t檢驗(yàn)是用于比較兩個(gè)樣本均值差異的檢驗(yàn)方法,它是用t分布理論推斷差異發(fā)生的概率吟榴,從而判定兩個(gè)平均數(shù)的差異是否顯著魁蒜。
舉個(gè)栗子,假如我是一個(gè)工廠的老板,工廠到了一批新機(jī)器兜看,用于生產(chǎn)之前的產(chǎn)品锥咸,此時(shí)我想知道新機(jī)器生產(chǎn)的產(chǎn)品質(zhì)量是否超過(guò)原先的老機(jī)器,如果質(zhì)量差不多铣减,那我就買虧了她君;質(zhì)量高才正常脚作,如果質(zhì)量還不如原先的葫哗,那我就是被騙了,血虧球涛。
此時(shí)劣针,在生產(chǎn)之前,我先生產(chǎn)一小部分亿扁,看看這小部分質(zhì)量如何捺典,如果好那就可以大范圍生產(chǎn),不然如果我對(duì)質(zhì)量不滿意从祝,我得趕緊退貨襟己,不然損失太大。現(xiàn)在牍陌,擺在我面前有兩種方法:
1擎浴、將這一小部分的產(chǎn)品質(zhì)量加起來(lái),求平均值毒涧,再和之前的產(chǎn)品質(zhì)量的均值比較贮预,質(zhì)量好不好一目了然。
2契讲、采用t檢驗(yàn)仿吞,通過(guò)統(tǒng)計(jì)學(xué)計(jì)算,得出質(zhì)量是否合格捡偏。
第一種方法看著沒(méi)問(wèn)題唤冈,但懂點(diǎn)統(tǒng)計(jì)學(xué)基礎(chǔ)的人肯定知道這是不可以的,因?yàn)槟氵x擇的是目前生產(chǎn)的一部分银伟,難道之后生產(chǎn)的完全和這一部分是一樣的么务傲?機(jī)器不會(huì)出一點(diǎn)問(wèn)題?員工操作也不會(huì)出一點(diǎn)問(wèn)題枣申?
這就引入了抽樣誤差這一概念
我們?yōu)榱吮苊庖驗(yàn)橘|(zhì)量不理想而大規(guī)模生產(chǎn)造成損失售葡,只選擇一部分進(jìn)行測(cè)量,這就已經(jīng)是抽樣了忠藤,既然是抽樣挟伙,那就避不開(kāi)抽樣誤差。如果選30個(gè)產(chǎn)品進(jìn)行檢測(cè),我生產(chǎn)10次尖阔,每次30個(gè)贮缅,檢測(cè)的話,每次30個(gè)產(chǎn)品的質(zhì)量平均數(shù)肯定都不一樣介却,有超過(guò)原先的谴供,也有差不多的,甚至有低于原先的齿坷。
既然有批次產(chǎn)品質(zhì)量會(huì)有問(wèn)題桂肌,那我怎么能避免呢?我如果運(yùn)氣差永淌,恰好就抽到那批質(zhì)量不好的作為檢測(cè)標(biāo)準(zhǔn)崎场,本來(lái)有可能是小概率事件,機(jī)器沒(méi)問(wèn)題遂蛀,但卻誤導(dǎo)了我谭跨,把新機(jī)器退了,那樣我將會(huì)支付大量的違約金李滴。
t檢驗(yàn)的產(chǎn)生應(yīng)運(yùn)而生螃宙,t檢驗(yàn)正好就可以解決這樣的問(wèn)題。
如果我生產(chǎn)成千上萬(wàn)的產(chǎn)品所坯,最后再看產(chǎn)品的質(zhì)量谆扎,如果達(dá)標(biāo)那就通過(guò),繼續(xù)生產(chǎn)賺錢包竹;如果不達(dá)標(biāo)則不通過(guò)燕酷,運(yùn)氣好點(diǎn)和之前的質(zhì)量一樣可以繼續(xù)使用,如果低于原先的質(zhì)量周瞎,我將血虧苗缩,就算退貨,我也得承擔(dān)此次生產(chǎn)的成本声诸。既然我們沒(méi)法通過(guò)大量產(chǎn)品得到結(jié)果,那就通過(guò)小樣本來(lái)推斷總體是否達(dá)標(biāo)泻肯,只要統(tǒng)計(jì)學(xué)上過(guò)關(guān)灶挟,那之后發(fā)生錯(cuò)誤的風(fēng)險(xiǎn)就會(huì)很低稚铣。
不可能沒(méi)有風(fēng)險(xiǎn)惕医,因?yàn)檫@個(gè)結(jié)論僅僅是統(tǒng)計(jì)學(xué)上下的結(jié)論抬伺,是一種概率性的結(jié)論峡钓,即使出錯(cuò)的概率很低,但不代表不出錯(cuò)给郊。
二捧灰、t檢驗(yàn)原理
想要了解t檢驗(yàn)原理,首先要了解什么是假設(shè)檢驗(yàn)煌寇。此處我先簡(jiǎn)單說(shuō)一下阀溶,之后會(huì)專門出一篇介紹假設(shè)檢驗(yàn)的原理银锻。
假設(shè)檢驗(yàn)是一種根據(jù)樣本數(shù)據(jù)來(lái)推斷總體分布或者均值击纬、方差等總體統(tǒng)計(jì)參數(shù)的方法更振。
之所以要用樣本來(lái)估計(jì)總體,是因?yàn)榭傮w數(shù)據(jù)很難全部得到实撒,或者說(shuō)成本太大奈惑,比如全國(guó)中學(xué)生的身高肴甸。
假設(shè)檢驗(yàn)最基本思想:小概率事件不會(huì)發(fā)生友扰,如某件事發(fā)生的概率小于5%村怪,這事不可能發(fā)生了,因?yàn)樵诮y(tǒng)計(jì)學(xué)上默認(rèn)<5%=不可能浮庐。
此時(shí)我們來(lái)講t檢驗(yàn)的原理
1甚负、建立假設(shè)?
(1)原假設(shè)或無(wú)效假設(shè):H0: μ=μ0,即兩總體均數(shù)相同审残。?(新機(jī)器產(chǎn)品質(zhì)量=舊機(jī)器產(chǎn)品質(zhì)量)
(2)備擇假設(shè)或有統(tǒng)計(jì)學(xué)意義假設(shè):H1:μ≠μ0梭域,即兩總體均數(shù)不同。(新機(jī)器產(chǎn)品質(zhì)量≠舊機(jī)器產(chǎn)品質(zhì)量搅轿,是高是低我不知道)病涨,根據(jù)專業(yè)知識(shí)及數(shù)據(jù)特征,備擇假設(shè)H1也有單側(cè)形式:μ<μ0璧坟,μ>μ0既穆。
◆ 選擇雙側(cè)檢驗(yàn),還是單側(cè)檢驗(yàn)需依據(jù)數(shù)據(jù)特征和專業(yè)知識(shí)進(jìn)行確定雀鹃;
◆ 原假設(shè)不是隨意而為幻工,一般套路是朝著預(yù)期目標(biāo)相反的方向做假設(shè),例如褐澎,預(yù)期兩均值差異明顯会钝,那么原假設(shè)就是兩均值相同(無(wú)差異);?
◆ 原假設(shè)兩總體均值相同工三,這件事發(fā)生的概率P如果小于5%迁酸,那么是很罕見(jiàn)的,可以認(rèn)為是偶然發(fā)生的俭正,在統(tǒng)計(jì)學(xué)上認(rèn)為這種小概率事件是不可能發(fā)生的奸鬓。
2、計(jì)算T統(tǒng)計(jì)量及概率P值?
在總體方差未知情況下掸读,進(jìn)行兩均數(shù)的比較用t檢驗(yàn)串远,在原假設(shè)的基礎(chǔ)上宏多,按照固定的公式計(jì)算T統(tǒng)計(jì)量。?
◆ t檢驗(yàn)中的t統(tǒng)計(jì)量一定是服從t分布澡罚;?
◆ t統(tǒng)計(jì)量的計(jì)算公式(前為單樣本t檢驗(yàn)伸但,后為獨(dú)立樣本t檢驗(yàn))?
◆P值是用來(lái)拒絕原假設(shè)H0的概率,與顯著性水平進(jìn)行比較留搔;
3更胖、推斷決策(兩個(gè)假設(shè)二選一)
根據(jù)計(jì)算的T檢驗(yàn)統(tǒng)計(jì)量,確定相伴概率P值隔显,如果P落入拒絕域却妨,即P<0.05那么就可認(rèn)為前面做出的【原假設(shè)】這件事是不可能發(fā)生的,從而備擇假設(shè)才是正確的括眠。
◆ t檢驗(yàn)結(jié)果解讀的一般套路:P<0.05彪标,則說(shuō)明兩組樣本所代表的總體均 值差異顯著;(我的新機(jī)器產(chǎn)品質(zhì)量和舊機(jī)器產(chǎn)品質(zhì)量不一樣掷豺,此時(shí)再看如果這30個(gè)新機(jī)器的產(chǎn)品質(zhì)量的平均值是>舊機(jī)器產(chǎn)品質(zhì)量平均值的捞烟,那就可以下我的新機(jī)器產(chǎn)品質(zhì)量>舊機(jī)器產(chǎn)品質(zhì)量這一結(jié)論;如果這30個(gè)產(chǎn)品質(zhì)量<舊機(jī)器萌业,那就趕緊退貨坷襟,并完全可以因?yàn)樘摷傩麄饕筚r償奸柬。)
◆ 當(dāng)P>0.05時(shí)生年,原假設(shè)的事件不是小概率事件,沒(méi)有理由拒絕原假設(shè)廓奕,即兩個(gè)均值一致抱婉,沒(méi)有差異。(此時(shí)桌粉,我買的新機(jī)器和舊機(jī)器差別不大蒸绩,趕緊退貨止損)
三、雙側(cè)or單側(cè)铃肯?
雙側(cè)T檢驗(yàn):◆ 用戶僅知道預(yù)期目標(biāo)是兩組樣本均值理論上有差異患亿,但不知道是小于還是大于;?
◆ 原假設(shè):μ1=μ2押逼,備擇假設(shè):μ1≠μ2(用的是不等于號(hào))?
單側(cè)T檢驗(yàn):?
◆ 用戶知道事情發(fā)生的方向步藕,如苗木高度超過(guò)1.6米即可出圃,即用戶知道預(yù)期目標(biāo)有差異挑格,而且是>1.6米咙冗;
◆ 原假設(shè):μ1=μ2,備擇假設(shè):μ1>μ2或者:μ1<μ2(小于或者大于·號(hào))?
再次強(qiáng)調(diào)假設(shè)不是用戶隨意指定的漂彤,t檢驗(yàn)假設(shè)套路是:備擇假設(shè)是你預(yù)期希望發(fā)生的方向雾消,而原假設(shè)則是朝著與預(yù)期要發(fā)生的相反的方向假設(shè)灾搏。比如A和B兩種治療方法療效是否有差異,我們預(yù)期目標(biāo)是二者差異 顯著立润,那么備擇假設(shè)即“有差異”狂窑,原假設(shè)即“無(wú)差異”。
利用SPSS軟件進(jìn)行t檢驗(yàn)桑腮,軟件默認(rèn)輸出的是雙側(cè)概率p值蕾域,因此如果我們的研究是單側(cè)問(wèn)題,那么請(qǐng)對(duì)該p除以2作為單側(cè)t檢驗(yàn)的概率值到旦。
四旨巷、t檢驗(yàn)的適用條件
t檢驗(yàn)最基本的條件是樣本數(shù)據(jù)來(lái)自正態(tài)分布總體,或近似正態(tài)分布總體添忘,簡(jiǎn)單理解就是樣本數(shù)據(jù)必須具備正態(tài)性采呐,符合正態(tài)分布。
兩組獨(dú)立樣本數(shù)據(jù)間的方差相等或一致搁骑,統(tǒng)計(jì)學(xué)上稱之為“方差齊次”斧吐。
具體每一個(gè)t檢驗(yàn)所要求的適用條件稍微有點(diǎn)區(qū)別,我會(huì)在具體的篇章中單獨(dú)介紹仲器,此處不贅述煤率。
本篇介紹完畢,接下來(lái)我會(huì)逐個(gè)介紹每一個(gè)t檢驗(yàn)的具體用法和使用場(chǎng)景乏冀,拜拜蝶糯。