假設檢驗也叫顯著性檢驗,是以小概率反證法的邏輯推理仲翎,判斷假設是否成立的統(tǒng)計方法,它首先假設樣本對應的總體參數(shù)(或分布)與某個已知總體參數(shù)(或分布)相同,然后根據(jù)統(tǒng)計量的分布規(guī)律來分析樣本數(shù)據(jù)肮蛹,利用樣本信息判斷是否支持這種假設,并對檢驗假設做出取舍抉擇创南,做出的結(jié)論是概率性的伦忠,不是絕對的肯定或否定。
1稿辙、T檢驗的概念
T檢驗是用于兩個樣本(或樣本與群體)平均值差異程度的檢驗方法昆码。它是用T分布理論來推斷差異發(fā)生的概率,從而判定兩個平均數(shù)的差異是否顯著邻储。
T檢驗的適用條件為樣本分布符合正態(tài)分布赋咽。
T檢驗的應用條件:
- 當樣本例數(shù)較小時,要求樣本取自正態(tài)總體吨娜;
- 做兩樣本均數(shù)比較時脓匿,還要求兩樣本的總體方差相
等。
T檢驗的用途:(1)樣本均數(shù)與群體均數(shù)的比較萌壳;(2)兩樣本均數(shù)的比較亦镶。
2日月、假設檢驗的步驟
假設檢驗可以分為三步:(1)建立檢驗假設和確定檢驗水準;(2)選定檢驗方法和計算檢驗統(tǒng)計量缤骨;(3)確定P值和做出推斷結(jié)論爱咬。
2.1 建立檢驗假設和確定檢驗水準
檢驗假設是針對總體特征而言,包括相互對立的兩個方面绊起,即兩種假設:一種是無效假設或稱原假設精拟、零假設,符號為H0虱歪,它是要否定的假設蜂绎;另一種是備擇假設,記為H1笋鄙,它是H0的對立面师枣。二者是從反證法的思想提出的, H1和H0是相互聯(lián)系萧落、又相互對立的假設践美。
假設檢驗還需根據(jù)不同研究目的事先設置是否拒絕原假設的判斷標準,即檢驗水準找岖。檢驗水準也稱顯著性水準陨倡,它指無效假設H0為真,但被錯誤地拒絕的一個小概率值许布,一般取檢驗水準α =0.05兴革。
單側(cè)檢驗與雙側(cè)檢驗
? 在進行t檢驗時,如果其目的在于檢驗兩個總體均數(shù)是否相等蜜唾,即為雙側(cè)檢驗杂曲。 例如檢驗某種新降壓藥與常用降壓藥效力是否相同?就是說袁余,新藥效力可能比舊藥好解阅,也可能比舊藥差,或者力相同泌霍,都有可能。
? 如果我們已知新藥效力不可能低于舊藥效力述召,例如磺胺藥+磺胺增效劑從理論上推知其效果不可能低于單用磺胺藥朱转,這時,無效假設為H0:μ1=μ2, 備擇假設為H1: μ1>μ2 , 統(tǒng)計上稱為單側(cè)檢驗积暖。
2.2 選定檢驗方法和計算檢驗統(tǒng)計量
要根據(jù)研究設計的類型和統(tǒng)計推斷的目的選用不同的檢驗方法藤为。如成組設計的兩樣本均數(shù)的比較用t檢驗,多個樣本均數(shù)的比較用F檢驗夺刑。
檢驗統(tǒng)計量是用于抉擇是否拒絕H0的統(tǒng)計量(因此在我們確定檢驗假設H0,H1時,檢驗方法和檢驗統(tǒng)計量就已經(jīng)確定了)缅疟,其統(tǒng)計分布在統(tǒng)計推斷中是至關重要的分别,不同的檢驗方法要用不同的方式計算現(xiàn)有樣本的檢驗統(tǒng)計量值。
2.3 確定P值和做出推斷結(jié)論
這里的P值是指由H0成立時的檢驗統(tǒng)計量出現(xiàn)在由樣本計算出來的檢驗統(tǒng)計量的末端或更末端處的概率值存淫。
當P≤ α時耘斩,結(jié)論為按所取檢驗水準拒絕H0,接受H1桅咆,這樣做出結(jié)論的理由是:在H0成立的條件下括授,出現(xiàn)等于及大于現(xiàn)有檢驗統(tǒng)計量值的概率P≤ α ,是小概率事件岩饼,這在一次抽樣中是不大可能發(fā)生的荚虚,即現(xiàn)有樣本信息不支持H0因而拒絕它;若P>α籍茧,即樣本信息支持H0版述,就沒有理由拒絕它,此時只好接受它寞冯。
假設檢驗的兩類錯誤
Ⅰ型錯誤渴析,第一類錯誤、假陽性錯誤,就是在假設檢驗作推斷結(jié)論時简十,拒絕了實際上是正確的原假設H0檬某,其概率用α表示。(拒絕正確)
Ⅰ型錯誤是針對原假設而言的螟蝙, α就是事先規(guī)定 的 允 許 犯 Ⅰ 型 錯 誤 的 概 率 值 恢恼, 如 規(guī) 定α=0.05,意味著在某特定總體抽樣胰默, 100次拒絕H0的假設檢驗中场斑,最多有5次允許發(fā)生第一類錯誤。與此相應牵署,推斷正確的可能性為1-α漏隐, 1-α又稱為可信度。
Ⅱ型錯誤奴迅,第二類錯誤青责、假陰性錯誤, 即接受實際上是不成立的H0取具。就是無效假設原本是不正確的脖隶,但所算得的統(tǒng)計量不足以拒絕它,錯誤地得出了無差別的結(jié)論暇检。(接受錯誤)
Ⅱ型錯誤是針對備擇假設而言的产阱,其概率值用β表示。β值的大小一般未知块仆,只有在不
同總體特征已知的基礎上构蹬,按預定的α和n才能做出估算王暗。
H0 | H0 | |
---|---|---|
True | False | |
Accept | OK | II Error |
Reject | I Error | OK |
3 T檢驗例子
3.1 樣本與總體均數(shù)的比較
大量檢測已知正常人血漿載脂蛋白E( apo E)總體平均水平為4.15mmol/L。某醫(yī)師經(jīng)抽樣測得41例陳舊性心機梗死患者的血漿載脂蛋白E平均濃度為5.22mmol/L庄敛,標準差為1.61mmol/L俗壹。據(jù)此能否認為陳舊性心肌梗死患者的血漿載脂蛋白E平均濃度與正常人的平均濃度不一致?
(1)建立檢驗假設和確定檢驗水準铐姚。H0: μ=μ0策肝,H1: μ≠μ0,α=0.05隐绵,雙側(cè)檢驗之众;
3.2 配對設計定量資料的t 檢驗
? 配對設計的t檢驗研究的是差值均數(shù)(樣本均數(shù))與理論上的差值總體均數(shù)的比較。
? 可將配對設計資料的假設檢驗視為樣本均數(shù)與總體均數(shù)μd=0的比較帚桩。據(jù)定理:
? 首先計算出各對差值d的均數(shù)垛玻。當兩種處理結(jié)果無差別或某種處理不起作用時割捅,理論上差值d的總體均數(shù)μd=0。
將大白鼠配成8對亿驾,每對分別飼以正常飼料和缺乏維生素E飼料,測得兩組大白鼠肝中維生素A的含量账嚎,試比較兩組大白鼠中維生素A的含量有無差別莫瞬。
大白鼠配對號 | 正常飼料組 | 維生素E缺乏組 | 差數(shù)d |
---|---|---|---|
1 | 3550 | 2450 | 1100 |
2 | 2000 | 2400 | -400 |
3 | 3000 | 1800 | 1200 |
4 | 3950 | 3200 | 750 |
5 | 3800 | 3250 | 550 |
6 | 3750 | 2700 | 1050 |
7 | 3450 | 2500 | 950 |
8 | 3050 | 1750 | 1300 |
Mean | 3318.75 | 2506.25 | 812.5 |
(1)建立檢驗假設和確定檢驗水準。H0: μd=0郭蕉,H1: μd≠0乏悄,α=0.05,雙側(cè)檢驗恳不;
量有差別阻肿。正常飼料組比缺乏維生素E飼料組的含量要高。
4沮尿、T檢驗類型
t檢驗有多種類型丛塌,可以分為只有一組樣本的單體檢驗和有兩組樣本的雙體檢驗。單體檢驗用于檢驗樣本的分布期望是否等于某個值畜疾。雙體檢驗用于檢驗兩組樣本的分布期望是否相等赴邻,又分為配對雙體檢驗和非配對雙體檢驗。配對雙體檢驗的兩組樣本數(shù)據(jù)是一一對應的啡捶,而非配對雙體檢驗的兩組數(shù)據(jù)則是獨立的姥敛。比如藥物實驗中,配對雙體檢驗適用于觀察同一組人服用藥物之前和之后瞎暑,非配對雙體檢驗適用于一組服用藥物而一組不服用藥物彤敛。
1、單體檢驗
單體檢驗是針對一組樣本的假設檢驗了赌。零假設為H0: μ=μ0墨榄。統(tǒng)計量服從自由度為n-1的 T 分布。
2勿她、配對雙體檢驗
3辩恼、非配對雙體檢驗
非配對雙體檢驗針對獨立的兩組樣本雇庙。非配對雙體檢驗假設兩組樣本是從不同的正態(tài)分布采樣出來的。根據(jù)兩個正態(tài)分布的標準差是否相等灶伊,非配對雙體檢驗又可以分兩類疆前。一種是分布標準差相等的情況。零假設是兩組樣本的分布期望相等聘萨,統(tǒng)計量 T 服從自由度為 n1+n2-2的T分布竹椒。
另一種是分布標準差不相等的情況书释。零假設也是兩組樣本的分布期望相等,統(tǒng)計量 T 服從 T 分布赊窥。
思考
由于每次抽樣的樣本平均值都是圍繞著群體期望值分布爆惧,因此我們認為只要某次抽樣平均值在接受零假設的區(qū)間內(nèi),我們便接受零假設锨能。
參考:
假設檢驗原理一: T 檢驗
t檢驗