這一部分是核心啊核心方援,經(jīng)趁怀矗考啊。
在理解假設(shè)檢驗的原理之前犯戏,要理解假設(shè)檢驗的兩類錯誤送火。即第一類與第二類錯誤。
第一類錯誤先匪,也稱為棄真錯誤种吸、α錯誤,是指當(dāng)原假設(shè)正確時呀非,而拒絕H0所犯的錯誤坚俗。
第二類錯誤,也稱為取偽錯誤、β錯誤猖败,是指原假設(shè)錯誤時形耗,反而接受H0的情況 。
然后再來看假設(shè)檢驗的原理辙浑,這部分的話我覺得薛薇講的挺好的(《SPSS統(tǒng)計分析方法及應(yīng)用(第4版)》),這里還是summarize一下拟糕。
假設(shè)檢驗基于小概率原理判呕,即發(fā)生概率很小的隨機(jī)時間,在某一次特定額實驗中幾乎不可能發(fā)生送滞。在某一假設(shè)下侠草,檢測某一極端事件發(fā)生的概率,若概率很小犁嗅,可以認(rèn)為假設(shè)是成立的边涕;否則則認(rèn)為假設(shè)不成立。
步驟為:
- 提出原假設(shè)褂微。一般將希望證實和支持的假設(shè)放在備擇假設(shè)上功蜓,將希望推翻的假設(shè)放在原假設(shè)。
- 選擇檢驗統(tǒng)計量
- 計算檢驗統(tǒng)計量觀測值發(fā)生的概率p宠蚂,間接得到某一樣本值發(fā)生的概率式撼。
- 給定顯著性水平α,做出統(tǒng)計決策求厕。
對4作一些注解:這里的顯著性水平α(可以視為一種閾值)著隆,指原假設(shè)正確卻被錯誤地拒絕了的概率或風(fēng)險,即犯棄真錯誤(第一類錯誤)的概率呀癣,一般控制在0.05美浦,即假設(shè)檢驗的目標(biāo)是使犯棄真錯誤(第一類錯誤)的最小,希望它為小概率事件项栏。 犯棄真錯誤(第一類錯誤)的概率為0.05浦辨,也就說明有95%的概率拒絕原假設(shè)而不犯錯。這也是我們?yōu)槭裁幢M量把希望推翻的假設(shè)放在原假設(shè)的原因忘嫉。即荤牍,希望大概率地能夠不犯錯地拒絕掉想要推翻的假設(shè)。這里可以引一些實例庆冕。比如均值類假設(shè)檢驗康吵,一般的原假設(shè)都是總體均值等于檢驗值,或者多個樣本的總體均值相等之類的访递。其實在現(xiàn)實世界中晦嵌,等于比不等于要難,多個樣本的總體均值相等,只要中間兩個不相等就可以推翻了惭载。因此全部相等是想要推翻的假設(shè)旱函。原假設(shè)為總體分布沒有差異、總體方差沒有差異描滔、兩個隨機(jī)變量沒有關(guān)系同理棒妨。
得到概率p與顯著性水平α,做出統(tǒng)計決策過程如下:
- 若檢驗統(tǒng)計量的概率p小于顯著性水平α:說明犯棄真錯誤的可能性小于我們設(shè)定的閾值含长,拒絕原假設(shè)不太可能犯錯券腔,可以直接拒絕原假設(shè)。
- 同理拘泞, 若檢驗統(tǒng)計量的概率p大于顯著性水平α:說明犯棄真錯誤的可能性大于我們設(shè)定的閾值纷纫,拒絕原假設(shè)犯錯概率比控制水平搞,不應(yīng)拒絕原假設(shè)陪腌。