在統(tǒng)計分析中經常要對某個假設作出判斷蝙眶,例如判斷兩個分組的某個指標是否具有差異,差異的程度如何恨樟,是否具有統(tǒng)計學意義半醉,這些都需要進行假設檢驗。 在很多文獻的統(tǒng)計檢驗部分劝术,包括組間差異分析缩多,組間差異檢驗和差異物種分析部分都需要用到假設檢驗的內容。 下面簡單介紹一下假設檢驗的一般步驟养晋。首先看下相關的一些基本概念瞧壮。
包含所研究的全部個體(數據)的集合,稱為總體(population)
從總體中抽取的一部分元素的集合匙握,稱為樣本(sample)
用來描述總體特征的概括性數字度量,稱為參數(parameter)
用來描述樣本的概括性數字度量陈轿,稱為統(tǒng)計量(statistic)
我們所關心的參數通常有總體平均數圈纺,總體標準差和總體比例等。與總體相對應我們通常關心的統(tǒng)計量有樣本平均數麦射、樣本標準差蛾娶、樣本比例等。由于總體的無限性和總體參數較難確定潜秋,通郴桌牛可以從總體中隨機抽取樣本,通過計算樣本的統(tǒng)計量來估計總體的參數峻呛。例如罗售,我們要判斷污染環(huán)境中和非污染環(huán)境中的微生物具有差異辜窑,我們不可能測定兩種環(huán)境中的所有微生物,因為環(huán)境中的微生物是無限的寨躁。我們通常是從兩種環(huán)境中抽取樣本穆碎,根據樣品的一些指標或統(tǒng)計量來判斷兩種環(huán)境具有差異,這就是用樣本來估計總體的例子职恳。
簡單來說所禀,假設檢驗就是先對總體參數提出某種假設,然后利用樣本信息判斷假設是否成立的過程放钦。假設檢驗一般分為 4 個步驟:
(1)提出假設
在假設檢驗中色徘,首先需要提出兩種假設,即原假設和備選假設操禀。 通常將研究者想收集證據予以反對的假設稱為原假設褂策,或稱零假設,用 H0 表示床蜘。 通常將研究者想收集證據予以支持的假設稱為備選假設辙培,或稱研究假設,用 H1 表示邢锯。原假設所表達的含義總是表述為組間沒有差異扬蕊,變量之間沒有關系。與原假設對立丹擎,備選假設通常表述為組間具有差異尾抑,藥物療效顯著提高等。假設檢驗的一般思路就是先假定 H0 成立蒂培,然后從邏輯從對立面證明真理再愈。
(2)構造檢驗統(tǒng)計量
根據樣本觀測結果計算得到的,并據以對原假設和備選假設作出決策的某個樣本統(tǒng)計量护戳,稱為檢驗統(tǒng)計量翎冲。 在進行假設檢驗時,根據檢驗的目的不同檢驗統(tǒng)計量有不同的計算方法媳荒。檢驗統(tǒng)計量還取決于所抽取的樣本數和總體的分布情況抗悍。
(3) 根據顯著水平,確定臨界值和拒絕域
當原假設正確時拒絕原假設钳枕,所犯的錯誤稱為第Ⅰ類錯誤缴渊。犯第Ⅰ類錯誤的概率,稱為顯著性水平記為α鱼炒。根據顯著性水平確定的拒絕域的邊界值衔沼,稱為臨界值。 當總體分布已知時,例如總體服從正態(tài)分布指蚁,我們可以根據給定的顯著性水平(通常為 0.01 或 0.05)查表獲得臨界值菩佑。當總體分布未知時,可以先用 Permutation test 構造經驗分布欣舵,再根據顯著性水平獲得臨界值擎鸠。
(4)做出檢驗決策
將第(2)步計算出的檢驗統(tǒng)計量與(3)步獲得的臨界值進行比較,作出拒絕或不拒絕原假設的決策缘圈。
傳統(tǒng)的統(tǒng)計量檢驗的方法是在檢驗之前確定顯著性水平α劣光,也就意味著事先確定了臨界值和拒絕域。這樣糟把,不論檢驗統(tǒng)計量的值是大還是小绢涡,只要它的值落入拒絕域就拒絕原假設,否則就不拒絕原假設遣疯。這種給定顯著性水平的方法雄可,無法給出觀測數據與原假設之間不一致程度的精確度量。要測量出樣本觀測數據與原假設中假設值的偏離程度缠犀,則需要計算 pvalue值数苫。 pvalue 值,也稱為觀測到的顯著性水平辨液,它表示為如果原假設 H0正確時得到實際觀測樣本結果的概率虐急。pvalue 值越小,說明實際觀測到的數據與 H0之間的不一致的程度就越大滔迈,檢驗的結果就越顯著[1]止吁。
參考文獻
[1] 賈俊平,統(tǒng)計學基礎[M].中國人民大學出版社,2010.