以總體均值的假設(shè)檢驗為例講述如何做出決策宠能。
1. 基于統(tǒng)計量進行決策
① 前面說過很多遍:樣本均值服從期望為總體均值饺著,方差為
的正態(tài)分布箫攀。
② 原假設(shè)是,總體的均值等于幼衰,即
③ 如果總體均值真的真的真的就是靴跛,根據(jù)①的描述,樣本均值的概率分布就是醬嬸兒的:
~?
渡嚣,(σ未知時用s代替)汤求,進一步寫為:
~?
俏险。
④ 根據(jù)事先設(shè)定好的顯著性水平α,給上述分布劃定拒絕域和非拒絕域(最重要一步)
拒絕域如何劃定和使用:
i. 首先根據(jù)設(shè)定的顯著性水平α對稱的劃定陰影區(qū)域(區(qū)域面積為α)扬绪。如果原假設(shè)是正確的竖独,那么采集的樣本的均值落到陰影區(qū)域的概率是α。通常事先設(shè)定的α閾值都是非常小的挤牛,比如0.05莹痢,0.01等。如果原假設(shè)是正確的墓赴,樣本均值落到陰影區(qū)域的概率是非常低的竞膳。陰影部分就叫拒絕域。诫硕,
ii. 如果我們采集了一個樣本坦辟,其均值恰好落在了陰影區(qū)域,代表著:在原假設(shè)正確的前提下章办,一個概率非常低的事件發(fā)生了锉走。這意味著原假設(shè)很可能是不對的,所以我們拒絕原假設(shè)藕届。這就是為什么陰影區(qū)域叫拒絕域挪蹭。
iii. 原假設(shè)是正確的也有α的概率樣本均值落在了拒絕域,因此α也代表了“原假設(shè)是正確的我們卻拒絕了原假設(shè)”的概率休偶,即第I類錯誤概率梁厉。
iv. 上述描述以雙側(cè)檢驗為例,單側(cè)檢驗也是類似的踏兜。
基于統(tǒng)計量的進行決策時词顾,只把標準化后的統(tǒng)計量分布劃分了拒絕域與非拒絕域,然后根據(jù)估計值落在了哪里來決定是拒絕還是不拒絕原假設(shè)碱妆,而沒有進一步考察估計值具體落在了哪里计技,比如離拒絕域與非拒絕域的界線是近還是遠,這相當于丟失了一部分信息山橄。結(jié)果是垮媒,只給出了犯第I類錯誤的概率上限,這個上限就是事先確定好的α航棱,而沒有給出睡雇,犯第I類錯誤的概率具體是多少。
2. 基于P值進行決策
弄懂了基于統(tǒng)計量進行決策饮醇,根據(jù)P值進行決策就很簡單了它抱。簡述如下:
① 與上述相同,基于原假設(shè)朴艰,樣本均值服從分布:?~?
观蓄;
② 實際采樣計算出來一個樣本均值混移,即一個估計值;
③ 以該值(標準化后)為界侮穿,劃分拒絕域與非拒絕域(具體劃分方式依是雙側(cè)檢驗歌径、右側(cè)檢驗還是左側(cè)檢驗而定);
④ 以該值為界劃分拒絕域與非拒絕域時亲茅,可以反推出對應的顯著性水平回铛,記為P,稱為“觀察到的顯著性水平”克锣;
⑤ 若P<α茵肃,則拒絕原假設(shè),若P>α袭祟,則不拒絕原假設(shè)验残。
基于P值進行決策的好處時,在做出來拒絕原假設(shè)的決策后巾乳,可以給出犯第I類錯誤的概率具體為P(而不是上界為α)您没。