6.3 假設(shè)檢驗的決策依據(jù)-顯著性水平怎么算

以總體均值的假設(shè)檢驗為例講述如何做出決策宠能。

1. 基于統(tǒng)計量進行決策

① 前面說過很多遍：樣本均值服從期望為總體均值 $\mu$ 饺著，方差為 $\frac{\sigma ^2}{n}$ 的正態(tài)分布箫攀。

② 原假設(shè)是，總體的均值等于 $\mu_0$ 幼衰，即 $\mu = \mu_0$

③ 如果總體均值真的真的真的就是 $\mu_0$ 靴跛，根據(jù)①的描述，樣本均值的概率分布就是醬嬸兒的： $\bar x$ ~? $N(\mu_0, \frac{\sigma^2}{n})$ 渡嚣，（σ未知時用s代替）汤求，進一步寫為： $\frac{\bar x - \mu_0}{s/\sqrt{n}}$ ~? $N(0, 1)$ 俏险。

④ 根據(jù)事先設(shè)定好的顯著性水平α，給上述分布劃定拒絕域和非拒絕域（最重要一步）

這個圖太丑了

拒絕域如何劃定和使用：

i. 首先根據(jù)設(shè)定的顯著性水平α對稱的劃定陰影區(qū)域（區(qū)域面積為α）扬绪。如果原假設(shè)是正確的竖独，那么采集的樣本的均值落到陰影區(qū)域的概率是α。通常事先設(shè)定的α閾值都是非常小的挤牛，比如0.05莹痢，0.01等。如果原假設(shè)是正確的墓赴，樣本均值落到陰影區(qū)域的概率是非常低的竞膳。陰影部分就叫拒絕域。诫硕，

ii. 如果我們采集了一個樣本坦辟，其均值恰好落在了陰影區(qū)域，代表著：在原假設(shè)正確的前提下章办，一個概率非常低的事件發(fā)生了锉走。這意味著原假設(shè)很可能是不對的，所以我們拒絕原假設(shè)藕届。這就是為什么陰影區(qū)域叫拒絕域挪蹭。

iii. 原假設(shè)是正確的也有α的概率樣本均值落在了拒絕域，因此α也代表了“原假設(shè)是正確的我們卻拒絕了原假設(shè)”的概率休偶，即第I類錯誤概率梁厉。

iv. 上述描述以雙側(cè)檢驗為例，單側(cè)檢驗也是類似的踏兜。

基于統(tǒng)計量的進行決策時词顾，只把標準化后的統(tǒng)計量分布劃分了拒絕域與非拒絕域，然后根據(jù)估計值落在了哪里來決定是拒絕還是不拒絕原假設(shè)碱妆，而沒有進一步考察估計值具體落在了哪里计技，比如離拒絕域與非拒絕域的界線是近還是遠，這相當于丟失了一部分信息山橄。結(jié)果是垮媒，只給出了犯第I類錯誤的概率上限，這個上限就是事先確定好的α航棱，而沒有給出睡雇，犯第I類錯誤的概率具體是多少。

2. 基于P值進行決策

弄懂了基于統(tǒng)計量進行決策饮醇，根據(jù)P值進行決策就很簡單了它抱。簡述如下：

① 與上述相同，基于原假設(shè)朴艰，樣本均值服從分布： $\frac{\bar x - \mu_0}{s/\sqrt{n}}$ ?~? $N(0, 1)$ 观蓄；

② 實際采樣計算出來一個樣本均值混移，即一個估計值 $\bar x _ 0$ ；

③ 以該值（標準化后）為界侮穿，劃分拒絕域與非拒絕域（具體劃分方式依是雙側(cè)檢驗歌径、右側(cè)檢驗還是左側(cè)檢驗而定）；

④ 以該值為界劃分拒絕域與非拒絕域時亲茅，可以反推出對應的顯著性水平回铛，記為P，稱為“觀察到的顯著性水平”克锣；

⑤ 若P<α茵肃，則拒絕原假設(shè)，若P>α袭祟，則不拒絕原假設(shè)验残。

基于P值進行決策的好處時，在做出來拒絕原假設(shè)的決策后巾乳，可以給出犯第I類錯誤的概率具體為P（而不是上界為α）您没。

最后編輯于：2019.06.17 14:12:44

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者