一倔叼、假設(shè)檢驗(yàn)的兩種方式
- 拒絕域檢驗(yàn)
依據(jù)顯著性水平α和構(gòu)造統(tǒng)計(jì)量的分布形態(tài),確定拒絕域范圍空郊。計(jì)算樣本統(tǒng)計(jì)值份招,看是否落在拒絕域內(nèi),如果落在拒絕域內(nèi)狞甚,則拒絕原假設(shè)锁摔。 - P值檢驗(yàn)
P值為,當(dāng)假設(shè)原假設(shè)(H0)為真時(shí)哼审,所得到的樣本觀測結(jié)果或更極端結(jié)果出現(xiàn)的概率谐腰。如果該值小于顯著性水平,則拒絕原假設(shè)涩盾。
P值的3個(gè)影響因素:
1)樣本觀測值與總體參數(shù)的差異
2)樣本的個(gè)數(shù)
3)被假設(shè)參數(shù)的總體分布 - 拒絕域檢驗(yàn)和P值檢驗(yàn)比較
1)拒絕域的優(yōu)點(diǎn)是進(jìn)行決策的邊界明顯十气,但是進(jìn)行決策面臨的風(fēng)險(xiǎn)也是籠統(tǒng)的
2)P值檢驗(yàn)反映了樣本觀測值和總體參數(shù)不一致的概率,可以提供更豐富的信息春霍。同時(shí)砸西,可以依據(jù)不同的P值和顯著性水平,決定是否拒絕原假設(shè)址儒。
二籍胯、兩類錯(cuò)誤
- α錯(cuò)誤或棄真錯(cuò)誤:原假設(shè)H0為真,我們卻拒絕了原假設(shè)离福。
- β錯(cuò)誤或取偽錯(cuò)誤:原假設(shè)H0為假杖狼,我們卻接受了原假設(shè)。
注意:α+β≠1妖爷。在樣本量一定的情況下蝶涩,不可能同時(shí)減小兩類錯(cuò)誤理朋;如果想同時(shí)減小兩類錯(cuò)誤,只能增加樣本量绿聘;一般情況下嗽上,首先控制α錯(cuò)誤,主要原因是熄攘,原假設(shè)H0是什么常常是明確的兽愤。
三、兩類錯(cuò)誤與貝葉斯公式
例子:現(xiàn)研發(fā)了一種用于臨床上治療癌癥的藥物挪圾,為了檢測該藥物對癌癥治療是否有效果浅萧,抽取樣本通過臨床試驗(yàn)來觀察該藥物的效果。假設(shè)該藥物在實(shí)際無效的情況下哲思,由于樣本的隨機(jī)性通過試驗(yàn)判斷藥物為有效的概率為5%洼畅;藥物在實(shí)際有效的情況下,通過試驗(yàn)可以正確識(shí)別出藥物為有效的概率是90%棚赔。假設(shè)由于醫(yī)藥水平所限帝簇,一般用于治療癌癥的藥物有效性在10%。那么靠益,如果該藥物在試驗(yàn)過程中被判定為有效丧肴,它實(shí)際對治療癌癥確實(shí)有效的概率是多少?
分析:通過假設(shè)檢驗(yàn)的方式來判定一種藥物是否有效胧后,原假設(shè)為:該藥物對治療癌癥無效果芋浮;備擇假設(shè)為:該藥物對治療癌癥有效果。由下表可知绩卤,在原假設(shè)為真的情況下途样,結(jié)果為顯著(即判定藥物有效)的概率為5%江醇,這也是第一類錯(cuò)誤α(醫(yī)學(xué)上稱假陽)濒憋;在備注假設(shè)為真的情況下,結(jié)果不顯著(即判定藥物無效)的概率是10%陶夜,這就是對應(yīng)的第二類錯(cuò)誤β(醫(yī)學(xué)上稱假陰)凛驮。
在試驗(yàn)結(jié)果顯著(即判定藥物是有效的)的條件下,它實(shí)際藥物效果有效的概率計(jì)算采用貝葉斯公式:
最終得到結(jié)果為66.7%条辟∏玻可見,如果通過試驗(yàn)判定為有治療效果的100種藥物中羽嫡,只有不到67種是真正有效果的本姥。這是因?yàn)橐环N藥物它本身對治療癌癥有實(shí)際效果的概率太低了,即先驗(yàn)概率p(實(shí)際藥物有效)太小了杭棵,即使似然概率p(結(jié)果顯著|實(shí)際藥物有效)很大婚惫,整體概率也偏小。