最近寫的文章危融,朋友過目后提出的問題讓我自己感覺到本科階段的學習沒有做一個非常好的總結,應付完考試之后杂靶,早已忘到九霄云外梆惯,現(xiàn)在的我通過寫博客,一點一點找回來吗垮。
什么是統(tǒng)計檢驗的效能(power)垛吗?
我們首先來回顧一下,在假設檢驗中烁登,我們需要什么怯屉。
(1)原假設():可以認為是辯論賽中,保守一方的觀點(e.g. 超級英雄和普通人沒啥區(qū)別) (2)備擇假設(
):可以類比為辯論賽中饵沧,激進一方的觀點(e.g. 超級英雄就是爺锨络,就是比普通人牛)
在做計算的過程中,會涉及到一個非常重要的數(shù)值 —— α(一般取0.05 或 0.01)
α的含義是:顯著性水平狼牺、一類錯誤發(fā)生的概率(Type I Error)羡儿、棄真錯誤發(fā)生的概率。
從這里有需要再引入幾個概念是钥,如下表:
|
|
|
---|---|---|
接受 |
接受 |
|
拒絕 |
|
接受 |
β從α衍生出來掠归,是二類錯誤發(fā)生的概率(Type II Error)、取偽錯誤發(fā)生的概率悄泥。
在假設檢驗過程中虏冻,我們把拒絕原假設后,接受正確的備擇假設的概率稱為統(tǒng)計檢驗的效能/功效(statistical power)码泞,因此其在數(shù)值上等于1-β兄旬。
【個人理解】1-β,實際上就是確定兩個樣本的總體有差異之后余寥,假設檢驗能夠順利根據(jù)樣本推斷出真實的總體信息的概率。
什么是假陽性(false positive rate)悯森?
結合時事宋舷,我就拿新冠檢測作為例子。
假設對100個人進行核酸檢測瓢姻,檢測結果分別如下:
被測對象真實情況:陽性 | 被測對象真實情況:陰性 | |
---|---|---|
新冠檢測結果:陽性 | 5 | 2 |
新冠檢測結果:陰性 | 3 | 90 |
可以得到2個指標的計算結果祝蝠,如下:
(1)true positve rate(sensitivity,即靈敏度):檢測出的真實陽性樣本數(shù) 除以 所有真實陽性樣本數(shù)
(2)false positive rate:檢測出的假陽性樣本數(shù) 除以 所有真實陰性樣本數(shù)
還有一個非常重要的計算指標幻碱,是靈敏度(specificity)绎狭,計算公式如下:
一張找來的總結表:
參考資料
[1] http://www.reibang.com/p/d5ea74ca61f8
[2] https://blog.csdn.net/fish2009122/article/details/110040002
[3] 統(tǒng)計功效, 百度百科
[4] 真陽性率, 百度百度
[5] 假陽性率, 百度百科
[6] https://zhwhong.cn/2017/04/14/ROC-AUC-Precision-Recall-analysis/