Power Analysis 是躲不掉的,但是網(wǎng)上的數(shù)據(jù)林林總總,有好有壞炮障,甚至還有不少錯(cuò)誤,因此自己總結(jié)一下然低,用于備忘。
對(duì)于假設(shè)檢驗(yàn)宏粤,是通過(guò)樣本觀察總體脚翘,并以此來(lái)支撐或否定我們對(duì)總體某一特征的假設(shè)。我們的樣本數(shù)據(jù)可能是不完善的绍哎,因此依據(jù)數(shù)據(jù)推斷總體可能會(huì)面臨兩種風(fēng)險(xiǎn)来农。
1. 兩種風(fēng)險(xiǎn)
如果我們的是我們的陽(yáng)性結(jié)果(一般來(lái)說(shuō),我們都希望拒絕得到所謂的顯著性差異)崇堰,假設(shè)的結(jié)果和事實(shí)之間沃于,可能是如下這種關(guān)系:
判斷\事實(shí) | 為真 | 為假 |
---|---|---|
接受 | TN(真陰性) | FN(假陰性) |
拒絕 | FP(假陽(yáng)性) | TP(真陽(yáng)性) |
其中假陽(yáng)性就是所謂的第一類(lèi)錯(cuò)誤涩咖,假陰性就是第二類(lèi)錯(cuò)誤的風(fēng)險(xiǎn)。在數(shù)學(xué)的概念中繁莹,分別叫做 “棄真”檩互、“取偽”。
此外咨演,還有一些定義需要知道:
- 假陽(yáng)性率
即在所有陰性的事實(shí)中闸昨,判斷成陽(yáng)性的比率是多少。
- 假陰性率
在所有陽(yáng)性的事實(shí)中薄风,判斷為陰性的比率饵较。
- 真陽(yáng)性率
在所有陽(yáng)性的事實(shí)中,判斷為陽(yáng)性的比率遭赂。
- 真陰性率
在所有陰性的事實(shí)中循诉,判斷為陰性的比率。
- 顯著性水平
即犯第一類(lèi)錯(cuò)誤(假陽(yáng)性)的概率撇他,即假陽(yáng)性率(FPR)茄猫,通常用表示,
2. 功效函數(shù)
對(duì)于我們的假設(shè)困肩,可能并不是合適的划纽。比如,僻弹,這個(gè)可能只是我們自己拍腦袋決定的阿浓。因此對(duì)于這個(gè)他嚷,不同的取值之間蹋绽,我們的樣本落在拒絕域的概率是不一樣的。
這時(shí)候就需要一個(gè)關(guān)于函數(shù)筋蓖,對(duì)于其不同的取值卸耘,計(jì)算這個(gè)概率,以評(píng)價(jià)在當(dāng)前樣本下粘咖,我們的最優(yōu)的假設(shè)應(yīng)該是什么取值蚣抗。這個(gè)函數(shù)就是功效函數(shù)。為:
是在顯著性水平下的拒絕域瓮下。
3. 功效
功效的定義與功效函數(shù)有點(diǎn)區(qū)別翰铡,更接近拒絕域原來(lái)的意義。是指在為假的情況下讽坏,樣本落在拒絕域的概率锭魔,也就是備擇假設(shè)的功效。
事實(shí)上為真
此時(shí)可能犯第一類(lèi)錯(cuò)誤路呜,棄真而出現(xiàn)假陽(yáng)性迷捧。第一類(lèi)風(fēng)險(xiǎn)的概率(FPR)為 织咧。事實(shí)上為假
此時(shí)可能犯第二類(lèi)錯(cuò)誤,取偽而出現(xiàn)假陰性漠秋。第二類(lèi)風(fēng)險(xiǎn)的概率(FNR)為 笙蒙。功效的定義是
在備擇假設(shè)成立時(shí),樣本落在拒絕域的概率庆锦。也有的定義是1-第二類(lèi)風(fēng)險(xiǎn)(假陰性)捅位,即,也即搂抒,此時(shí)绿渣,功效的定義即:
其他的定義
也有的教科書(shū),為了簡(jiǎn)化定義燕耿,就直接定義第一類(lèi)錯(cuò)誤的概率為中符,第二類(lèi)錯(cuò)誤的概率為,功效為誉帅。如果不是從功效函數(shù)那里繼承下來(lái)這種符號(hào)標(biāo)記淀散,我也傾向于這種更簡(jiǎn)潔的記法。
4. 兩類(lèi)錯(cuò)誤不能同時(shí)變小
這兩類(lèi)錯(cuò)誤都是我們不希望見(jiàn)到的蚜锨。乍一看档插,這句話很對(duì)啊,畢竟二者發(fā)生的概率相加得1亚再。
(這個(gè)圖來(lái)源于百度百科_功效函數(shù))
但是細(xì)一想郭膛,這兩種錯(cuò)誤是來(lái)源于不同情況下的條件概率,應(yīng)該是關(guān)系不大的氛悬。為啥二者扯上關(guān)系啦则剃?
我的理解是,我們最難的就是知道總體的絕對(duì)真實(shí)情況如捅,我們有的只有有限的樣本棍现。我們只能根據(jù)這些有限的樣本、顯著性水平和我們假設(shè)的計(jì)算功效函數(shù)镜遣,但是并不知道總體的真實(shí)情況己肮。因此,站在不精確世界的角度上悲关,我們有的只是這兩個(gè)條件概率谎僻,這兩個(gè)風(fēng)險(xiǎn),這兩個(gè)犯錯(cuò)誤的概率寓辱。我們擴(kuò)大樣本艘绍、改變顯著性水平等,對(duì)他們是同時(shí)改變的讶舰,因此是不能一起降低的鞍盗。
5. 功效分析
功效分析(Power Analysis)可以幫助我們?cè)O(shè)計(jì)實(shí)驗(yàn)需了。該分析涉及到以下四個(gè)量,知道三個(gè)就可以推算第四個(gè)般甲。
- 功效:TPR肋乍,即正確發(fā)現(xiàn)陽(yáng)性的概率
- 顯著性水平:FPR
- 樣本大小:即樣本的數(shù)目n
- 效應(yīng)值(effect size, ES):樣本間差異或相關(guān)程度的量化指標(biāo)敷存,即標(biāo)準(zhǔn)化了的真假(或者差異)的閾值墓造。
具體的功效分析,可以用于比例檢驗(yàn)锚烦、t檢驗(yàn)觅闽、卡方檢驗(yàn)、ANOVA涮俄、相關(guān)性分析蛉拙、線性模型分析等。
6. 效應(yīng)值ES的計(jì)算
待續(xù)彻亲。孕锄。。
參考書(shū)目:
1.高等工程數(shù)學(xué)苞尝,吳孟達(dá)畸肆,李兵等編著,科學(xué)出版社宙址,P150
2.R語(yǔ)言實(shí)戰(zhàn)(第二版)轴脐,Robert I. Kabacoff,中國(guó)工信出版集團(tuán)&人民郵電出版社抡砂,第10章 功效分析
3.百度百科_功效函數(shù)