原文摘自生物秀,經(jīng)筆者編輯修改
數(shù)據(jù)分析中常碰見多重檢驗(yàn)問題(multiple testing).Benjamini于1995年提出一種方法,通過控制FDR(False Discovery Rate)來決定P值的域值. 假設(shè)你挑選了R個(gè)差異表達(dá)的基因塑娇,其中有S個(gè)是真正有差異表達(dá)的,另外有V個(gè)其實(shí)是沒有差異表達(dá)的哨啃,是假陽性的.實(shí)踐中希望錯(cuò)誤比例Q=V/R平均而言不能超過某個(gè)預(yù)先設(shè)定的值(比如0.05),在統(tǒng)計(jì)學(xué)上拳球,這也就等價(jià)于控制FDR不能超過5%.根據(jù)Benjamini在他的文章中所證明的定理,控制fdr的步驟實(shí)際上非常簡(jiǎn)單邑跪。
設(shè)總共有m個(gè)候選基因呼猪,每個(gè)基因?qū)?yīng)的p值從小到大排列分別是p(1),p(2),...,p(m),則若想控制fdr不能超過q砸琅,則只需找到最大的正整數(shù)i,使得 p(i)<= (iq)/m.然后谚赎,挑選對(duì)應(yīng)p(1),p(2),...,p(i)的基因做為差異表達(dá)基因诱篷,這樣就能從統(tǒng)計(jì)學(xué)上保證fdr不超過q。*
- P-value 是 (在H0 = true的情況下)得到和試驗(yàn)數(shù)據(jù)一樣極端(或更極端)的統(tǒng)計(jì)量的概率. 它不是H1發(fā)生的概率. 假定吃蘋果的一組和不吃蘋果的一組的差異為D, P-value=0.2的意思是, pure randomly (即H0=true)的情況下, 觀察到和D一樣或比D更大的差異的概率是20%.
- P-value 的本質(zhì)是控制PFR (false positive rate), hypothesis test 的目的是make decision. 傳統(tǒng)上把小概率事件的概率定義為0.05或0.01, 但不總是這樣. 主要根據(jù)研究目的. 在一次試驗(yàn)中(注意:是一次試驗(yàn), 即single test), 0.05 或0.01的cutoff足夠嚴(yán)格了(想象一下, 一個(gè)口袋有100個(gè)球, 95個(gè)白的, 5個(gè)紅的, 只讓你摸一次, 你能摸到紅的可能性是多大?). 我剛才強(qiáng)調(diào)的是single test, 在multiple test中, 通常不用p-value, 而采用更加嚴(yán)格的q-value. 與p-value 不同, q-value 控制的是FDR (false discovery rate).
- 舉個(gè)例子.假如有一種診斷艾滋病(AIDS)的試劑, 試驗(yàn)驗(yàn)證其準(zhǔn)確性為99%(每100次診斷就有一次false positive). 對(duì)于一個(gè)被檢測(cè)的人(single test) 來說, 這種準(zhǔn)確性夠了. 但對(duì)于醫(yī)院 (multiple test) 來說, 這種準(zhǔn)確性遠(yuǎn)遠(yuǎn)不夠, 因?yàn)槊吭\斷10 000個(gè)個(gè)體, 就會(huì)有100個(gè)人被誤診為艾滋病(AIDS).
- 總之, 如果你很care false positive, p-value cutoff 就要很低. 如果你很care false negative (就是"寧可錯(cuò)殺一千, 也不能漏掉一個(gè)" 情況), p-value 可以適當(dāng)放松到 0.1, 0.2 都是可以的.
現(xiàn)有FDR控制方法最大的弊端在于闸盔,他們假設(shè)p-value"s under the null hypothesis是(1)independent(2)following uniform (0,1) distribution. 這兩點(diǎn)假設(shè)從實(shí)際觀察到的數(shù)據(jù)來看經(jīng)常是不合理的琳省,尤其是第二點(diǎn)。(順便提一句针贬,Storey和Leek在07年的PLOS Genetics發(fā)表了一篇文章專門解決第二個(gè)假設(shè)的合理性問題,很牛蔫巩,有興趣可以看一下)
**Bonferroni校正 *
如果在同一數(shù)據(jù)集上同時(shí)檢驗(yàn)n個(gè)獨(dú)立的假設(shè)快压,那么用于每一假設(shè)的統(tǒng)計(jì)顯著水平,應(yīng)為僅檢驗(yàn)一個(gè) 假設(shè)時(shí)的顯著水平的1/n嗓节。舉個(gè)例子:如要在同一數(shù)據(jù)集上檢驗(yàn)兩個(gè)獨(dú)立的假設(shè)拦宣,顯著水平設(shè)為常見的0.05信姓。此時(shí)用于檢驗(yàn)該兩個(gè)假設(shè)應(yīng)使用更嚴(yán)格的 0.025绸罗。即0.05 (1/2)意推。該方法是由Carlo Emilio Bonferroni發(fā)展的,因此稱Bonferroni校正珊蟀。 這樣做的理由是基于這樣一個(gè)事實(shí):在同一數(shù)據(jù)集上進(jìn)行多個(gè)假設(shè)的檢驗(yàn)菊值,每20個(gè)假設(shè)中就有一個(gè)可能純粹由于概率,而達(dá)到0.05的顯著水平育灸。
參考文獻(xiàn):
[1].Audic, S. and J. M. Claverie (1997). The significance of digital gene expression profiles. Genome Res 7(10): 986-95.
[2].Benjamini, Y. and D. Yekutieli (2001). The control of the false discovery rate in multiple testing under dependency. The Annals of Statistics. 29: 1165-1188.
[3]. Benjamini Y, Hochberg Y. Controlling The False Discovery Rate - A Practical And Powerful Approach To Multiple Testing[J]. Journal of the Royal Statistical Society, 1995, 57(57):289-300.