舉個(gè)例子:
給100只小鼠注射藥物襟士,結(jié)果分為:有作用和沒作用
這個(gè)例子中,
零假設(shè):沒作用
備擇假設(shè):有作用
P值:零假設(shè)成立或者更極端情況下的概率
概念:
單個(gè)假設(shè)檢驗(yàn)中主要依靠p值(或統(tǒng)計(jì)量t)做出是否拒絕零假設(shè)H0的決定:p-value和預(yù)先設(shè)定的檢驗(yàn)水準(zhǔn)alpha做對比澄港,如果p-value小于等于alpha,拒絕原假設(shè),否則不拒絕原假設(shè)
- p-value:表征了在原假設(shè)成立的條件下啦扬,重復(fù)進(jìn)行當(dāng)前的試驗(yàn),獲得現(xiàn)有統(tǒng)計(jì)量t及其更極端情況的概率廷粒。
- 給定檢驗(yàn)水準(zhǔn)alpha時(shí)戳葵,可得出對應(yīng)的拒絕域;根據(jù)當(dāng)前試驗(yàn)泉懦,可以計(jì)算出p-value稿黍。當(dāng)p-value越小時(shí),表示此時(shí)試驗(yàn)得到的統(tǒng)計(jì)量t越落在拒絕域崩哩。因此基于p-value的結(jié)果等價(jià)于基于t值的結(jié)果巡球。因此,p-value越小邓嘹,拒絕原假設(shè)的信心越大酣栈。
- 假陽性率:false positive rate, FPR.檢驗(yàn)水準(zhǔn)alpha給出了事先犯I-型錯(cuò)誤的最大概率。
4.I型錯(cuò)誤:
零假設(shè)成立卻拒絕
II型錯(cuò)誤:
零假設(shè)不成立卻接受
在進(jìn)行多重假設(shè)檢驗(yàn)時(shí)汹押,每個(gè)單獨(dú)的假設(shè)都具有其本身的I型錯(cuò)誤矿筝。在這種情況下,如果不進(jìn)行任何的控制棚贾,犯I-型錯(cuò)誤的概率會(huì)隨著假設(shè)檢驗(yàn)的個(gè)數(shù)而迅速增加
- 多重假設(shè)檢驗(yàn)中跋涣,廣泛使用的錯(cuò)誤控制指標(biāo)是總體錯(cuò)誤率(family-wise error rate,FWER),即至少出現(xiàn)一次錯(cuò)誤地拒絕真實(shí)H0的可能性;FWER小于等于alpha鸟悴。而研究者更關(guān)心的是能否盡量多地識別出差異表達(dá)的基因陈辱,并且能夠容忍和允許總的拒絕中發(fā)生少量的錯(cuò)誤識別,稱為錯(cuò)誤發(fā)現(xiàn)false discovery细诸。即需要在錯(cuò)誤發(fā)現(xiàn)和總的拒絕次數(shù)R之間尋找一種平衡沛贪,即在檢驗(yàn)出盡可能多的候選變量的同時(shí)將錯(cuò)誤發(fā)現(xiàn)率控制在一個(gè)可以接受的范圍。
- 錯(cuò)誤發(fā)現(xiàn)率(False Discovery Rate,FDR)震贵,表示了在所有R次拒絕中錯(cuò)誤發(fā)現(xiàn)的期望比例利赋。錯(cuò)誤發(fā)現(xiàn)率和假陽性率之間有著本質(zhì)的差別。錯(cuò)誤發(fā)現(xiàn)率將范圍限定在總的拒絕次數(shù)中猩系;而假陽性率則針對所有變量數(shù)而言媚送。
- 給定FDR的控制水平alpha,多重假設(shè)檢驗(yàn)次數(shù)M寇甸,通過求得拒絕H0的次數(shù)N塘偎,可得出多重檢驗(yàn)M次中疗涉,有多少次是被錯(cuò)誤識別的(=alpha * N)。Benjamini和Hochberg給出了一個(gè)基于p-value的逐步向下控制程序吟秩,用于求出拒絕H0的次數(shù)N的值咱扣。并且證明在BH控制下,F(xiàn)DR 小于等于 alpha涵防。
4.很多時(shí)候希望在得到更多差異結(jié)果和控制錯(cuò)誤發(fā)現(xiàn)率之間找到平衡