多重假設(shè)檢驗(yàn)與Bonferroni校正、FDR校正

摘抄于網(wǎng)頁(yè)

多重假設(shè)檢驗(yàn)與Bonferroni校正星岗、FDR校正

總結(jié)起來(lái)就三句話(huà):

(1)當(dāng)同一個(gè)數(shù)據(jù)集有n次(n>=2)假設(shè)檢驗(yàn)時(shí)填大,要做多重假設(shè)檢驗(yàn)校正

(2)對(duì)于Bonferroni校正,是將p-value的cutoff除以n做校正俏橘,這樣差異基因篩選的p-value cutoff就更小了允华,從而使得結(jié)果更加嚴(yán)謹(jǐn)

(3)FDR校正是對(duì)每個(gè)p-value做校正,轉(zhuǎn)換為q-value寥掐。q=p*n/rank靴寂,其中rank是指p-value從小到大排序后的次序。

舉一個(gè)具體的實(shí)例:

我們測(cè)量了M個(gè)基因在A,B,C,D,E一共5個(gè)時(shí)間點(diǎn)的表達(dá)量召耘,求其中的差異基因百炬,具體做法:

(1)首先做ANOVA,確定這M個(gè)基因中有哪些基因至少出現(xiàn)過(guò)差異

(2)5個(gè)時(shí)間點(diǎn)之間兩兩比較污它,一共比較5*4/2=10次剖踊,則多重假設(shè)檢驗(yàn)的n=10

(3)每個(gè)基因做完10次假設(shè)檢驗(yàn)后都有10個(gè)p-value,做多重假設(shè)檢驗(yàn)校正(n=10)衫贬,得到q-value

(4)根據(jù)q-value判斷在哪兩組之間存在差異

通過(guò)T檢驗(yàn)等統(tǒng)計(jì)學(xué)方法對(duì)每個(gè)蛋白進(jìn)行P值的計(jì)算德澈。T檢驗(yàn)是差異蛋白表達(dá)檢測(cè)中常用的統(tǒng)計(jì)學(xué)方法,通過(guò)合并樣本間可變的數(shù)據(jù)固惯,來(lái)評(píng)價(jià)某一個(gè)蛋白在兩個(gè)樣本中是否有差異表達(dá)梆造。

但是由于通常樣本量較少,從而對(duì)總體方差的估計(jì)不很準(zhǔn)確葬毫,所以T檢驗(yàn)的檢驗(yàn)效能會(huì)降低镇辉,并且如果多次使用T檢驗(yàn)會(huì)顯著增加假陽(yáng)性的次數(shù)。

例如贴捡,當(dāng)某個(gè)蛋白的p值小于0.05(5%)時(shí)忽肛,我們通常認(rèn)為這個(gè)蛋白在兩個(gè)樣本中的表達(dá)是有差異的。但是仍舊有5%的概率烂斋,這個(gè)蛋白并不是差異蛋白麻裁。那么我們就錯(cuò)誤地否認(rèn)了原假設(shè)(在兩個(gè)樣本中沒(méi)有差異表達(dá)),導(dǎo)致了假陽(yáng)性的產(chǎn)生(犯錯(cuò)的概率為5%)源祈。

如果檢驗(yàn)一次煎源,犯錯(cuò)的概率是5%;檢測(cè)10000次香缺,犯錯(cuò)的次數(shù)就是500次手销,即額外多出了500次差異的結(jié)論(即使實(shí)際沒(méi)有差異)。為了控制假陽(yáng)性的次數(shù)图张,于是我們需要對(duì)p值進(jìn)行多重檢驗(yàn)校正锋拖,提高閾值诈悍。

方法一.Bonferroni

“最簡(jiǎn)單嚴(yán)厲的方法”

例如,如果檢驗(yàn)1000次兽埃,我們就將閾值設(shè)定為5%/ 1000 = 0.00005侥钳;即使檢驗(yàn)1000次,犯錯(cuò)誤的概率還是保持在N×1000 = 5%柄错。最終使得預(yù)期犯錯(cuò)誤的次數(shù)不到1次舷夺,抹殺了一切假陽(yáng)性的概率。

該方法雖然簡(jiǎn)單售貌,但是檢驗(yàn)過(guò)于嚴(yán)格给猾,導(dǎo)致最后找不到顯著表達(dá)的蛋白(假陰性)。

方法二.FalseDiscovery Rate

“比較溫和的方法校正P值”

FDR(假陽(yáng)性率)錯(cuò)誤控制法是Benjamini于1995年提出的一種方法颂跨,基本原理是通過(guò)控制FDR值來(lái)決定P值的值域敢伸。相對(duì)Bonferroni來(lái)說(shuō),F(xiàn)DR用比較溫和的方法對(duì)p值進(jìn)行了校正恒削。其試圖在假陽(yáng)性和假陰性間達(dá)到平衡池颈,將假/真陽(yáng)性比例控制到一定范圍之內(nèi)。例如钓丰,如果檢驗(yàn)1000次躯砰,我們?cè)O(shè)定的閾值為0.05(5%),那么無(wú)論我們得到多少個(gè)差異蛋白斑粱,這些差異蛋白出現(xiàn)假陽(yáng)性的概率保持在5%之內(nèi)弃揽,這就叫FDR<5%脯爪。

那么我們?cè)趺磸膒 value 來(lái)估算FDR呢则北,人們?cè)O(shè)計(jì)了幾種不同的估算模型。其中使用最多的是Benjamini and Hochberg方法痕慢,簡(jiǎn)稱(chēng)BH法尚揣。雖然這個(gè)估算公式并不夠完美,但是也能解決大部分的問(wèn)題掖举,主要還是簡(jiǎn)單好用快骗!

FDR的計(jì)算方法

除了可以使用excel的BH計(jì)算方法外,對(duì)于較大的數(shù)據(jù)塔次,我們推薦使用R命令p.adjust方篮。


FDR的計(jì)算方法

除了可以使用excel的BH計(jì)算方法外,對(duì)于較大的數(shù)據(jù)励负,我們推薦使用R命令p.adjust藕溅。 p.adjust(p, method = p.adjust.methods, n = length(p))

> p.adjustfunction (p, method = p.adjust.methods, n = length(p)){ method <- match.arg(method) if (method == "fdr")

? ? method <- "BH"? ? nm <- names(p)? ? p <- as.numeric(p)? ? ……? ? BH = {? ? ? ? i <- lp:1L? ? ? ? o <- order(p, decreasing = TRUE)? ? ? ? ro <- order(o)? ? ? ? pmin(1, cummin(n/i * p[o]))[ro]? ? }? ? ……? ? p0}


其實(shí)該函數(shù)表達(dá)的意思是這樣的:

我們將一系列p值、校正方法(BH)以及所有p值的個(gè)數(shù)(length(p))輸入到p.adjust函數(shù)中继榆。

將一系列的p值按照從大到小排序巾表,然后利用下述公式計(jì)算每個(gè)p值所對(duì)應(yīng)的FDR值汁掠。 公式:p * (n/i), p是這一次檢驗(yàn)的p value集币,n是檢驗(yàn)的次數(shù)考阱,i是排序后的位置ID(如最大的P值的i值肯定為n,第二大則是n-1鞠苟,依次至最小為1)乞榨。

將計(jì)算出來(lái)的FDR值賦予給排序后的p值,如果某一個(gè)p值所對(duì)應(yīng)的FDR值大于前一位p值(排序的前一位)所對(duì)應(yīng)的FDR值偶妖,則放棄公式計(jì)算出來(lái)的FDR值姜凄,選用與它前一位相同的值。因此會(huì)產(chǎn)生連續(xù)相同F(xiàn)DR值的現(xiàn)象趾访;反之則保留計(jì)算的FDR值态秧。

將FDR值按照最初始的p值的順序進(jìn)行重新排序,返回結(jié)果扼鞋。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末申鱼,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子云头,更是在濱河造成了極大的恐慌捐友,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,372評(píng)論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件溃槐,死亡現(xiàn)場(chǎng)離奇詭異匣砖,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)昏滴,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門(mén)猴鲫,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人谣殊,你說(shuō)我怎么就攤上這事拂共。” “怎么了姻几?”我有些...
    開(kāi)封第一講書(shū)人閱讀 162,415評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵宜狐,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我蛇捌,道長(zhǎng)抚恒,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,157評(píng)論 1 292
  • 正文 為了忘掉前任络拌,我火速辦了婚禮俭驮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘盒音。我一直安慰自己表鳍,他們只是感情好馅而,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,171評(píng)論 6 388
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著譬圣,像睡著了一般瓮恭。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上厘熟,一...
    開(kāi)封第一講書(shū)人閱讀 51,125評(píng)論 1 297
  • 那天屯蹦,我揣著相機(jī)與錄音,去河邊找鬼绳姨。 笑死登澜,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的飘庄。 我是一名探鬼主播脑蠕,決...
    沈念sama閱讀 40,028評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼跪削!你這毒婦竟也來(lái)了谴仙?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 38,887評(píng)論 0 274
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤碾盐,失蹤者是張志新(化名)和其女友劉穎晃跺,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體毫玖,經(jīng)...
    沈念sama閱讀 45,310評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡掀虎,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,533評(píng)論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了付枫。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片烹玉。...
    茶點(diǎn)故事閱讀 39,690評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖励背,靈堂內(nèi)的尸體忽然破棺而出春霍,到底是詐尸還是另有隱情砸西,我是刑警寧澤叶眉,帶...
    沈念sama閱讀 35,411評(píng)論 5 343
  • 正文 年R本政府宣布,位于F島的核電站芹枷,受9級(jí)特大地震影響衅疙,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜鸳慈,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,004評(píng)論 3 325
  • 文/蒙蒙 一饱溢、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧走芋,春花似錦绩郎、人聲如沸潘鲫。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,659評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)溉仑。三九已至,卻和暖如春状植,著一層夾襖步出監(jiān)牢的瞬間浊竟,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,812評(píng)論 1 268
  • 我被黑心中介騙來(lái)泰國(guó)打工津畸, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留振定,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,693評(píng)論 2 368
  • 正文 我出身青樓肉拓,卻偏偏與公主長(zhǎng)得像后频,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子暖途,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,577評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容