1、關(guān)于潛關(guān)聯(lián)SNP的篩選
篩選疾病風(fēng)險(xiǎn)SNP時(shí),選擇GWAS p值小于0.05的結(jié)果 并不是一個(gè)最佳的策略,尤其是在全基因組范圍的關(guān)聯(lián)分析中讥脐。這是因?yàn)樵贕WAS中,通常要對(duì)數(shù)百萬(wàn)個(gè)SNP進(jìn)行檢驗(yàn)啼器,因此使用標(biāo)準(zhǔn)的p值閾值(例如0.05)會(huì)導(dǎo)致大量的假陽(yáng)性結(jié)果旬渠。為了解決這一問(wèn)題,GWAS分析中通常使用更嚴(yán)格的多重檢驗(yàn)校正閾值端壳。
為什么不建議使用 p < 0.05告丢?
- 多重檢驗(yàn)問(wèn)題:在GWAS中,數(shù)百萬(wàn)個(gè)SNP同時(shí)被檢驗(yàn)损谦。如果僅使用p < 0.05的標(biāo)準(zhǔn)岖免,大量的SNP可能由于隨機(jī)波動(dòng)而被錯(cuò)誤地標(biāo)記為顯著。這會(huì)導(dǎo)致大量的假陽(yáng)性照捡。
- 假陽(yáng)性率過(guò)高:考慮到GWAS分析中通常涉及數(shù)百萬(wàn)次比較颅湘,使用p < 0.05 的標(biāo)準(zhǔn)會(huì)產(chǎn)生大量的假陽(yáng)性。以p < 0.05篩選時(shí)栗精,大約會(huì)有5%的無(wú)效 SNP 被錯(cuò)誤地認(rèn)為是顯著的闯参。
推薦的 p 值閾值:Bonferroni 校正或False Discovery Rate (FDR)
為了控制假陽(yáng)性,GWAS中通常會(huì)使用以下更嚴(yán)格的校正方法:
(1). Bonferroni 校正:
- Bonferroni校正是一種較為保守的多重比較校正方法悲立,它將標(biāo)準(zhǔn)的p值閾值除以檢驗(yàn)的總次數(shù)(SNP數(shù)目)鹿寨。
- 假設(shè)你檢驗(yàn)了1,000,000個(gè)SNP,Bonferroni校正后的p值閾值會(huì)是 0.05 / 1,000,000 = 5 × 10??薪夕。
- 在GWAS中脚草,p < 5 × 10?? 通常被認(rèn)為是全基因組顯著性閾值,用于識(shí)別有顯著關(guān)聯(lián)的SNP寥殖。
(2). False Discovery Rate (FDR) 控制:
- FDR 控制是一種稍微寬松的校正方法玩讳,可以控制錯(cuò)誤識(shí)別的比例涩蜘,而不是完全排除所有的假陽(yáng)性嚼贡。
- 常用的FDR閾值是 q < 0.05,這意味著允許最高5%的假陽(yáng)性結(jié)果同诫。
結(jié)論
雖然p < 0.05在其他統(tǒng)計(jì)分析中是常見(jiàn)的顯著性標(biāo)準(zhǔn)粤策,但在GWAS中并不合適,因?yàn)樯婕暗酱罅康腟NP測(cè)試误窖。更合理的方法是使用p < 5 × 10??作為全基因組顯著性的標(biāo)準(zhǔn)叮盘,或者使用FDR校正來(lái)篩選有顯著關(guān)聯(lián)的SNP秩贰。
某些情況下,GWAS 樣本量相對(duì)較小柔吼,或者研究對(duì)象具有獨(dú)特的遺傳背景毒费,嚴(yán)格的閾值可能過(guò)于保守,導(dǎo)致更高的假陰性率愈魏,從而漏掉真正與性狀相關(guān)的SNP觅玻,無(wú)法捕獲潛在信號(hào)。