post-GWAS:使用coloc進(jìn)行共定位分析(Colocalization)

GWAS找到顯著信號位點(diǎn)后叭爱,需要解釋顯著信號位點(diǎn)如何影響表型挟憔。
常見的一個(gè)解釋方法是共定位分析。

主流的共定位分析包括:

  • 1)GWAS和eQTL共定位峦失;
  • 2)GWAS和sQTL共定位悴灵;
  • 3)GWAS和meQTL共定位;
  • 4)GWAS和pQTL共定位腿短;

其中屏箍,GWAS和eQTL共定位應(yīng)用最為廣泛。

具體來說橘忱,當(dāng)檢測到GWAS信號和eQTL共定位時(shí)赴魁,我們會認(rèn)為GWAS信號上的位點(diǎn)可能通過改變基因表達(dá)的生物學(xué)過程影響表型。

共定位分析有四種設(shè)想:

  第一種設(shè)想 H0: 表型1(GWAS)和 表型2 (以eQTL為例)與某個(gè)基因組區(qū)域的所有SNP位點(diǎn)無顯著相關(guān)钝诚;  
  第二種設(shè)想 H1/H2: 表型1(GWAS)或表型2(以eQTL為例)與某個(gè)基因組區(qū)域的SNP位點(diǎn)顯著相關(guān)颖御;
  第三種設(shè)想 H3: 表型1(GWAS)和 表型2 (以eQTL為例)與某個(gè)基因組區(qū)域的SNP位點(diǎn)顯著相關(guān),但由不同的因果變異位點(diǎn)驅(qū)動凝颇;
   第四種設(shè)想 H4: 表型1(GWAS)和 表型2 (以eQTL為例)與某個(gè)基因組區(qū)域的SNP位點(diǎn)顯著相關(guān)潘拱,且由同一個(gè)因果變異位點(diǎn)驅(qū)動;

基于以上四種設(shè)想拧略,我們希望第四種設(shè)想 H4 在統(tǒng)計(jì)學(xué)上概率更高芦岂,這樣就能解釋顯著信號位點(diǎn)如何影響表型;

所以共定位分析垫蛆,本質(zhì)上是在檢驗(yàn)第四種的后驗(yàn)概率禽最;

講完共定位分析的相關(guān)概念,接下來我們以“GWAS和eQTL共定位”為例講一下如何使用coloc進(jìn)行共定位分析袱饭。

1 下載川无、安裝coloc

if(!require("remotes"))
  install.packages("remotes")
  install.packages("dplyr")
library(remotes)
install_github("chr1swallace/coloc",build_vignettes=TRUE)
library("coloc")
library(dplyr)

2 下載測試數(shù)據(jù)

測試數(shù)據(jù)請?jiān)凇癰io生物信息”回復(fù)"coloc";
或者用自己的數(shù)據(jù)分析(如果有的話)虑乖;

3 分析

3.1 導(dǎo)入表型1(GWAS)數(shù)據(jù):

gwas <- read.table(file="E:/path_to_GWAS/GWAS.txt", header=T);

GWAS數(shù)據(jù)包括:rs編號rs_id懦趋,P值pval_nominal等:

image

注意事項(xiàng):如果表型是二分類變量(case和control),輸入文件二選一:

1)rs編號rs_id疹味、P值pval_nominal仅叫、SNP的效應(yīng)值beta帜篇、效應(yīng)值方差varbeta

2)rs編號rs_id惑芭、P值pval_nominal坠狡、case在所有樣本中的比例s

3.2 導(dǎo)入表型2(eQTL)數(shù)據(jù):

eqtl <- read.table(file="E:/path_to_eqtl/eQTL.txt", header=T);

eQTL數(shù)據(jù)包括:rs編號rs_id,基因gene_id遂跟,次等位基因頻率maf、P值pval_nominal等:

image

注意事項(xiàng):如果表型是連續(xù)型變量婴渡,輸入文件三選一:

1)rs編號rs_id幻锁、P值pval_nominal、表型的標(biāo)準(zhǔn)差sdY边臼;

2)rs編號rs_id哄尔、P值pval_nominal、效應(yīng)值beta,效應(yīng)值方差 varbeta, 樣本量N,次等位基因頻率 MAF柠并;

3)rs編號rs_id岭接、P值pval_nominal、次等位基因頻率 MAF臼予;

3.3 合并GWAS和eQTL數(shù)據(jù):

input <- merge(eqtl, gwas, by="rs_id", all=FALSE, suffixes=c("_eqtl","_gwas"))
head(input)
image

3.4 共定位分析

result <- coloc.abf(dataset1=list(pvalues=input$pval_nominal_gwas, type="cc", s=0.33, N=50000), dataset2=list(pvalues=input$pval_nominal_eqtl, type="quant", N=10000), MAF=input$maf)

dataset1的type="cc"指的是GWAS的表型是二分類(case和control)鸣戴;

dataset2的type="quant"指的是eQTL的表型(基因表達(dá)量)是連續(xù)型

N指樣本量;

3.5 篩選共定位的位點(diǎn)

通常情況下粘拾,很多文獻(xiàn)認(rèn)為PPA > 0.95的位點(diǎn)是共定位位點(diǎn)窄锅,也有一些文獻(xiàn)會放松要求到0.75。

這里假定后驗(yàn)概率大于0.95為共定位位點(diǎn):

library(dplyr)
need_result=result$results %>% filter(SNP.PP.H4 > 0.95)

結(jié)果如下:

image

從圖上可以看出缰雇,SNP.4811位點(diǎn)的后驗(yàn)概率為1入偷。怎么找到這個(gè)位點(diǎn)呢?可以通過對應(yīng)的P值(1.81e-42)找到這個(gè)位點(diǎn)的rs號械哟;

4 結(jié)果解讀

對于輸出結(jié)果疏之,我們只需要關(guān)注最后一列信息SNP.PP.H4,對應(yīng)推文前面提到的第四種設(shè)想 H4暇咆。

SNP.PP.H4表示的是GWAS顯著信號和eQTL位點(diǎn)為同一個(gè)位點(diǎn)的后驗(yàn)概率锋爪,范圍在0-1之間,0表示概率為0%糯崎,1表示概率為100%几缭。后驗(yàn)概率越高越好。

5 注意事項(xiàng)

1)由于共定位分析是基于某個(gè)基因組區(qū)域進(jìn)行計(jì)算沃呢,所以請不要把全基因組的信息都丟進(jìn)去(偷懶該打)年栓,這么做一個(gè)是沒意義,另外一個(gè)特別耗時(shí)薄霜,給計(jì)算機(jī)增加工作負(fù)擔(dān)某抓;

2)雖然我們沒必要把基因組的全部信息丟進(jìn)去纸兔,但也不意味著只放一個(gè)變異位點(diǎn)信息就行。

3)因此否副,正確的做法是汉矿,先提取GWAS中顯著變異位點(diǎn)上下游區(qū)域(這個(gè)區(qū)域多大自己定,沒有金標(biāo)準(zhǔn))的GWAS summary數(shù)據(jù)备禀,理想情況下洲拇,提取后顯著變異位點(diǎn)所在基因組區(qū)域的SNP數(shù)量在1,000-10,000之間。

4)該方法的設(shè)想是只有一個(gè)causal 位點(diǎn)曲尸,所以如果表型1(GWAS)和 表型2 (以eQTL為例)在某個(gè)區(qū)域有多個(gè)顯著位點(diǎn)的話赋续,用該方法是定位不出結(jié)果的,這是該方法的局限另患,所以如果某個(gè)基因組區(qū)域存在多個(gè)顯著位點(diǎn)纽乱,請考慮其他工具(允許多個(gè)causal 位點(diǎn)共定位的工具)

特別鳴謝:
https://chr1swallace.github.io/coloc/FAQ.html
https://hanruizhang.github.io/GWAS-eQTL-Colocalization/
https://rpubs.com/Charleen_D_Adams/743547


致謝橙子牛奶糖(陳文燕),請用參考模版:We thank the blogger (orange_milk_sugar, Wenyan Chen) for XXX

感謝小可愛們多年來的陪伴昆箕, 我與你們一起成長~

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末鸦列,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子鹏倘,更是在濱河造成了極大的恐慌薯嗤,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,509評論 6 504
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件第股,死亡現(xiàn)場離奇詭異应民,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)夕吻,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,806評論 3 394
  • 文/潘曉璐 我一進(jìn)店門诲锹,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人涉馅,你說我怎么就攤上這事归园。” “怎么了稚矿?”我有些...
    開封第一講書人閱讀 163,875評論 0 354
  • 文/不壞的土叔 我叫張陵庸诱,是天一觀的道長。 經(jīng)常有香客問我晤揣,道長桥爽,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,441評論 1 293
  • 正文 為了忘掉前任昧识,我火速辦了婚禮钠四,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘跪楞。我一直安慰自己缀去,他們只是感情好侣灶,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,488評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著缕碎,像睡著了一般褥影。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上咏雌,一...
    開封第一講書人閱讀 51,365評論 1 302
  • 那天凡怎,我揣著相機(jī)與錄音,去河邊找鬼赊抖。 笑死栅贴,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的熏迹。 我是一名探鬼主播,決...
    沈念sama閱讀 40,190評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼凝赛,長吁一口氣:“原來是場噩夢啊……” “哼注暗!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起墓猎,我...
    開封第一講書人閱讀 39,062評論 0 276
  • 序言:老撾萬榮一對情侶失蹤捆昏,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后毙沾,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體骗卜,經(jīng)...
    沈念sama閱讀 45,500評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,706評論 3 335
  • 正文 我和宋清朗相戀三年左胞,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了寇仓。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,834評論 1 347
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡烤宙,死狀恐怖遍烦,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情躺枕,我是刑警寧澤服猪,帶...
    沈念sama閱讀 35,559評論 5 345
  • 正文 年R本政府宣布,位于F島的核電站拐云,受9級特大地震影響罢猪,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜叉瘩,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,167評論 3 328
  • 文/蒙蒙 一膳帕、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧房揭,春花似錦备闲、人聲如沸晌端。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,779評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽咧纠。三九已至,卻和暖如春泻骤,著一層夾襖步出監(jiān)牢的瞬間漆羔,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,912評論 1 269
  • 我被黑心中介騙來泰國打工狱掂, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留演痒,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,958評論 2 370
  • 正文 我出身青樓趋惨,卻偏偏與公主長得像鸟顺,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子器虾,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,779評論 2 354

推薦閱讀更多精彩內(nèi)容