使用susieR鑒定多個因果變異位點(diǎn)只需要兩個輸入文件形纺,一個輸入文件是包含Zscore值的SNP位點(diǎn)(zscore.txt)懦胞,另一個文件是LD matrix(LD.matrix.ld)互墓。
zscore.txt 文件如下所示:
LD.matrix.ld 文件如下所示:
LD.matrix.ld 文件是通過plink生成的夫凸,使用到的命令如下:
plink --bfile file --r2 --matrix --out LD.matrix
其中亩歹,file是指包含zscore.txt文件中所有SNP的plink格式文件象迎。注意,file.bim的SNP順序要跟zscore.txt的SNP一列的順序完全一致慰枕,不然后面運(yùn)行susieR的時候會報(bào)錯具则。
通過以上命令得到LD.matrix.ld 文件后,即可通過susieR包鑒定多個因果變異位點(diǎn)具帮,如下所示:
install.packages("susieR")
rm(list=ls())
library(susieR)
library(data.table)
eq=read.table("zscore.txt", sep="\t", stringsAsFactors=FALSE,header=F)
dat <- fread("LD.matrix.ld")
dat1=as.matrix(dat)
fitted_rss3 <- susie_rss(c(eq$zscore), dat1, n=eq$N, L = 10)
susie_plot(fitted_rss3, y="PIP")
summary(fitted_rss3)$cs
運(yùn)行susie_plot(fitted_rss3, y="PIP")
命令后得到如下圖像:
其中博肋,真正的因果變量以紅色顯示。95%的因果集通過三種不同的顏色(綠色蜂厅、紫色匪凡、藍(lán)色)來表示。
運(yùn)行summary(fitted_rss3)$cs
命令后得到如下結(jié)果:
# cs cs_log10bf cs_avg_r2 cs_min_r2
# 1 2 4.033879 1.0000000 1.0000000
# 2 1 6.744086 0.9634847 0.9634847
# 3 3 3.461470 0.9293299 0.7545197
# variable
# 1 653
# 2 773,777
# 3 362,365,372,373,374,379,381,383,384,386,387,388,389,391,392,396,397,398,399,400,401,403,404,405,407,408,415
結(jié)果表示這三個因果信號已被三個因果集(CSs)捕獲掘猿。注意的是病游,第三個因果集中包含許多變量,包括真正的因果變量403稠通。