LD SCore計算基因多效性晌畅、遺傳度但指、遺傳相關性(the LD Score regression intercept, heritability and genetic correlation)

這篇文章是對之前啊啊救救我,為何我的QQ圖那么飄(全基因組關聯(lián)分析)這篇文章的一個補坑抗楔。

LD SCore除了查看顯著SNP位點對表型是否為基因多效性外棋凳,還額外補充了怎么計算表型的遺傳度和遺傳相關性。

1 下載连躏、安裝ldsc

git clone https://github.com/bulik/ldsc.git

cd ldsc

2 安裝ldsc依賴的環(huán)境

conda env create --file environment.yml

source activate ldsc

3 測試是否安裝成功

如果安裝成功剩岳,輸入./ldsc.py -h代碼會出現(xiàn)如下圖:
?

輸入./munge_sumstats.py -h代碼會出現(xiàn)如下圖:
?

4 準備summary文件summary.txt

summary.txt為關聯(lián)分析的summary數(shù)據(jù),包含rs編號入热、染色體編號拍棕、位置、A1(效應等位基因)勺良、A2(無效等位基因)绰播、效應值(OR或BETA)、P值尚困,如下圖所示:

5 將summary文件轉(zhuǎn)換為ldsc格式

munge_sumstats.py --sumstats summary.txt --N 17115 --out scz --merge-alleles w_hm3.snplist

這里的N指的是研究的樣本數(shù)量蠢箩;

scz是輸出的文件名;

w_hm3.snplist是被納入分析的SNP事甜,包含三列:包含rs編號谬泌、位置、A1(效應等位基因)逻谦、A2(無效等位基因)# 這一步可有可無#

如果想把所有的SNP位點納入分析掌实,那么采用這個命令: munge_sumstats.py --sumstats summary.txt --N 17115 --out scz

這一步會生成scz.sumstats.gz的文件;

6 將基因型數(shù)據(jù)按染色體分開

for q in $(seq 1 22); do plink --bfile file --chr $q --make-bed --out chr$q done

這個步驟會生成22個plink格式文件(bed,bim,fam)邦马,每一個文件代表一條染色體贱鼻。

7 計算LD

for q in $(seq 1 22); do ldsc.py --bfile chr$q --l2 --ld-wind-cm 5 --yes-really --out chr/$q done

生成的文件如下所示:

8 計算回歸截距和遺傳度(the LD Score regression intercept and heritability)

ldsc.py --h2 scz.sumstats.gz --ref-ld-chr chr/ --w-ld-chr chr/ --out scz_h2

scz.sumstats.gz為步驟5生成的文件

chr/ 為步驟7生成的LD文件路徑

scz_h2為回歸截距和遺傳度的輸出文件

9 查看回歸截距(LD Score regression intercept )

less scz_h2.log

輸出文件最底部:

Intercept: 1.0252 (0.0075)

截距為1.0252

關于回歸截距怎么看宴卖,請看之前發(fā)過的推文:啊啊救救我,為何我的QQ圖那么飄(全基因組關聯(lián)分析)

10 查看遺傳度(heritability)

less scz_h2.log

輸出文件最底部:

Total Observed scale h2: 0.7153 (0.0386)

遺傳度為0.7153

11 計算遺傳相關性(genetic correlation)

ldsc.py --rg trait1.sumstats.gz,trait2.sumstats.gz --ref-ld-chr chr/ --w-ld-chr chr/ --out trait1_trait2

trait1.sumstats.gz為表型1的ldsc格式文件邻悬;

trait2.sumstats.gz為表型2的ldsc格式文件嘱腥;

chr/ 為步驟7生成的LD文件路徑

trait1_trait2為表型1和表型2的遺傳相關性輸出文件;

12 查看遺傳相關性(genetic correlation)

less trait1_trait2.log

輸出文件最底部:

Genetic Correlation: 0.6561 (0.0605)

表型1和表型2的遺傳相關性為0.6561

最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末拘悦,一起剝皮案震驚了整個濱河市齿兔,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌础米,老刑警劉巖分苇,帶你破解...
    沈念sama閱讀 216,324評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異屁桑,居然都是意外死亡医寿,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,356評論 3 392
  • 文/潘曉璐 我一進店門蘑斧,熙熙樓的掌柜王于貴愁眉苦臉地迎上來靖秩,“玉大人,你說我怎么就攤上這事竖瘾」低唬” “怎么了?”我有些...
    開封第一講書人閱讀 162,328評論 0 353
  • 文/不壞的土叔 我叫張陵捕传,是天一觀的道長惠拭。 經(jīng)常有香客問我,道長庸论,這世上最難降的妖魔是什么职辅? 我笑而不...
    開封第一講書人閱讀 58,147評論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮聂示,結果婚禮上域携,老公的妹妹穿的比我還像新娘。我一直安慰自己鱼喉,他們只是感情好秀鞭,可當我...
    茶點故事閱讀 67,160評論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著蒲凶,像睡著了一般气筋。 火紅的嫁衣襯著肌膚如雪拆内。 梳的紋絲不亂的頭發(fā)上旋圆,一...
    開封第一講書人閱讀 51,115評論 1 296
  • 那天,我揣著相機與錄音麸恍,去河邊找鬼灵巧。 笑死搀矫,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的刻肄。 我是一名探鬼主播瓤球,決...
    沈念sama閱讀 40,025評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼敏弃!你這毒婦竟也來了卦羡?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 38,867評論 0 274
  • 序言:老撾萬榮一對情侶失蹤麦到,失蹤者是張志新(化名)和其女友劉穎绿饵,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體瓶颠,經(jīng)...
    沈念sama閱讀 45,307評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡拟赊,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,528評論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了粹淋。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片吸祟。...
    茶點故事閱讀 39,688評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖桃移,靈堂內(nèi)的尸體忽然破棺而出屋匕,到底是詐尸還是另有隱情,我是刑警寧澤借杰,帶...
    沈念sama閱讀 35,409評論 5 343
  • 正文 年R本政府宣布炒瘟,位于F島的核電站,受9級特大地震影響第步,放射性物質(zhì)發(fā)生泄漏疮装。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,001評論 3 325
  • 文/蒙蒙 一粘都、第九天 我趴在偏房一處隱蔽的房頂上張望廓推。 院中可真熱鬧,春花似錦翩隧、人聲如沸樊展。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,657評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽专缠。三九已至,卻和暖如春淑仆,著一層夾襖步出監(jiān)牢的瞬間涝婉,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,811評論 1 268
  • 我被黑心中介騙來泰國打工蔗怠, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留墩弯,地道東北人吩跋。 一個月前我還...
    沈念sama閱讀 47,685評論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像渔工,于是被迫代替她去往敵國和親锌钮。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,573評論 2 353