使用GEMMA進(jìn)行復(fù)雜性狀全基因組關(guān)聯(lián)分析(GWAS)

GEMMA(Genome-wide Efficient Mixed Model Association algorithm)是一款基于混合線性模型的GWAS分析軟件(文獻(xiàn)信息)纽窟。GEMMA相比較于其他基于混合線性模型的軟件精堕,它有如下優(yōu)勢:

  1. 快速:遠(yuǎn)遠(yuǎn)快于其他精確算法(EMMA和FaST-LMM)。
  2. 準(zhǔn)確:EMMAX和GAPIT都采用固定零模型中的方差組分不變的策略來提高運(yùn)算速度宣渗,這實際上就是一種近似算法焕檬,不如GEMMA準(zhǔn)確烹吵。
  3. 方便:可直接使用plink二進(jìn)制格式數(shù)據(jù)涤姊,無需進(jìn)行復(fù)雜的數(shù)據(jù)格式轉(zhuǎn)換疹瘦。
  4. 功能全面:可進(jìn)行單標(biāo)記GWAS、多標(biāo)記GWAS和多性狀GWAS分析噩翠。

1. 軟件下載及安裝

1.1 下載地址: https://github.com/genetics-statistics/GEMMA/releases
選擇最新的穩(wěn)定版0.98.1戏自,下載下圖第一個文件:gemma-0.98.1-linux-static。該文件是匯編好的伤锚,下載后解壓就可以使用

捕獲.PNG

1.2 安裝代碼如下:

gunzip gemma-0.98.1-linux-static.gz #解壓
chmod +x gemma-0.98.1-linux-static #添加執(zhí)行權(quán)限
./gemma-0.98.1-linux-static #運(yùn)行測試

捕獲1.PNG

2. plink 二進(jìn)制文件格式介紹

2.1 plink二進(jìn)制文件分為三部分:

  • plink.bed 包含基因分型的二進(jìn)制文件
  • plink.fam 包含家庭號擅笔、個體號、母親號屯援、母親號猛们、性別、表型狞洋。即plink.ped文件前6列
  • plink.bim 標(biāo)記信息文件弯淘,類似于plink.map文件。

2.2 數(shù)據(jù)準(zhǔn)備
我們使用GEMMA軟件提供的測試數(shù)據(jù)進(jìn)行練習(xí)吉懊。具體數(shù)據(jù)可以在GEMMA下載頁面下載Source code(tar gz)文件并解壓獲得庐橙。

測試數(shù)據(jù).PNG

2.3 運(yùn)行測試數(shù)據(jù)
運(yùn)行時需要先生成kinship矩陣,在使用混合線性模型進(jìn)行分析借嗽。代碼如下:

#計算kinship矩陣
./gemma-0.98.1-linux-static -bfile 2000 -gk 2 -o kin  
#-bfile plink二進(jìn)制文件前綴; -gk 2 生成kinship矩陣時進(jìn)行scale; -o 輸出文件前綴
#將kinship矩陣移動至當(dāng)前目錄
mv ./output/kin.sXX.txt .
#進(jìn)行GWAS分析
./gemma-0.98.1-linux-static -bfile 2000 -k kin.sXX.txt -lmm 1 -o GE_GWAS
#-k 指定kinship矩陣; -lmm 1 使用wald檢驗計算顯著性态鳖。

2.4 輸出結(jié)果解讀
輸出結(jié)果見文件 ./output/GE_GWAS.association.txt.

GWAS結(jié)果.PNG

該文件包含12列結(jié)果。具體含義如下:

  • chr SNP所在染色體號
  • rs SNP名稱
  • ps SNP物理位置
  • n_miss SNP缺失個體數(shù)
  • allele1 次等位基因
  • allele0 主等位基因
  • af SNP頻率
  • beta SNP效應(yīng)值
  • se beta估計標(biāo)準(zhǔn)誤
  • l_remle 計算該SNP效應(yīng)時對應(yīng)的lamda的remle估計值恶导。
  • p_wald wald檢驗P值
    其中浆竭,我們最關(guān)心的三個結(jié)果是chr, ps, p_wald,我們可以借助這三個結(jié)果畫曼哈頓圖和QQ圖惨寿。l_remle比較難理解邦泄,需要懂模型才知道它的含義,但對分析來說缤沦,不是很重要虎韵。

\color{red}{如果你的分析平臺是windows而不是Linux怎么辦易稠?}
有這個問題的同學(xué)可以留言缸废。

GEMMA軟件源碼和說明文檔托管與github中https://github.com/genetics-statistics/GEMMA

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市驶社,隨后出現(xiàn)的幾起案子企量,更是在濱河造成了極大的恐慌,老刑警劉巖亡电,帶你破解...
    沈念sama閱讀 216,402評論 6 499
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件届巩,死亡現(xiàn)場離奇詭異,居然都是意外死亡份乒,警方通過查閱死者的電腦和手機(jī)恕汇,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,377評論 3 392
  • 文/潘曉璐 我一進(jìn)店門腕唧,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人瘾英,你說我怎么就攤上這事枣接。” “怎么了缺谴?”我有些...
    開封第一講書人閱讀 162,483評論 0 353
  • 文/不壞的土叔 我叫張陵但惶,是天一觀的道長。 經(jīng)常有香客問我湿蛔,道長膀曾,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,165評論 1 292
  • 正文 為了忘掉前任阳啥,我火速辦了婚禮添谊,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘察迟。我一直安慰自己碉钠,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,176評論 6 388
  • 文/花漫 我一把揭開白布卷拘。 她就那樣靜靜地躺著喊废,像睡著了一般。 火紅的嫁衣襯著肌膚如雪栗弟。 梳的紋絲不亂的頭發(fā)上污筷,一...
    開封第一講書人閱讀 51,146評論 1 297
  • 那天,我揣著相機(jī)與錄音乍赫,去河邊找鬼瓣蛀。 笑死,一個胖子當(dāng)著我的面吹牛雷厂,可吹牛的內(nèi)容都是我干的惋增。 我是一名探鬼主播,決...
    沈念sama閱讀 40,032評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼改鲫,長吁一口氣:“原來是場噩夢啊……” “哼诈皿!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起像棘,我...
    開封第一講書人閱讀 38,896評論 0 274
  • 序言:老撾萬榮一對情侶失蹤稽亏,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后缕题,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體截歉,經(jīng)...
    沈念sama閱讀 45,311評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,536評論 2 332
  • 正文 我和宋清朗相戀三年烟零,在試婚紗的時候發(fā)現(xiàn)自己被綠了瘪松。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片咸作。...
    茶點故事閱讀 39,696評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖宵睦,靈堂內(nèi)的尸體忽然破棺而出性宏,到底是詐尸還是另有隱情,我是刑警寧澤状飞,帶...
    沈念sama閱讀 35,413評論 5 343
  • 正文 年R本政府宣布毫胜,位于F島的核電站,受9級特大地震影響诬辈,放射性物質(zhì)發(fā)生泄漏酵使。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,008評論 3 325
  • 文/蒙蒙 一焙糟、第九天 我趴在偏房一處隱蔽的房頂上張望口渔。 院中可真熱鬧,春花似錦穿撮、人聲如沸缺脉。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽攻礼。三九已至,卻和暖如春栗柒,著一層夾襖步出監(jiān)牢的瞬間礁扮,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,815評論 1 269
  • 我被黑心中介騙來泰國打工瞬沦, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留太伊,地道東北人。 一個月前我還...
    沈念sama閱讀 47,698評論 2 368
  • 正文 我出身青樓逛钻,卻偏偏與公主長得像僚焦,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子曙痘,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,592評論 2 353