5. GWAS:群體結(jié)構(gòu)——Admixture

  • 群體結(jié)構(gòu)是指材料的亞群分化情況锭硼,會導(dǎo)致標(biāo)記間的非連鎖關(guān)聯(lián)预柒,進(jìn)而導(dǎo)致關(guān)聯(lián)分析結(jié)果出現(xiàn)假陽性舒裤。

  • 地理隔離喳资、人工選擇、移民和遺傳漂變等都可能導(dǎo)致群體分化腾供。

  • 是指遺傳變異在物種或群體中的一種非隨機(jī)分布仆邓;

  • 將各材料歸到每個(gè)亞群鲜滩,計(jì)算每個(gè)材料基因組變異源于第K個(gè)亞群的可能性,用Q值表示节值,Q值越大徙硅,表明改材料來自這個(gè)亞群的可能性越大,一般可以用來推斷祖先群搞疗,個(gè)體血緣組成嗓蘑,還有雜交事件;

  • 常用軟件:Admixture、Structure匿乃、Frappe等桩皿。

隨著技術(shù)的發(fā)展,Structure速度較慢扳埂,無法滿足大量分子標(biāo)記計(jì)算的需求业簿,因此,admixture逐漸成為群體結(jié)構(gòu)分析的主流軟件阳懂。本文將介紹如何通過admixture進(jìn)行群體結(jié)構(gòu)計(jì)算梅尤。

1.下載及安裝

1.1 下載地址

http://dalexander.github.io/admixture/index.html

1.2 安裝

$ tar xvf admixture_linux-1.3.0.tar.gz
$ cd your/path/admixture_linux-1.3.0
# 調(diào)用:./admixture
# 查看幫助:./admixture --help

2. 群體結(jié)構(gòu)計(jì)算

2.1 整理成admixture所需的.ped(12recode)格式

在plink中將vcf文件轉(zhuǎn)換成admixture所需的.ped或.bed格式:

$ cd your/path/plink1.9
$ ./plink --vcf genotype.vcf --allow-extra-chr --recode12 --out genotype12 --autosome-num 27

--vcf 輸入文件名
--allow-extra-chr 允許其他格式染色體,如scaffold
--recode12 二進(jìn)制編碼
--out 輸出文件名
--autosome-num 設(shè)置染色體數(shù)目岩调,默認(rèn)人類染色體數(shù)

2.2 Admixture

$ cd your/path/admixture_linux-1.3.0
# 創(chuàng)建任務(wù)文件
$ vim adm.sh
# vim 文件名
# i 輸入 左下角出現(xiàn)insert巷燥,可以輸入
for K in 2 3 4 5 6 7 8 9 10; do ./admixture --cv root12.ped $K | tee log${K}.out; done
# ESC鍵 insert消失
# 退出
$ :wq

# 提交任務(wù)
$ bsub -n 4 -o log sh adm.sh
#查看任務(wù)
$ bjobs
JOBID   USER    STAT  QUEUE      FROM_HOST   EXEC_HOST   JOB_NAME   SUBMIT_TIME
913421  xxx  RUN   normal     login       4*compute11  sh adm.sh Aug 24 01:14

每個(gè)K值都會生成兩個(gè)文件,.P和.Q
P:儲存推斷的祖先種群的等位基因頻率
Q:每個(gè)樣本中各個(gè)祖先種群所占的百分比号枕。

3. 最佳分群數(shù)確定及可視化

3.1 確定最佳分群數(shù)

查看cv值缰揪,cv error最小的K值為最佳分群數(shù)。

$ grep -h CV log*.out
CV error (K=10): 0.65873
CV error (K=2): 0.71095
CV error (K=3): 0.63424
CV error (K=4): 0.68598
CV error (K=5): 0.67584
CV error (K=6): 0.66818
CV error (K=7): 0.66301
CV error (K=8): 0.66083
CV error (K=9): 0.65919

3.2 群體結(jié)構(gòu)可視化

將CV結(jié)果復(fù)制粘貼至Excel中葱淳,繪制折線圖钝腺。圖中可看出最佳分群數(shù)為K=3。


在R中繪制群體結(jié)構(gòu)圖

提供幾個(gè)我喜歡的配色:
K=3 "#FF4500","#9ACD32","#6495ED"
K=4 "#336666","darkred","steelblue","#CC9933"
K=5 "#FF4500","#5F7A61","#6495ED","#986D8E","#F6D167"

將K=3時(shí)的.Q文件拷貝至Windows中

> setwd("D:/數(shù)據(jù)/GWAS/群體結(jié)構(gòu)")
> library("ggplot2")
> install.packages(c("ggplot2","gridExtra","label.switching","tidyr","remotes"),repos="https://cloud.r-project.org")
> remotes::install_github('royfrancis/pophelper')
> library("pophelper")
> tbl=read.table("genotype.3.Q")
> pdf("admixture.pdf",width = 9,height = 3)
> colorpal =c("#FF4500","#9ACD32","#6495ED")
> cols=rep(colorpal,700)
> barplot(t(as.matrix(tbl)), col=cols, xlab="", ylab="Ancestry",border = NA)
> dev.off()

3.3 確定樣本屬于哪個(gè)亞群

當(dāng)確定最佳分群數(shù)是3時(shí)赞厕,打開K=3時(shí)的.Q文件艳狐,文件共包含三列,每行為一個(gè)樣本皿桑,三列中哪一個(gè)數(shù)值最大毫目,則這個(gè)樣本屬于哪一個(gè)亞群。

引用轉(zhuǎn)載請注明出處诲侮,如有錯誤敬請指出镀虐。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市沟绪,隨后出現(xiàn)的幾起案子刮便,更是在濱河造成了極大的恐慌,老刑警劉巖绽慈,帶你破解...
    沈念sama閱讀 206,013評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件恨旱,死亡現(xiàn)場離奇詭異抄肖,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)窖杀,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評論 2 382
  • 文/潘曉璐 我一進(jìn)店門漓摩,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人入客,你說我怎么就攤上這事管毙。” “怎么了桌硫?”我有些...
    開封第一講書人閱讀 152,370評論 0 342
  • 文/不壞的土叔 我叫張陵夭咬,是天一觀的道長。 經(jīng)常有香客問我铆隘,道長卓舵,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,168評論 1 278
  • 正文 為了忘掉前任膀钠,我火速辦了婚禮掏湾,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘肿嘲。我一直安慰自己融击,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,153評論 5 371
  • 文/花漫 我一把揭開白布雳窟。 她就那樣靜靜地躺著尊浪,像睡著了一般。 火紅的嫁衣襯著肌膚如雪封救。 梳的紋絲不亂的頭發(fā)上拇涤,一...
    開封第一講書人閱讀 48,954評論 1 283
  • 那天,我揣著相機(jī)與錄音誉结,去河邊找鬼鹅士。 笑死,一個(gè)胖子當(dāng)著我的面吹牛搓彻,可吹牛的內(nèi)容都是我干的如绸。 我是一名探鬼主播嘱朽,決...
    沈念sama閱讀 38,271評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼旭贬,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了搪泳?” 一聲冷哼從身側(cè)響起稀轨,我...
    開封第一講書人閱讀 36,916評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎岸军,沒想到半個(gè)月后奋刽,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體瓦侮,經(jīng)...
    沈念sama閱讀 43,382評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,877評論 2 323
  • 正文 我和宋清朗相戀三年佣谐,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了肚吏。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 37,989評論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡狭魂,死狀恐怖罚攀,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情雌澄,我是刑警寧澤斋泄,帶...
    沈念sama閱讀 33,624評論 4 322
  • 正文 年R本政府宣布,位于F島的核電站镐牺,受9級特大地震影響炫掐,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜睬涧,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,209評論 3 307
  • 文/蒙蒙 一募胃、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧畦浓,春花似錦摔认、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,199評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至秽梅,卻和暖如春抹蚀,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背企垦。 一陣腳步聲響...
    開封第一講書人閱讀 31,418評論 1 260
  • 我被黑心中介騙來泰國打工环壤, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人钞诡。 一個(gè)月前我還...
    沈念sama閱讀 45,401評論 2 352
  • 正文 我出身青樓郑现,卻偏偏與公主長得像,于是被迫代替她去往敵國和親荧降。 傳聞我的和親對象是個(gè)殘疾皇子接箫,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,700評論 2 345

推薦閱讀更多精彩內(nèi)容