群體結(jié)構(gòu)分析Admixture 使用遇到報錯及解決

1. 軟件下載及安裝admixture:

使用conda進行軟件安裝

conda install?admixture


2. VCF文件格式轉(zhuǎn)換為bed格式文件(似乎admixture 可以直接識別ped/map文件格式的輸入文件)

vcf文件轉(zhuǎn)為ped文件:

方法1:

使用vcftools支持將vcf文件轉(zhuǎn)換成plink對應的ped/map格式,如下

vcftools? --vcf input.vcf --plink --out output

方法2:

plink支持直接讀取vcf文件格式常柄,基本用法如下:

plink --vcf input.vcf --recode --out output?


map文件? ? ? 染色體編號為數(shù)字, 未知為0SNP名稱為字符或數(shù)字, 如果不重要, 可以從1編號, 注意要和bed文件SNP列一一對應染色體的摩爾未知(可選項, 可以用0)SNP物理坐標

重要端幼!?因為轉(zhuǎn)換成的ped和map文件無法匹配邻眷,需要手動更改上一步轉(zhuǎn)換好的map文件

map數(shù)據(jù)格式為四列


bed文件? ? 第一列: Family ID # 如果沒有, 可以用個體ID代替第二列: Individual ID # 個體ID編號第三列: Paternal ID # 父本編號第四列: Maternal ID # 母本編號第五列: Sex (1=male; 2=female; other=unknown) # 性別, 如果未知, 用0表示第六列: Phenotype # 表型數(shù)據(jù), 如果未知, 用0表示第七列以后: 為SNP分型數(shù)據(jù), 可以是AT CG或11 12, 或者A T C G或1 1 2 2————————————————版權(quán)聲明:本文為CSDN博主「育種數(shù)據(jù)分析之放飛自我」的原創(chuàng)文章糯笙,遵循CC 4.0 BY-SA版權(quán)協(xié)議旱爆,轉(zhuǎn)載請附上原文出處鏈接及本聲明响疚。原文鏈接:https://blog.csdn.net/yijiaobani/article/details/83017730

使用plink將ped/map轉(zhuǎn)換為二進制的bed文件代咸,命令行如下:

plink --file inputfile --make-bed --out filename

第一個FILENAME的后綴為.ped和.map,生成的第二個FILENAME的后綴為.bed陵吸、.bim玻墅、.fam

3.1.vcftools去除或保留vcf文件中的樣品

例1:只保留1和10號兩個樣品,執(zhí)行以下代碼:

vcftools --vcf in.vcf --recode --recode-INFO-all --stdout ?--indv ?1--indv ?10 ?> out.vcf

例2:刪除1號樣品壮虫,執(zhí)行以下代碼:

vcftools --vcf in.vcf --recode --recode-INFO-all --stdout ?--remove-indv ?1?> out.vcf

例3:如果樣品較多澳厢,也可將樣品保存到文件 id.txt 中环础,每行為一個樣品ID,格式如下:

sample1

2

..

然后使用下面兩個選項對vcf文件保留或者刪除樣品剩拢。

--keep<filename>保留樣品

--remove

<filename> ??刪除樣品

代碼如下:

vcftools --vcf in.vcf --recode --recode-INFO-all --stdout ?--keep id.txt ? > out.vcf

作者:花事Le

鏈接:http://www.reibang.com/p/542d9b63dcd1

來源:簡書

著作權(quán)歸作者所有线得。商業(yè)轉(zhuǎn)載請聯(lián)系作者獲得授權(quán),非商業(yè)轉(zhuǎn)載請注明出處徐伐。


3.2 plink提取指定樣本和指定SNP的數(shù)據(jù)(keep贯钩,extract函數(shù)

plink --bfile inputfile --noweb --keep sampleID.txt --recode --make-bed --out fileout

inputfile為不加.bed后綴的bed文件

其中,sampleID.txt第一列為提取的樣本Family ID办素,第二列為Within-family ID(IID)

plink提取SNP位點:

plink --bfile file --extract snp.txt --make-bed --out snp

其中角雷,snp.txt的文件格式如下,一個SNP位點一行:

rs1

rs2

rs3

4. 如何選擇合適的K值

可以同時運行多個程序, 每個程序不同的k值, 比如, 想要k值選擇1,2,3,4,5, 可以寫為:

?for?K?in?1?2?3?4?5;?do?admixture?--cv?hapmap3.bed?$K?|?tee?log${K}.out;?done

例子:

for K in 1 2 3 4 5 6 7 8 9 10 11 12; do admixture --cv 10729bed2.bed $K | tee log${K}.out; done

多線程: admixture??hapmap3.bed?3?-j?4

使用grep命令去查看*out文件的cv error(交叉驗證的誤差)值:

grep?-h?CV??*.out

結(jié)果如下:(這個K值顯示是否有誤?應該從第一開始分別是K=1性穿,2勺三,3依次往下)

對這個K值出現(xiàn)這樣的情況?為何K10開始需曾,個人覺得這個K值顯示有誤檩咱,應該從第一開始分別是K=1,2胯舷,3依次往下

5. 繪制Q值的百分比柱狀圖

使用R語言

ta1?=?read.table("D:/files.3.Q")

head(ta1)

barplot(t(as.matrix(ta1)),col?=?rainbow(3),

????????xlab?=?"Individual",

????????ylab?=?"Ancestry",

????????border?=?NA)


————————————————————————————————————————————

本文部分分析步驟參考了CSDN博主「育種數(shù)據(jù)分析之放飛自我」的原創(chuàng)文章,遵循CC 4.0 BY-SA版權(quán)協(xié)議绊含,轉(zhuǎn)載請附上原文出處鏈接及本聲明桑嘶。?

原文鏈接:https://blog.csdn.net/yijiaobani/article/details/83017730

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市躬充,隨后出現(xiàn)的幾起案子逃顶,更是在濱河造成了極大的恐慌,老刑警劉巖充甚,帶你破解...
    沈念sama閱讀 217,185評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件以政,死亡現(xiàn)場離奇詭異,居然都是意外死亡伴找,警方通過查閱死者的電腦和手機盈蛮,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,652評論 3 393
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來技矮,“玉大人抖誉,你說我怎么就攤上這事∷ゾ耄” “怎么了袒炉?”我有些...
    開封第一講書人閱讀 163,524評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長樊零。 經(jīng)常有香客問我我磁,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,339評論 1 293
  • 正文 為了忘掉前任夺艰,我火速辦了婚禮芋哭,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘劲适。我一直安慰自己楷掉,他們只是感情好,可當我...
    茶點故事閱讀 67,387評論 6 391
  • 文/花漫 我一把揭開白布霞势。 她就那樣靜靜地躺著烹植,像睡著了一般。 火紅的嫁衣襯著肌膚如雪愕贡。 梳的紋絲不亂的頭發(fā)上草雕,一...
    開封第一講書人閱讀 51,287評論 1 301
  • 那天,我揣著相機與錄音固以,去河邊找鬼墩虹。 笑死,一個胖子當著我的面吹牛憨琳,可吹牛的內(nèi)容都是我干的诫钓。 我是一名探鬼主播,決...
    沈念sama閱讀 40,130評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼篙螟,長吁一口氣:“原來是場噩夢啊……” “哼菌湃!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起遍略,我...
    開封第一講書人閱讀 38,985評論 0 275
  • 序言:老撾萬榮一對情侶失蹤惧所,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后绪杏,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體下愈,經(jīng)...
    沈念sama閱讀 45,420評論 1 313
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,617評論 3 334
  • 正文 我和宋清朗相戀三年蕾久,在試婚紗的時候發(fā)現(xiàn)自己被綠了势似。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,779評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡僧著,死狀恐怖叫编,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情霹抛,我是刑警寧澤搓逾,帶...
    沈念sama閱讀 35,477評論 5 345
  • 正文 年R本政府宣布,位于F島的核電站杯拐,受9級特大地震影響霞篡,放射性物質(zhì)發(fā)生泄漏世蔗。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,088評論 3 328
  • 文/蒙蒙 一朗兵、第九天 我趴在偏房一處隱蔽的房頂上張望污淋。 院中可真熱鬧,春花似錦余掖、人聲如沸寸爆。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,716評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽赁豆。三九已至,卻和暖如春冗美,著一層夾襖步出監(jiān)牢的瞬間魔种,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,857評論 1 269
  • 我被黑心中介騙來泰國打工粉洼, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留节预,地道東北人。 一個月前我還...
    沈念sama閱讀 47,876評論 2 370
  • 正文 我出身青樓属韧,卻偏偏與公主長得像安拟,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子宵喂,可洞房花燭夜當晚...
    茶點故事閱讀 44,700評論 2 354

推薦閱讀更多精彩內(nèi)容