群體遺傳學(xué)中測的很多個(gè)個(gè)體陨簇,得到了最終的SNP vcf文件吐绵,需要將其分成群體,看那幾個(gè)物種聚在一起河绽,一般使用的軟件就是STRUCTURE己单,
但是STREUTURE運(yùn)行速度極慢,后面frappe軟件提升了速度耙饰,但是也不是很快纹笼;admixture憑借其運(yùn)算速度,成為了主流的分析軟件苟跪。
admixture 軟件一共分為5步:
# step 1?將vcf文件轉(zhuǎn)化成ped文件
/USER/zhusitao/Software/vcftools-master/bin/vcftools --vcf total.final.snp.vcf --plink --out xj
# step 2 利用plink對ped文件進(jìn)行過濾生成bed文件
/USER/zhusitao/Software/plink/plink --noweb --file xj --geno 0.05 --maf 0.05 --hwe 0.0001 --make-bed --out QC
# step 3 利用 admixture 計(jì)算
for K in 1 2 3 4 5 6 7;do /USER/zhusitao/Software/admixture_linux-1.3.0/admixture --cv QC.bed $K|tee log${K}.out;done
# step 4 besk K 交叉熵最小就是最佳的分群
?grep -h CV log*.out
# step 5 R畫圖
tbl = read.table("/USER/zhusitao/Project/xj/reseq/result/11.admixture/QC.7.Q");
pdf("/USER/zhusitao/Project/xj/reseq/result/11.admixture/Q7.pdf")
barplot(t(as.matrix(tbl)),col= rainbow(7),xlab="Individual", ylab="Ancestry",border = NA,space = 0);
dev.off()