使用GATK進(jìn)行全基因組數(shù)據(jù)分析后獲得vcf文件允瞧,對(duì)不同品種變異數(shù)據(jù)進(jìn)行特異共有變異位點(diǎn)數(shù)據(jù)提取
使用工具 BCFtools
bcftools的安裝
mamba creat -n bcftools -c bioconda bcftools
激活環(huán)境
conda activate bcftools
使用bcftools壓縮vcf文件经磅;如不壓縮將會(huì)報(bào)錯(cuò) not compressed with bgzip
bcftools view file.vcf -Oz -o file.vcf.gz
創(chuàng)建索引
bcftools index file.vcf.gz
提取材料A中特異位點(diǎn)
bcftools isec -C A.vcf.gz B.vcf.gz C.vcf.gz D.vcf.gz? -Oz -o A.unique.vcf.gz
參數(shù)含義 -C,--complement 輸出只存在第一個(gè)文件中但在其他們中不存在的變異位點(diǎn)
-O 輸出類型 z 輸出vcf壓縮格式 -o 輸出文件名
今天休息一天沒去實(shí)驗(yàn)室在寢室遠(yuǎn)程名惩,太卡不寫了明天繼續(xù)