annovar簡(jiǎn)介
在我們做重測(cè)序员魏,或者比較基因組學(xué)分析的時(shí)候猪贪,我們往往在call snp或者indel的時(shí)候,需要對(duì)我們的變異位點(diǎn)進(jìn)行注釋盆偿,而annovar官網(wǎng)提供的注釋庫(kù)往往是人類的居多柒爸,但是我們所研究的物種卻不僅限于人類。那么annovar就不可以使用了嗎事扭?捎稚,顯然不是,我們可以利用annovar進(jìn)行自建庫(kù)注釋求橄。個(gè)人感覺(jué)GATK自建數(shù)據(jù)庫(kù)比snpEff要容易上手一些今野。
ANNOVAR
│ annotate_variation.pl #主程序,功能包括下載數(shù)據(jù)庫(kù)谈撒,三種不同的注釋
│ coding_change.pl #可用來(lái)推斷蛋白質(zhì)序列
│ convert2annovar.pl #將多種格式轉(zhuǎn)為.avinput的程序
│ retrieve_seq_from_fasta.pl #用于自行建立其他物種的轉(zhuǎn)錄本
│ table_annovar.pl #注釋程序腥泥,可一次性完成三種類型的注釋
│ variants_reduction.pl #可用來(lái)更靈活地定制過(guò)濾注釋流程
├─example #存放示例文件
└─humandb #人類注釋數(shù)據(jù)庫(kù)
流程
1、構(gòu)建自定義數(shù)據(jù)庫(kù)
gffread #gff3 to gtf
gtfToGenePred #gtf to genePred
#轉(zhuǎn)換gff3 2 gtf
gffread genome.gff -T -o genome.gtf
# -o write the output records into <outfile> instead of stdout
#-T main output will be GTF instead of GFF3
#轉(zhuǎn)換gtf 2 GenePred
gtfToGenePred -genePredExt genome.gtf genome_refGene.txt
#建立注釋庫(kù)
perl annovar/retrieve_seq_from_fasta.pl --format refGene --seqfile genome.fa genome_refGene.txt --out genome_refGeneMrna.fa
完成上述三部獲得兩個(gè)重要的文件
genome_refGeneMrna.fa
genome_refGene.txt
注意:這兩個(gè)文件肯定不能隨便命名啃匿,不然annovar無(wú)法識(shí)別蛔外!
把這兩個(gè)文件放到一起,命名文件夾為genome溯乒,后面會(huì)用到
前綴genome就是下面build參數(shù)使用的名字夹厌,下面注釋就要使用“-build geonme”這個(gè)參數(shù)。
2.轉(zhuǎn)換需要注釋的vcf文件
DL_1.vcf是HaplotypeCaller得到的vcf文件裆悄,需要轉(zhuǎn)換成適用annovar的文件格式矛纹,執(zhí)行命令
perl ../convert2annovar.pl -format vcf4 DL_1.vcf > DL_1.avinput
那么DL_1.avinput就是我們需要注釋的文件
3. annotate_variation注釋
用annotate_variation.pl進(jìn)行基于基因(gene-based annotation)的注釋,
perl ~/bio_software/annovar/annotate_variation.pl -geneanno -dbtype refGene -out GG_1.avinput -build genome GG_1.avinput ./genome
# -geneanno 表示使用基于基因的注釋
# -dbtype refGene 表示使用"refGene"類型的數(shù)據(jù)庫(kù)
# -out DL_1 表示輸出以DL_1為前綴的結(jié)果文件
得到結(jié)果文件:
DL_1.exonic_variant_function #外顯子區(qū)域突變的功能光稼、類型等
DL_1.variant_function#突變的基因及位置
DL_1.log#日志文件
感謝;蚰稀!艾君!
https://www.baishujun.com/archives/7476.html
http://www.reibang.com/p/0a334228377c
http://www.reibang.com/p/469199f523ee