ANNOVAR軟件使用

ANNOVAR是一個(gè)高效的注釋工具她奥。它從不同的基因組功能注釋基因變異檢測(包括人類基因組hg18、hg19 嗦枢、hg38朗伶、以及鼠、蠕蟲昨稼、酵母等)节视。今天主要解說人類的注釋。經(jīng)過ANNOVAR注釋之后,各變異功能一目了然,便于進(jìn)一步的生物學(xué)分析假栓。

一.下載安裝寻行,數(shù)據(jù)庫準(zhǔn)備

需要注意的是這個(gè)軟件需要edu郵箱注冊(cè)才能下載。

下載的文件為annovar.latest.tar.gz匾荆,解壓之后是以下文件:

-rwxr-xr-x 1 root root  11946 7月   4 23:41 coding_change.pl*
-rwxr-xr-x 1 root root 154465 7月   4 23:41 convert2annovar.pl*
-rwxr-xr-x 1 root root  19121 7月   4 23:49 retrieve_seq_from_fasta.pl*
-rwxr-xr-x 1 root root  32613 7月   4 23:49 table_annovar.pl*
-rwxr-xr-x 1 root root    476 7月   4 23:49 tmp.anno.log*
-rwxr-xr-x 1 root root  21106 7月   4 23:49 variants_reduction.pl*
drwxr-xr-x 2 root root   4096 7月   4 23:41 example/
drwxr-xr-x 3 root root   4096 7月   4 23:49 humandb/</pre>

其中最重要的是humandb的文件夾拌蜘,其中包括人類的數(shù)據(jù)庫,是注釋時(shí)必須的牙丽。

但是很多時(shí)候我們是希望能獲得更多的信息简卧,這就需要我們自己去下載所需的數(shù)據(jù)庫,參考官網(wǎng)提供的數(shù)據(jù)庫列表,套用代碼

#在/.../ANNOVAR/annovar目錄下:
perl annotate_variation.pl -buildver 基因組版本 -downdb 庫名 humandb/</pre>

這里我們下載了以下:

perl annotate_variation.pl -downdb 1000g2015aug humandb -buildver hg38
#-rw-r--r-- 1 u2406 VIP 2.6G Aug 27  2015 hg38_1000g2015aug.zip 解壓得到
#-rwxr-xr-x 1 root root  85M 7月   4 23:49 hg38_SAS.sites.2015_08.txt.idx
#-rwxr-xr-x 1 root root 967M 7月   4 23:49 hg38_SAS.sites.2015_08.txt
#-rwxr-xr-x 1 root root  85M 7月   4 23:45 hg38_EUR.sites.2015_08.txt.idx
#-rwxr-xr-x 1 root root 878M 7月   4 23:45 hg38_EUR.sites.2015_08.txt
#-rwxr-xr-x 1 root root  85M 7月   4 23:45 hg38_EAS.sites.2015_08.txt.idx
#-rwxr-xr-x 1 root root 856M 7月   4 23:45 hg38_EAS.sites.2015_08.txt
#-rwxr-xr-x 1 root root  85M 7月   4 23:42 hg38_AMR.sites.2015_08.txt.idx
#-rwxr-xr-x 1 root root 1.1G 7月   4 23:42 hg38_AMR.sites.2015_08.txt
#-rwxr-xr-x 1 root root  89M 7月   4 23:42 hg38_ALL.sites.2015_08.txt.idx
#-rwxr-xr-x 1 root root 3.2G 7月   4 23:42 hg38_ALL.sites.2015_08.txt
#-rwxr-xr-x 1 root root  87M 7月   4 23:41 hg38_AFR.sites.2015_08.txt.idx
#-rwxr-xr-x 1 root root 1.5G 7月   4 23:41 hg38_AFR.sites.2015_08.txt
perl annotate_variation.pl -downdb -buildver hg38 -webfrom annovar refGene humandb/
#-rwxr-xr-x 1 root root 810K 7月   4 23:49 hg38_refGeneVersion.txt
#-rwxr-xr-x 1 root root 216M 7月   4 23:49 hg38_refGeneMrna.fa
#-rwxr-xr-x 1 root root  19M 7月   4 23:49 hg38_refGene.txt
perl annotate_variation.pl -buildver hg38 -downdb knownGene humandb/
#-rwxr-xr-x 1 root root 327M 7月   4 23:49 hg38_knownGeneMrna.fa
#-rwxr-xr-x 1 root root  37M 7月   4 23:49 hg38_knownGene.txt
#-rwxr-xr-x 1 root root  28M 7月   4 23:49 hg38_kgXref.txt
perl annotate_variation.pl -downdb -buildver hg38 -webfrom annovar gnomad_genome humandb/
#-rwxr-xr-x 1 root root 920M 7月   4 23:49 hg38_gnomad_genome.txt.idx
#-rwxr-xr-x 1 root root  16G 7月   4 23:49 hg38_gnomad_genome.txt
perl annotate_variation.pl -buildver hg38 -downdb cytoBand humandb/
#-rwxr-xr-x 1 root root  45K 7月   4 23:45 hg38_cytoBand.txt
perl annotate_variation.pl -downdb -buildver hg38 -webfrom annovar clinvar_20180603 humandb/
#-rw-r--r-- 1 u2406 VIP 1.3M Jul  9 11:50 hg38_clinvar_20180603.txt.idx
#-rw-r--r-- 1 u2406 VIP  72M Jul  9 11:50 hg38_clinvar_20180603.txt
perl annotate_variation.pl -downdb -buildver hg38 -webfrom annovar avsnp150 humandb/
#-rwxr-xr-x 1 root root 918M 7月   4 23:45 hg38_avsnp150.txt.idx
#-rwxr-xr-x 1 root root  13G 7月   4 23:45 hg38_avsnp150.txt

疑問烤芦,下載代碼可以統(tǒng)一嗎

至此举娩,ANNOVAR軟件的安裝和下載資源庫就結(jié)束了,下面開始介紹軟件的使用方法

Example:

1st#download annotation databases from ANNOVAR or UCSC and save to humandb/ directory

annotate_variation.pl -downdb -webfrom annovar refGene humandb/
annotate_variation.pl -buildver mm9 -downdb refGene mousedb/
annotate_variation.pl -downdb -webfrom annovar esp6500siv2_all humandb/

2ed#gene-based annotation of variants in the varlist file (by default --geneanno is ON)

annotate_variation.pl -buildver hg19 ex1.avinput humandb/

3#region-based annotate variants

annotate_variation.pl -regionanno -buildver hg19 -dbtype cytoBand ex1.avinput humandb/
annotate_variation.pl -regionanno -buildver hg19 -dbtype gff3 -gff3dbfile tfbs.gff3 ex1.avinput humandb/

4#filter rare or unreported variants (in 1000G/dbSNP) or predicted deleterious variants

annotate_variation.pl -filter -dbtype 1000g2014oct_all -maf 0.01 ex1.avinput humandb/
annotate_variation.pl -filter -buildver hg19 -dbtype snp138 ex1.avinput humandb/
annotate_variation.pl -filter -dbtype ljb26_all -otherinfo ex1.avinput humandb/

annotate_variation.pl [arguments] <query-file|table-name><database-location>

Function: annotate a list of genetic variants against genome annotation databases stored at local disk.

convert2annovar.pl [arguments] <variantfile>

Function: convert variant call file generated from various software programs into ANNOVAR input format

ANNOVAR軟件的功能可以分成以下4大類

ANNOVAR是用Perl編寫的,可以在安裝了標(biāo)準(zhǔn)Perl模塊的各種硬件系統(tǒng)上作為獨(dú)立應(yīng)用程序運(yùn)行铜涉。

1. gene-based annotation

分析變異位點(diǎn)對(duì)蛋白質(zhì)的影響智玻,支持多種基因集,包括RefSeq, UCSC, ENSEMBL, GENCODE 等芙代。

2. region-based annotation

分析變異位點(diǎn)是否位于基因組上的特殊區(qū)域吊奢,比如轉(zhuǎn)錄因子結(jié)合區(qū)域,組蛋白修飾區(qū)等纹烹。

3. Filter-based annotation

分析變異位點(diǎn)是否位于指定的數(shù)據(jù)庫中页滚,比如dbSNP, 1000G,ESP 6500等數(shù)據(jù)庫滔韵,計(jì)算SIFT逻谦,PolyPhen, LRT, MutationTaster, MutationAssessor, FATHMM, MetaSVM, MetaLR等指標(biāo)。

4. other functionalities

從基因組上根據(jù)坐標(biāo)提取序列等小功能陪蜻。

在實(shí)際分析中邦马,主要使用annovar的注釋功能⊙缏簦可以看到滋将,annovar提供了3大類型的注釋,在后續(xù)文章中症昏,會(huì)詳細(xì)講述随闽。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市肝谭,隨后出現(xiàn)的幾起案子掘宪,更是在濱河造成了極大的恐慌,老刑警劉巖攘烛,帶你破解...
    沈念sama閱讀 218,546評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件魏滚,死亡現(xiàn)場離奇詭異,居然都是意外死亡坟漱,警方通過查閱死者的電腦和手機(jī)鼠次,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,224評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來芋齿,“玉大人腥寇,你說我怎么就攤上這事∶倮Γ” “怎么了赦役?”我有些...
    開封第一講書人閱讀 164,911評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長栅炒。 經(jīng)常有香客問我扩劝,道長庸论,這世上最難降的妖魔是什么职辅? 我笑而不...
    開封第一講書人閱讀 58,737評(píng)論 1 294
  • 正文 為了忘掉前任棒呛,我火速辦了婚禮,結(jié)果婚禮上域携,老公的妹妹穿的比我還像新娘簇秒。我一直安慰自己,他們只是感情好秀鞭,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,753評(píng)論 6 392
  • 文/花漫 我一把揭開白布趋观。 她就那樣靜靜地躺著,像睡著了一般锋边。 火紅的嫁衣襯著肌膚如雪皱坛。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,598評(píng)論 1 305
  • 那天豆巨,我揣著相機(jī)與錄音剩辟,去河邊找鬼。 笑死往扔,一個(gè)胖子當(dāng)著我的面吹牛贩猎,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播萍膛,決...
    沈念sama閱讀 40,338評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼吭服,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了蝗罗?” 一聲冷哼從身側(cè)響起艇棕,我...
    開封第一講書人閱讀 39,249評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎串塑,沒想到半個(gè)月后沼琉,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,696評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡拟赊,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,888評(píng)論 3 336
  • 正文 我和宋清朗相戀三年刺桃,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片吸祟。...
    茶點(diǎn)故事閱讀 40,013評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡瑟慈,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出屋匕,到底是詐尸還是另有隱情葛碧,我是刑警寧澤,帶...
    沈念sama閱讀 35,731評(píng)論 5 346
  • 正文 年R本政府宣布过吻,位于F島的核電站进泼,受9級(jí)特大地震影響蔗衡,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜乳绕,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,348評(píng)論 3 330
  • 文/蒙蒙 一绞惦、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧洋措,春花似錦济蝉、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,929評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至滓鸠,卻和暖如春雁乡,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背糜俗。 一陣腳步聲響...
    開封第一講書人閱讀 33,048評(píng)論 1 270
  • 我被黑心中介騙來泰國打工踱稍, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人吩跋。 一個(gè)月前我還...
    沈念sama閱讀 48,203評(píng)論 3 370
  • 正文 我出身青樓寞射,卻偏偏與公主長得像,于是被迫代替她去往敵國和親锌钮。 傳聞我的和親對(duì)象是個(gè)殘疾皇子桥温,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,960評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • ANNOVAR的安裝 ANNOVAR網(wǎng)址 log in之后才能download,使用教育機(jī)構(gòu)后綴的郵箱即可注冊(cè)梁丘。 ...
    面面的徐爺閱讀 22,982評(píng)論 1 26
  • ??annovar對(duì)人類基因組和非人類基因組variants注釋流程 部分翻譯自:Hui Y, Kai W. Ge...
    dulunar閱讀 4,342評(píng)論 0 10
  • annovar是一款常用的注釋軟件侵浸,可在其官網(wǎng)注冊(cè)后下載。annovar無需安裝氛谜,下載后解壓即可直接使用掏觉。anno...
    井底蛙蛙呱呱呱閱讀 14,545評(píng)論 1 15
  • 最近在做個(gè)乳腺癌的項(xiàng)目,用GATK call 變異后得到vcf值漫,需要做一些注釋澳腹,就要用到annovar, ANNO...
    11的霧閱讀 3,892評(píng)論 0 11
  • 那個(gè)夢杨何,真實(shí)又虛假酱塔;那個(gè)夢,喜悅又悲傷危虱;那個(gè)夢羊娃,反反復(fù)復(fù)沒有結(jié)局。我知道埃跷,是我內(nèi)心無法釋懷蕊玷,才會(huì)接二連三的夢...
    葵花幫小姐閱讀 210評(píng)論 0 0