用ANNOVAR自建數(shù)據(jù)庫(kù)注釋基因組

annovar簡(jiǎn)介

在我們做重測(cè)序员魏,或者比較基因組學(xué)分析的時(shí)候猪贪,我們往往在call snp或者indel的時(shí)候,需要對(duì)我們的變異位點(diǎn)進(jìn)行注釋盆偿,而annovar官網(wǎng)提供的注釋庫(kù)往往是人類的居多柒爸,但是我們所研究的物種卻不僅限于人類。那么annovar就不可以使用了嗎事扭?捎稚,顯然不是,我們可以利用annovar進(jìn)行自建庫(kù)注釋求橄。個(gè)人感覺(jué)GATK自建數(shù)據(jù)庫(kù)比snpEff要容易上手一些今野。

ANNOVAR  
│  annotate_variation.pl #主程序,功能包括下載數(shù)據(jù)庫(kù)谈撒,三種不同的注釋
│  coding_change.pl #可用來(lái)推斷蛋白質(zhì)序列
│  convert2annovar.pl #將多種格式轉(zhuǎn)為.avinput的程序
│  retrieve_seq_from_fasta.pl #用于自行建立其他物種的轉(zhuǎn)錄本
│  table_annovar.pl #注釋程序腥泥,可一次性完成三種類型的注釋
│  variants_reduction.pl #可用來(lái)更靈活地定制過(guò)濾注釋流程
├─example #存放示例文件
└─humandb #人類注釋數(shù)據(jù)庫(kù)

流程

1、構(gòu)建自定義數(shù)據(jù)庫(kù)

gffread  #gff3 to gtf
gtfToGenePred  #gtf to genePred
 #轉(zhuǎn)換gff3 2 gtf
gffread genome.gff -T -o genome.gtf 
# -o    write the output records into <outfile> instead of stdout
 #-T    main output will be GTF instead of GFF3

#轉(zhuǎn)換gtf 2 GenePred
gtfToGenePred -genePredExt genome.gtf genome_refGene.txt 

#建立注釋庫(kù)
perl annovar/retrieve_seq_from_fasta.pl --format refGene --seqfile genome.fa genome_refGene.txt --out genome_refGeneMrna.fa

完成上述三部獲得兩個(gè)重要的文件

genome_refGeneMrna.fa
genome_refGene.txt

注意:這兩個(gè)文件肯定不能隨便命名啃匿,不然annovar無(wú)法識(shí)別蛔外!
把這兩個(gè)文件放到一起,命名文件夾為genome溯乒,后面會(huì)用到
前綴genome就是下面build參數(shù)使用的名字夹厌,下面注釋就要使用“-build geonme”這個(gè)參數(shù)。

2.轉(zhuǎn)換需要注釋的vcf文件

DL_1.vcf是HaplotypeCaller得到的vcf文件裆悄,需要轉(zhuǎn)換成適用annovar的文件格式矛纹,執(zhí)行命令

perl ../convert2annovar.pl -format vcf4 DL_1.vcf > DL_1.avinput

那么DL_1.avinput就是我們需要注釋的文件

3. annotate_variation注釋

用annotate_variation.pl進(jìn)行基于基因(gene-based annotation)的注釋,

perl ~/bio_software/annovar/annotate_variation.pl -geneanno -dbtype refGene -out GG_1.avinput -build genome GG_1.avinput ./genome
# -geneanno  表示使用基于基因的注釋
# -dbtype refGene  表示使用"refGene"類型的數(shù)據(jù)庫(kù)
# -out DL_1  表示輸出以DL_1為前綴的結(jié)果文件

得到結(jié)果文件:

DL_1.exonic_variant_function #外顯子區(qū)域突變的功能光稼、類型等
DL_1.variant_function#突變的基因及位置
DL_1.log#日志文件

感謝;蚰稀!艾君!
https://www.baishujun.com/archives/7476.html
http://www.reibang.com/p/0a334228377c
http://www.reibang.com/p/469199f523ee

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末采够,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子冰垄,更是在濱河造成了極大的恐慌蹬癌,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,941評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異逝薪,居然都是意外死亡隅要,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,397評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門董济,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)步清,“玉大人,你說(shuō)我怎么就攤上這事感局∧岱龋” “怎么了暂衡?”我有些...
    開封第一講書人閱讀 165,345評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵询微,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我狂巢,道長(zhǎng)撑毛,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,851評(píng)論 1 295
  • 正文 為了忘掉前任唧领,我火速辦了婚禮藻雌,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘斩个。我一直安慰自己胯杭,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,868評(píng)論 6 392
  • 文/花漫 我一把揭開白布受啥。 她就那樣靜靜地躺著做个,像睡著了一般。 火紅的嫁衣襯著肌膚如雪滚局。 梳的紋絲不亂的頭發(fā)上居暖,一...
    開封第一講書人閱讀 51,688評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音藤肢,去河邊找鬼太闺。 笑死,一個(gè)胖子當(dāng)著我的面吹牛嘁圈,可吹牛的內(nèi)容都是我干的省骂。 我是一名探鬼主播,決...
    沈念sama閱讀 40,414評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼最住,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼钞澳!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起温学,我...
    開封第一講書人閱讀 39,319評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤略贮,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體逃延,經(jīng)...
    沈念sama閱讀 45,775評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡览妖,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,945評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了揽祥。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片讽膏。...
    茶點(diǎn)故事閱讀 40,096評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖拄丰,靈堂內(nèi)的尸體忽然破棺而出府树,到底是詐尸還是另有隱情,我是刑警寧澤料按,帶...
    沈念sama閱讀 35,789評(píng)論 5 346
  • 正文 年R本政府宣布奄侠,位于F島的核電站,受9級(jí)特大地震影響载矿,放射性物質(zhì)發(fā)生泄漏垄潮。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,437評(píng)論 3 331
  • 文/蒙蒙 一闷盔、第九天 我趴在偏房一處隱蔽的房頂上張望弯洗。 院中可真熱鬧,春花似錦逢勾、人聲如沸币励。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,993評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至渠欺,卻和暖如春曾撤,著一層夾襖步出監(jiān)牢的瞬間夜赵,已是汗流浹背踱承。 一陣腳步聲響...
    開封第一講書人閱讀 33,107評(píng)論 1 271
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留攒菠,地道東北人迫皱。 一個(gè)月前我還...
    沈念sama閱讀 48,308評(píng)論 3 372
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像辖众,于是被迫代替她去往敵國(guó)和親卓起。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,037評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • 今天青石的票圈出鏡率最高的,莫過(guò)于張藝謀的新片終于定檔了离赫。 一張滿溢著水墨風(fēng)的海報(bào)一次次的出現(xiàn)在票圈里芭逝,也就是老謀...
    青石電影閱讀 10,336評(píng)論 1 2
  • 一、jQuery簡(jiǎn)介 JQ是JS的一個(gè)優(yōu)秀的庫(kù)渊胸,大型開發(fā)必備旬盯。在此,我想說(shuō)的是翎猛,JQ里面很多函數(shù)使用和JS類似胖翰,所...
    Welkin_qing閱讀 12,339評(píng)論 1 6
  • 字符串 1.什么是字符串 使用單引號(hào)或者雙引號(hào)括起來(lái)的字符集就是字符串。 引號(hào)中單獨(dú)的符號(hào)切厘、數(shù)字萨咳、字母等叫字符。 ...
    mango_2e17閱讀 7,510評(píng)論 1 7
  • 一場(chǎng)說(shuō)走就走的旅行迂卢。 簡(jiǎn)單地整理幾件必備旅行用品某弦,7.18日早上8.00準(zhǔn)時(shí)出發(fā)了,計(jì)劃一路南下然后繞西南一圈回恩...
    悠游魚閱讀 3,473評(píng)論 3 6
  • 原來(lái)看過(guò)一段話而克,第一厲害的人有能力沒(méi)脾氣,第二厲害的人有能力有脾氣怔毛,最差的是沒(méi)能力有脾氣的人员萍。 以我最...
    涼風(fēng)豆豆閱讀 1,546評(píng)論 2 0