GATK下游VCF maf可視化

VCF可以通過不同的上游分析獲得剧腻,在格式上又有一些不同裸诽,盲目轉(zhuǎn)化會(huì)帶來很多問題持舆。查看VCF文件內(nèi)容可知是通過GATK上游處理得到的向叉。

less raw.vcf

##fileformat=VCFv4.1
##FILTER=<ID=LowQual,Description="Low quality">
##FORMAT=<ID=AD,Number=.,Type=Integer,Description="Allelic depths for the ref and alt alleles in the order listed">
##FORMAT=<ID=DP,Number=1,Type=Integer,Description="Approximate read depth (reads with MQ=255 or with bad mates are filtered)">
##FORMAT=<ID=GQ,Number=1,Type=Integer,Description="Genotype Quality">
##FORMAT=<ID=GT,Number=1,Type=String,Description="Genotype">
##FORMAT=<ID=PL,Number=G,Type=Integer,Description="Normalized, Phred-scaled likelihoods for genotypes as defined in the VCF specification">
##GATKCommandLine.HaplotypeCaller=

為了對變異結(jié)果進(jìn)一步進(jìn)行可視化分析,查找了一下網(wǎng)上的相關(guān)資料吠勘,可以通過annovar軟件進(jìn)行轉(zhuǎn)化妆艘,然后通過maftools R包進(jìn)行可視化分析。確定了整體的分析策略之后看幼,先安裝annovar軟件

1.安裝annovar

官網(wǎng)下載:http://annovar.openbioinformatics.org/en/latest/user-guide/download/
注冊 網(wǎng)站發(fā)送郵件 直接郵件下載 拷貝到服務(wù)器 (需使用機(jī)構(gòu)郵箱)幌陕。
拷貝到服務(wù)器诵姜,在相應(yīng)的文件夾下進(jìn)行解壓即可。

tar -zxvf annovar.latest.tar.gz

2.VCF轉(zhuǎn)換為annovar格式

### 批量轉(zhuǎn)換
for i in *vcf; do perl ~/biosoft/annovar/convert2annovar.pl -format vcf4 $i -outfile $i.annovar -includeinfo; done

3.VCF變異根據(jù)基因進(jìn)行注釋

for i in *vcf; do \
perl ~/biosoft/annovar/table_annovar.pl $i.annovar ~/path/to/humandb/ -buildver hg19 
-out variants --otherinfo -remove -protocol ensGene -operation g -nastring NA

這個(gè)時(shí)候會(huì)遇到一個(gè)報(bào)錯(cuò):

hg19_ensGeneMrna.fa does not exist. Please use 'annotate_variation.pl --downdb ensGene ~/biosoft/annovar/humandb' download the database

按照提示下載相應(yīng)的注釋參考數(shù)據(jù)庫搏熄,提示相應(yīng)的ref文件已經(jīng)無法下載棚唆。重新構(gòu)建ref

perl ./annotate_variation.pl --buildver hg19 --downdb seq ~/biosoft/annovar/humandb/hg19_seq
perl ./retrieve_seq_from_fasta.pl /home/data/ssy066/biosoft/annovar/humandb/hg19_ensGene.txt -seqdir ~/biosoft/annovar/humandb/hg19_seq -format ensGene -outfile ~/biosoft/annovar/humandb/hg19_ensGeneMrna.fa

重新進(jìn)行注釋。

4.轉(zhuǎn)化為maf格式文件

目標(biāo)文件夾下會(huì)出現(xiàn)后綴為multianno.txt的文件心例,導(dǎo)入R語言中轉(zhuǎn)化為maf文件宵凌,進(jìn)行可視化即可。止后、

library(maftools)
var.annovar.maf = annovarToMaf(annovar = "~/BN4027P6.raw.vcf.anno.hg19_multianno.txt", 
                               Center = 'CSI-NUS', refBuild = 'hg19', MAFobj = T, table = 'ensGene')
plotmafSummary(maf = var.annovar.maf, rmOutlier = TRUE, addStat = 'median', dashboard = TRUE, titvRaw = FALSE)

參考內(nèi)容

1.maftools : Summarize, Analyze and Visualize MAF Files (bioconductor.org)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末瞎惫,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子译株,更是在濱河造成了極大的恐慌瓜喇,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,013評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件歉糜,死亡現(xiàn)場離奇詭異乘寒,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)匪补,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門伞辛,熙熙樓的掌柜王于貴愁眉苦臉地迎上來烂翰,“玉大人,你說我怎么就攤上這事蚤氏「使ⅲ” “怎么了?”我有些...
    開封第一講書人閱讀 152,370評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵瞧捌,是天一觀的道長棵里。 經(jīng)常有香客問我,道長姐呐,這世上最難降的妖魔是什么殿怜? 我笑而不...
    開封第一講書人閱讀 55,168評(píng)論 1 278
  • 正文 為了忘掉前任,我火速辦了婚禮曙砂,結(jié)果婚禮上头谜,老公的妹妹穿的比我還像新娘。我一直安慰自己鸠澈,他們只是感情好柱告,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,153評(píng)論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著笑陈,像睡著了一般际度。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上涵妥,一...
    開封第一講書人閱讀 48,954評(píng)論 1 283
  • 那天乖菱,我揣著相機(jī)與錄音,去河邊找鬼蓬网。 笑死窒所,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的帆锋。 我是一名探鬼主播吵取,決...
    沈念sama閱讀 38,271評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼锯厢!你這毒婦竟也來了皮官?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,916評(píng)論 0 259
  • 序言:老撾萬榮一對情侶失蹤哲鸳,失蹤者是張志新(化名)和其女友劉穎臣疑,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體徙菠,經(jīng)...
    沈念sama閱讀 43,382評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡讯沈,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,877評(píng)論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片缺狠。...
    茶點(diǎn)故事閱讀 37,989評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡问慎,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出挤茄,到底是詐尸還是另有隱情如叼,我是刑警寧澤,帶...
    沈念sama閱讀 33,624評(píng)論 4 322
  • 正文 年R本政府宣布穷劈,位于F島的核電站笼恰,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏歇终。R本人自食惡果不足惜社证,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,209評(píng)論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望评凝。 院中可真熱鬧追葡,春花似錦、人聲如沸奕短。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,199評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽翎碑。三九已至谬返,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間日杈,已是汗流浹背朱浴。 一陣腳步聲響...
    開封第一講書人閱讀 31,418評(píng)論 1 260
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留达椰,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,401評(píng)論 2 352
  • 正文 我出身青樓项乒,卻偏偏與公主長得像啰劲,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子檀何,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,700評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容