在網(wǎng)上偶然看見(jiàn)了maftools崩掘,想用自己的vcf文件嘗試苞慢,因此在網(wǎng)上找了教程來(lái)進(jìn)行這一轉(zhuǎn)換挽放。
本文章旨在解決兩個(gè)問(wèn)題,一吗蚌,vcf 轉(zhuǎn)maf過(guò)程蚯妇;二暂筝,單樣本maf如何合并成多樣本maf箩言,并輸入maftools進(jìn)行作圖。
在網(wǎng)上看教程焕襟,提到細(xì)節(jié)的很少陨收。所以我寫(xiě)一個(gè)粗糙版本的教程,有些細(xì)節(jié)我也沒(méi)有深究鸵赖,歡迎指正畏吓。
一,vcf轉(zhuǎn)maf的過(guò)程卫漫。
1菲饼,參考網(wǎng)址:
轉(zhuǎn)換命令:https://blog.csdn.net/viancheng/article/details/106330338
軟件網(wǎng)址:https://github.com/mskcc/vcf2maf/releases
2,軟件準(zhǔn)備:
需要準(zhǔn)備:某版本的參考基因組; 需要提前安裝VEP列赎;需要下載maftools的壓縮包; 使用的vcf來(lái)自mutect2產(chǎn)生的vcf ; 在Linux環(huán)境下進(jìn)行處理宏悦。下面是vcf格式截圖:
3,轉(zhuǎn)換命令:
(1)命令:
perl vcf2maf.pl --input-vcf T668077.oncefiltered.vcf --output-maf T668077.maf --tumor-id T668077 --normal-id N668077 --vcf-tumor-id T668077 --vcf-normal-id N668077 --vep-path ensembl-vep-93.4-0 --vep-data ~/.vep --ref-fasta ucsc.hg19.fasta --filter-vcf 0
參數(shù)參考自上面的轉(zhuǎn)換網(wǎng)址:
#T668077.oncefiltered.vcf 需要轉(zhuǎn)換的vcf文件包吝。
#T668077.maf 轉(zhuǎn)換后的結(jié)果
(2)需要注意的地方:
--vep-data 需要制定的是VEP的cache頁(yè)面,否則會(huì)報(bào)錯(cuò)块促,找不到cache.
解決這個(gè)問(wèn)題,其實(shí)是參考biostar上的 這個(gè)網(wǎng)址的最后一段渡八,https://www.biostars.org/p/375080/
(3)命令報(bào)錯(cuò):
雖然上述命令有報(bào)錯(cuò),但是因?yàn)檩敵鼋Y(jié)果出來(lái)了,這個(gè)報(bào)錯(cuò)我也沒(méi)有深究下去貌踏。
至此秉氧,形成了一個(gè)maf文件。導(dǎo)入maftools進(jìn)行操作即可帅刊,具體操作過(guò)程不寫(xiě)。單樣本maf作出的圖栏饮。
二伺通,單樣本maf如何合并成多樣本maf拼苍。
我在參考下面這個(gè)網(wǎng)址的時(shí)候疮鲫,發(fā)現(xiàn)有人提問(wèn)妇多,如何把許多個(gè)單樣本maf合并在一起,形成一個(gè)maf七问,并使用maftools進(jìn)行處理。
網(wǎng)址:http://www.reibang.com/p/54552f9a017d
我的做法很簡(jiǎn)單,
1,使用上面的方法挣磨,對(duì)多個(gè)vcf進(jìn)行處理势誊,形成多個(gè)maf查近。
2,將maf 全部合并在一起婿禽,cat即可挽绩。
????當(dāng)然,重復(fù)的標(biāo)題行去掉。我是用同一個(gè)maf侄柔,復(fù)制了一遍薪者,然后修改了下面2列的樣本編號(hào)言津,模擬2個(gè)樣本形成了一個(gè)maf瞬浓。
3弊琴,模擬的2樣本maf紫皇,使用maftools作圖。