GATK 4.1.4.0 CreateSomaticPanelOfNormals

最近在做blood tumor paired外顯子分析流程,看了一下GATK的論壇,在關(guān)于用對照樣本作過濾的問題上览徒,曾經(jīng)的設(shè)置質(zhì)量參數(shù)作硬性過濾條件的方法已經(jīng)out,現(xiàn)在GATK best practice流程里是用大量正常對照樣本訓(xùn)練一個正常模型颂龙,應(yīng)該是用機器學(xué)習(xí)和算法吧(反正我不懂~).

那么基于我的需求也應(yīng)該走Mutect2的CreateSomaticPanelOfNormals,GATK版本是4.1.4.0习蓬,然而搜了一圈沒發(fā)現(xiàn)適用于最新版的中文教程,試了一下官方的流程好多坑措嵌,郁悶了兩天還好最后跑通了躲叼,分享一下流程,非常感謝生信技能樹健明大神的教導(dǎo)和鼓勵,在這一步卡住好幾天馬上要放棄的時候企巢,并且再一次幫助提升這篇小筆記的視覺效果押赊,哈哈~~

官方流程鏈接,注意是最新版GATK 4.1.4.0 MUTECT2的 CreateSomaticPanelOfNormals

<https://software.broadinstitute.org/gatk/documentation/tooldocs/current/org_broadinstitute_hellbender_tools_walkers_mutect_CreateSomaticPanelOfNormals.php>

第一步

gatk Mutect2 --java-options "-Xmx32G -Djava.io.tmpdir=./" \    -R ${ref} -I ${id}*.applybqsr.bam  \    -max-mnp-distance 0 --independent-mates  \    -L ${targetv5} -O ${dirvcfm2}/${id}.raw.vcf.gz

這里掉了兩個坑包斑,一是-max-mnp-distance 0 一定要加流礁,不然下一步會報錯,再一個是—independent-mates這個參數(shù)對于雙端測序也要加罗丰。

第二步

必須用GenomicsDBImport 創(chuàng)建文件夾genomicsdb-workspace-path神帅,而不像之前版本生成一個正常vcf合集就結(jié)束,這個文件夾里有json文件需要下一步調(diào)用萌抵,在沒跑通的時候我也想用以前版本combinedgvcf替代,事實證明不可以找御,就要乖乖按流程來并且流程里還有坑…..
先把上一步生成的vcf文件準備好元镀,多參數(shù)輸入vcf :

samples=$(find .|sed 's/.\///' | grep -E 'vcf.gz$' | sed 's/^/-V /')

最坑的是-L 參數(shù),一開始用了靶向bed文件霎桅,跑了一晚上三分之一都不到還生成了好幾個T的文件栖疑,嚇的趕緊停掉刪除,論壇上搜最后發(fā)現(xiàn)這個GenomicsDBImport工具很矯情滔驶,貌似不能接受靶向捕獲這種很多非連續(xù)區(qū)域bed文件遇革,最后找到了方法,參數(shù)要分別接受每條染色體最后合成一個變量interval
制作interval內(nèi)容如下:

-L chr1 -L chr2 -L chr3 -L chr4 -L chr5 -L chr6 -L chr7 -L chr8 -L chr9 -L chr10 -L chr11 -L chr12 -L chr13 -L chr14 -L chr15 -L chr16 -L chr17 -L chr18 -L chr19 -L chr20 -L chr21 -L chr22 -L chrX -L chrY

運行GenomicsDBImport揭糕,生成存放結(jié)果文件夾 ponall

gatk GenomicsDBImport --java-options "-Xmx32G -Djava.io.tmpdir=./" \     -R ${ref} ${interval}  \     --genomicsdb-workspace-path ponall   ${samples}

順利運行了十幾分鐘就完成萝快,結(jié)果文件也不大……..
詭異的是日志文件里只顯示了某一條chr的一個位點最后顯示success
用SelectVariants工具檢查剛才生成的結(jié)果里面是否全面覆蓋所有染色體

gatk SelectVariants -R ${ref} -V gendb://ponall  -O outputcheck.vcf

看過之后放心了,全部染色體都在著角,位點也很多揪漩。

第三步

終于回到pon了,用到上一步生成的ponall文件夾內(nèi)容

gatk CreateSomaticPanelOfNormals --java-options "-Xmx32G -Djava.io.tmpdir=./"  \     -V gendb://ponall  \     -R ${ref}  -O ponall.vcf.gz

終于順利完成~~~

?

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末吏口,一起剝皮案震驚了整個濱河市奄容,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌产徊,老刑警劉巖嫩海,帶你破解...
    沈念sama閱讀 216,402評論 6 499
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異囚痴,居然都是意外死亡,警方通過查閱死者的電腦和手機审葬,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,377評論 3 392
  • 文/潘曉璐 我一進店門深滚,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人涣觉,你說我怎么就攤上這事痴荐。” “怎么了官册?”我有些...
    開封第一講書人閱讀 162,483評論 0 353
  • 文/不壞的土叔 我叫張陵生兆,是天一觀的道長。 經(jīng)常有香客問我膝宁,道長鸦难,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,165評論 1 292
  • 正文 為了忘掉前任员淫,我火速辦了婚禮合蔽,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘介返。我一直安慰自己拴事,他們只是感情好沃斤,可當(dāng)我...
    茶點故事閱讀 67,176評論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著刃宵,像睡著了一般衡瓶。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上牲证,一...
    開封第一講書人閱讀 51,146評論 1 297
  • 那天哮针,我揣著相機與錄音,去河邊找鬼从隆。 笑死诚撵,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的键闺。 我是一名探鬼主播寿烟,決...
    沈念sama閱讀 40,032評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼辛燥!你這毒婦竟也來了筛武?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,896評論 0 274
  • 序言:老撾萬榮一對情侶失蹤挎塌,失蹤者是張志新(化名)和其女友劉穎徘六,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體榴都,經(jīng)...
    沈念sama閱讀 45,311評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡待锈,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,536評論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了嘴高。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片竿音。...
    茶點故事閱讀 39,696評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖拴驮,靈堂內(nèi)的尸體忽然破棺而出春瞬,到底是詐尸還是另有隱情,我是刑警寧澤套啤,帶...
    沈念sama閱讀 35,413評論 5 343
  • 正文 年R本政府宣布宽气,位于F島的核電站,受9級特大地震影響潜沦,放射性物質(zhì)發(fā)生泄漏萄涯。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,008評論 3 325
  • 文/蒙蒙 一唆鸡、第九天 我趴在偏房一處隱蔽的房頂上張望窃判。 院中可真熱鬧,春花似錦喇闸、人聲如沸袄琳。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽唆樊。三九已至宛琅,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間逗旁,已是汗流浹背嘿辟。 一陣腳步聲響...
    開封第一講書人閱讀 32,815評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留片效,地道東北人红伦。 一個月前我還...
    沈念sama閱讀 47,698評論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像淀衣,于是被迫代替她去往敵國和親昙读。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,592評論 2 353

推薦閱讀更多精彩內(nèi)容