GATK HaplotypeCallerSpark模塊的使用

GATK的HaplotypeCaller是經(jīng)常用到的變異檢測模塊，但在大基因組或高深度測序模式下運(yùn)行速度比較慢样悟，雖然有--native-pair-hmm-threads多線程參數(shù)，但對效率的提升并不明顯穷躁。
GATK同時也提供了基于Spark的數(shù)據(jù)處理引擎忍抽，工具名字是HaplotypeCallerSpark ，是個beta版本的工具歼秽，在實(shí)際生產(chǎn)環(huán)境中使用需謹(jǐn)慎应役。

image.png

使用該工具的時候不需要單獨(dú)安裝Spark和了解Spark的語法，只需要正確安裝高版本的gatk燥筷。不管是個人服務(wù)器或者集群環(huán)境都可以直接使用Spark LOCAL 模式去運(yùn)行箩祥，通過 --spark-master local[20] 指定線程數(shù)量，--spark-master local[*] 表示調(diào)用全部線程肆氓。軟件對這部分的說明如下：

d2541348e1fb7e171c1717ff3e3fa6e.jpg

實(shí)際測試使用的是gatk-4.2.6.1 袍祖，java 1.8，比普通模式快幾倍谢揪。命令行如下：
gatk --java-options "-Xmx50g" HaplotypeCallerSpark -R chr.fa -I test.rmdup.bam -ERC GVCF -L 1 --min-base-quality-score 10 --do-not-run-physical-phasing true -O test.HaplotypeCaller.1.g.vcf.gz \
-- \
--spark-master local[20]

如果遇到j(luò)ava的報錯 java.lang.StackOverflowError 蕉陋，這就是你的基因組問題捐凭，要把基因組上的contig碎片去掉，就能正常運(yùn)行了凳鬓。

image.png

GATK官網(wǎng)關(guān)于Spark的說明：https://gatk.broadinstitute.org/hc/en-us/articles/360035890591-Spark

最后編輯于：2023.08.07 09:36:12

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末茁肠，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子缩举，更是在濱河造成了極大的恐慌垦梆，老刑警劉巖，帶你破解...
沈念sama閱讀 218,858評論 6贊 508
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件仅孩，死亡現(xiàn)場離奇詭異托猩，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)辽慕，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,372評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門京腥，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人溅蛉，你說我怎么就攤上這事公浪。” “怎么了船侧？”我有些...
開封第一講書人閱讀 165,282評論 0贊 356
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵因悲，是天一觀的道長。經(jīng)常有香客問我勺爱，道長晃琳，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,842評論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任琐鲁，我火速辦了婚禮卫旱，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘围段。我一直安慰自己顾翼，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 67,857評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布奈泪。她就那樣靜靜地躺著适贸，像睡著了一般。火紅的嫁衣襯著肌膚如雪涝桅。梳的紋絲不亂的頭發(fā)上拜姿，一...
開封第一講書人閱讀 51,679評論 1贊 305
城市分裂傳說
那天，我揣著相機(jī)與錄音冯遂，去河邊找鬼蕊肥。笑死，一個胖子當(dāng)著我的面吹牛蛤肌，可吹牛的內(nèi)容都是我干的壁却。我是一名探鬼主播批狱，決...
沈念sama閱讀 40,406評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼展东！你這毒婦竟也來了赔硫？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 39,311評論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤盐肃，失蹤者是張志新（化名）和其女友劉穎卦停，沒想到半個月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體恼蓬，經(jīng)...
沈念sama閱讀 45,767評論 1贊 315
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,945評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年僵芹，在試婚紗的時候發(fā)現(xiàn)自己被綠了处硬。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 40,090評論 1贊 350
活死人
序言：一個原本活蹦亂跳的男人離奇死亡拇派，死狀恐怖荷辕，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情件豌，我是刑警寧澤疮方，帶...
沈念sama閱讀 35,785評論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站茧彤，受9級特大地震影響骡显，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜曾掂，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,420評論 3贊 331
男人毒藥：我在死后第九天來索命
文/蒙蒙一惫谤、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧珠洗，春花似錦溜歪、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,988評論 0贊 22
一樁弒父案蝴猪，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至膊爪，卻和暖如春自阱，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背米酬。一陣腳步聲響...
開封第一講書人閱讀 33,101評論 1贊 271
情欲美人皮
我被黑心中介騙來泰國打工动壤，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人淮逻。一個月前我還...
沈念sama閱讀 48,298評論 3贊 372
代替公主和親
正文我出身青樓琼懊，卻偏偏與公主長得像阁簸，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子哼丈，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,033評論 2贊 355

GATK HaplotypeCallerSpark模塊的使用

推薦閱讀更多精彩內(nèi)容