FinisherSC升級基因組—你還在用MUMmer3?

軟件介紹

FinisherSC 是一個能夠利用三代測序的 raw subreads 對基因組進行升級的軟件奶陈。其是一個Python寫的軟件,能夠并行化調(diào)用MUMmer軟件進行序列比對蔚舀,若2條 Contigs 序列末端有且僅有一個連接對象,則整合兩條contigs锨络;此外赌躺,軟件還可以使用 String graphs 方法利用屬于Repeat 的 Overlap 進行 Contigs 整合。

MUMmer 版本問題

FinisherSC 最近一次更新是在 3 May 2016羡儿,軟件使用的版本為 MUMmer3.23礼患。但MUMmer版本并沒有停止在MUMmer3,在2018年掠归,MUMmer 迎來了一個版本更迭MUMmer4缅叠。

journal.pcbi.1005944.t003.PNG

從來自MUMmer4文章的表格來看,速度及支持的數(shù)據(jù)量上有了明顯的提升虏冻。既然MUMmer4 優(yōu)于 MUMmer 3.23肤粱。那么在運行FinisherSC時可不可以替換呢?經(jīng)過本人實際測試厨相,答案是肯定的领曼。只是有一點特殊的就是,如果使用 MUMmer4 并且設置 -par 32 就會出現(xiàn)報錯(本人使用服務器的線程為32蛮穿,內(nèi)存為128G)庶骄。但如果不做設置,則可以順利跑完践磅。說道這里你可能會有疑問单刁,MUMmer 3.23 可以設置-par 32。而 MUMmer4 不做這個設置府适,那時間上會不會是 MUMmer4 花費的時間更多呢羔飞? 答案是否定的肺樟,經(jīng)過本人實測, MUMmer4耗時:MUMmer 3.23耗時= 1: 6 左右褥傍。
我目前的能力還不夠儡嘶,你讓我改軟件代碼可能做不到,在這提出這個發(fā)現(xiàn)恍风,以供有興趣的研究蹦狂。如果你和我一樣能力還不夠,希望該文章對你有幫助朋贬。

代碼實測

# 測試對象 contigs.fasta 86M 凯楔;raw_reads.fasta 8.73G
# MUMmer4
python /opt/biosoft/finishingTool/finisherSC.py -par 32 ./ /opt/biosoft/mummer4/bin/
## 報錯如下
# ./relatedReads_Double.fasta: 24000 sequences, 427024630 bp => dividing into 32 parts ................................ OK
# All done, 5 seconds elapsed
# nProc 32
# 32

# libgomp: Thread creation failed: Resource temporarily unavailable

# libgomp: Thread creation failed: Resource temporarily unavailable

# libgomp: Thread creation failed: Resource temporarily unavailable

# libgomp: Thread creation failed: Resource temporarily unavailable

# libgomp: Thread creation failed: Resource temporarily unavailable

# libgomp: Thread creation failed: Resource temporarily unavailable

# libgomp: Thread creation failed: Resource temporarily unavailable
# sh: fork: retry: 資源暫時不可用
# ERROR: Could not parse delta file, ./outGapFillRefine22.delta
# error no: 402
# ERROR: Could not parse delta file, ./outGapFillRefine28.delta
# error no: 402
# ERROR: Could not parse delta file, ./outGapFillRefine24.delta
# error no: 402
# ERROR: Could not parse delta file, ./outGapFillRefine05.delta
# error no: 402

# libgomp: Thread creation failed: Resource temporarily unavailable
# ERROR: Could not parse delta file, ./outGapFillRefine18.delta
# error no: 402
# ERROR: Could not parse delta file, ./outGapFillRefine01.delta
# error no: 402
# ERROR: Could not parse delta file, ./outGapFillRefine16.delta
# error no: 402
# ERROR: Could not parse delta file, ./outGapFillRefine32.delta
# error no: 402

python /opt/biosoft/finishingTool/finisherSC.py ./ /opt/biosoft/mummer4/bin/
# Time 4040.41538692 s
## 沒有報錯

# MUMmer3.23
python /opt/biosoft/finishingTool/finisherSC.py -par 32  ./ /opt/biosoft/MUMmer3.23/
# Time 22565.2418311 s

參考

NGS生物信息學分析 V6.0 陳連福 鄭越
MUMmer4: A fast and versatile genome alignment system

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市锦募,隨后出現(xiàn)的幾起案子摆屯,更是在濱河造成了極大的恐慌,老刑警劉巖糠亩,帶你破解...
    沈念sama閱讀 218,682評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件虐骑,死亡現(xiàn)場離奇詭異,居然都是意外死亡赎线,警方通過查閱死者的電腦和手機廷没,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,277評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來垂寥,“玉大人颠黎,你說我怎么就攤上這事≈拖睿” “怎么了狭归?”我有些...
    開封第一講書人閱讀 165,083評論 0 355
  • 文/不壞的土叔 我叫張陵,是天一觀的道長文判。 經(jīng)常有香客問我过椎,道長,這世上最難降的妖魔是什么戏仓? 我笑而不...
    開封第一講書人閱讀 58,763評論 1 295
  • 正文 為了忘掉前任潭流,我火速辦了婚禮,結(jié)果婚禮上柜去,老公的妹妹穿的比我還像新娘灰嫉。我一直安慰自己,他們只是感情好嗓奢,可當我...
    茶點故事閱讀 67,785評論 6 392
  • 文/花漫 我一把揭開白布讼撒。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪根盒。 梳的紋絲不亂的頭發(fā)上钳幅,一...
    開封第一講書人閱讀 51,624評論 1 305
  • 那天,我揣著相機與錄音炎滞,去河邊找鬼敢艰。 笑死,一個胖子當著我的面吹牛册赛,可吹牛的內(nèi)容都是我干的钠导。 我是一名探鬼主播,決...
    沈念sama閱讀 40,358評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼森瘪,長吁一口氣:“原來是場噩夢啊……” “哼牡属!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起扼睬,我...
    開封第一講書人閱讀 39,261評論 0 276
  • 序言:老撾萬榮一對情侶失蹤逮栅,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后窗宇,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體措伐,經(jīng)...
    沈念sama閱讀 45,722評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,900評論 3 336
  • 正文 我和宋清朗相戀三年军俊,在試婚紗的時候發(fā)現(xiàn)自己被綠了侥加。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,030評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡蝇完,死狀恐怖官硝,靈堂內(nèi)的尸體忽然破棺而出矗蕊,到底是詐尸還是另有隱情短蜕,我是刑警寧澤,帶...
    沈念sama閱讀 35,737評論 5 346
  • 正文 年R本政府宣布傻咖,位于F島的核電站朋魔,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏卿操。R本人自食惡果不足惜警检,卻給世界環(huán)境...
    茶點故事閱讀 41,360評論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望害淤。 院中可真熱鬧扇雕,春花似錦、人聲如沸窥摄。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,941評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至哨苛,卻和暖如春鸽凶,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背建峭。 一陣腳步聲響...
    開封第一講書人閱讀 33,057評論 1 270
  • 我被黑心中介騙來泰國打工玻侥, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人亿蒸。 一個月前我還...
    沈念sama閱讀 48,237評論 3 371
  • 正文 我出身青樓凑兰,卻偏偏與公主長得像,于是被迫代替她去往敵國和親祝懂。 傳聞我的和親對象是個殘疾皇子票摇,可洞房花燭夜當晚...
    茶點故事閱讀 44,976評論 2 355