利用NextDenovo進(jìn)行三代組裝(四個組裝軟件結(jié)果比較)

一:下載安裝

下載地址
https://github.com/Nextomics/NextDenovo/releases/download/v2.1-beta.0/NextDenovo.tgz

**INSTALL**  
`tar -vxzf NextPolish.tgz && cd NextPolish && make`  ## 現(xiàn)在不需要安裝了勉盅,直接下載解壓就可以用了

需要注意的是這個軟件運行需要Python2的環(huán)境哦。然后安裝好了記得加環(huán)境盹廷。
這次用的是大腸桿菌的一個pacbio數(shù)據(jù)做的測試氛悬。

二:配置文件

1. 配置run.cfg文件

安裝好了之后在你的文件夾下面有一個test_data的文件夾黔姜,里面有例子剃浇,復(fù)制過來改一下就ok了巾兆。

mkdir ecoli && cd ecoli
cp /path to/NextDenovo/test_data/run.cfg .
vim run.cfg

大致就像這樣,里面有些需要改偿渡,有些用默認(rèn)就好。


run.cfg文件

參數(shù)解讀:

  • job_type 設(shè)置運行環(huán)境霸奕,可以使用(local溜宽, sge, pbs等)
  • seed_cutfiles 如果在集群上運行质帅,建議設(shè)置為可用的節(jié)點數(shù)适揉,同時設(shè)置correction_options的-p為各個節(jié)點可用的核數(shù),保證每個節(jié)點只有一個correction任務(wù)煤惩,減少運行時的內(nèi)存和IO嫉嘀。 如果local上運行, 建議設(shè)置為總可用的核除以correction_options的-p值.
  • parallel_jobs建議設(shè)置至少要大于pa_correction魄揉。
  • blocksize 是將小于seed_cutfiles的數(shù)據(jù)拆分成的多個文件時單個文件的大小剪侮, 此對于10g以內(nèi)的數(shù)據(jù)量, 建議設(shè)置小于1g, 避免總的任務(wù)數(shù)小于parallel_jobs的值瓣俯。
    測序數(shù)據(jù)類型相關(guān): 對于PacBio而言杰标,要修改minimap2_options_中的-x ava-ont為-x ava-pb
  • 數(shù)據(jù)量相關(guān)參數(shù): read_cutoff = 1k過濾原始數(shù)據(jù)中低于1k的read,seed_cutoff = 30k則是選擇大于30k以上的數(shù)據(jù)來矯正彩匕。關(guān)于seed_cutoff的設(shè)置腔剂,可以通過~/opt/biosoft/NextDenovo/bin/seq_stat來獲取參考值,不建議直接使用默認(rèn)值驼仪,因為改值會受到測序深度和測序長度影響掸犬,而且一個不合適的值會顯著降低組裝質(zhì)量。對于基因組大于200m以上的物種绪爸,-d建議默認(rèn)湾碎。
  • random_round參數(shù),建議設(shè)置20-100. 該參數(shù)是設(shè)置隨機組裝參數(shù)的數(shù)量毡泻,nextGraph會基于每一套隨機參數(shù)做一次組裝胜茧, 避免默認(rèn)參數(shù)效果不好
    ———————————————————————————————————————
    這里用 seq_stat能夠根據(jù)自己物種大小和預(yù)期用于組裝的深度確定seed_cutoff。
seq_stat -g 4.8Mb input.fofn > seq_stat
seq_stat結(jié)果

所以我這里的seed_cutoff默認(rèn)為30K就不行了仇味,因為最初的才18K多呻顽。

2. 配置input.fofn文件,就是你的輸入文件絕對路徑

3. 運行程序

$nextDenovo run.cfg
運行完畢

默認(rèn)參數(shù)結(jié)果是存放在01_rundir/03.ctg_graph/01.ctg_graph.sh.work/ctg_graph00, 可以將其復(fù)制到當(dāng)前目錄丹墨,用于后續(xù)的分析廊遍。
最終在01_rundir/03.ctg_graph/01.ctg_graph.sh.work/ctg_graph00的contig長度為4540kb.
但是在01.ctg_graph.sh.work目錄下除了ctg_graph00以外,還有其他隨機參數(shù)的在組裝結(jié)果贩挣。隨機參數(shù)結(jié)果只輸出了統(tǒng)計結(jié)果喉前,用戶如需要輸出組裝序列,可以修改01_rundir/03.ctg_graph/01.ctg_graph.sh王财,將里面的-a 0替換成-a 1卵迂。
每個目錄下都有shell輸出,可以挑選基于nextDenovo.sh.e這里面的結(jié)果挑選組裝指標(biāo)較好的绒净,再輸出序列见咒,比如說比較下N50。

$grep N50 01_rundir/03.ctg_graph/01.ctg_graph.sh.work/ctg_graph*/*.e

默認(rèn)情況下挂疆,最終組裝出20條contig改览。


全部20條contig結(jié)果

最后:
我用了四個性價比比較高的三代組裝軟件對大腸桿菌pacbio數(shù)據(jù)做了個比較:


結(jié)果比較

可以看到在不考慮速度的情況下,flye的長度是最長的缤言。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末宝当,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子胆萧,更是在濱河造成了極大的恐慌庆揩,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,372評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異盾鳞,居然都是意外死亡犬性,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評論 3 392
  • 文/潘曉璐 我一進(jìn)店門腾仅,熙熙樓的掌柜王于貴愁眉苦臉地迎上來乒裆,“玉大人,你說我怎么就攤上這事推励『姿#” “怎么了?”我有些...
    開封第一講書人閱讀 162,415評論 0 353
  • 文/不壞的土叔 我叫張陵验辞,是天一觀的道長稿黄。 經(jīng)常有香客問我,道長跌造,這世上最難降的妖魔是什么杆怕? 我笑而不...
    開封第一講書人閱讀 58,157評論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮壳贪,結(jié)果婚禮上陵珍,老公的妹妹穿的比我還像新娘。我一直安慰自己违施,他們只是感情好互纯,可當(dāng)我...
    茶點故事閱讀 67,171評論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著磕蒲,像睡著了一般留潦。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上辣往,一...
    開封第一講書人閱讀 51,125評論 1 297
  • 那天兔院,我揣著相機與錄音,去河邊找鬼站削。 笑死坊萝,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的钻哩。 我是一名探鬼主播屹堰,決...
    沈念sama閱讀 40,028評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼肛冶,長吁一口氣:“原來是場噩夢啊……” “哼街氢!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起睦袖,我...
    開封第一講書人閱讀 38,887評論 0 274
  • 序言:老撾萬榮一對情侶失蹤珊肃,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體伦乔,經(jīng)...
    沈念sama閱讀 45,310評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡厉亏,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,533評論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了烈和。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片爱只。...
    茶點故事閱讀 39,690評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖招刹,靈堂內(nèi)的尸體忽然破棺而出恬试,到底是詐尸還是另有隱情,我是刑警寧澤疯暑,帶...
    沈念sama閱讀 35,411評論 5 343
  • 正文 年R本政府宣布训柴,位于F島的核電站,受9級特大地震影響妇拯,放射性物質(zhì)發(fā)生泄漏幻馁。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,004評論 3 325
  • 文/蒙蒙 一越锈、第九天 我趴在偏房一處隱蔽的房頂上張望仗嗦。 院中可真熱鬧,春花似錦瞪浸、人聲如沸儒将。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽钩蚊。三九已至,卻和暖如春蹈矮,著一層夾襖步出監(jiān)牢的瞬間砰逻,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評論 1 268
  • 我被黑心中介騙來泰國打工泛鸟, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留蝠咆,地道東北人。 一個月前我還...
    沈念sama閱讀 47,693評論 2 368
  • 正文 我出身青樓北滥,卻偏偏與公主長得像刚操,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子再芋,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,577評論 2 353