用nextDenovo組裝基因組

背景介紹

NextDenovo是武漢未來組(現(xiàn)在可能得叫希望組了)開發(fā)的用于三代基因組組裝的軟件跨算。
想當年讀碩士的時候我還因為項目合作的事兒在未來組呆了好幾個月來著。

可用資源

GitHub地址:https://github.com/Nextomics/NextDenovo
官方文檔: https://nextdenovo.readthedocs.io/en/latest/
洲更學長的筆記:ttps://xuzhougeng.top/archives/Assembly-nanopore-with-NextDenovo

軟件安裝

安裝起來比較輕松愉快匣砖,因為軟件本體不需要安裝磺箕,有編譯好的二進制文件可以直接下載使用搂捧。唯一需要安裝的就是一個python的依賴Paralleltask

# 下載軟件本體
wget https://github.com/Nextomics/NextDenovo/releases/download/v2.5.0/NextDenovo.tgz
# 安裝依賴
python -m pip install Paralleltask
# 解壓軟件
tar -zxvf NextDenovo.tgz

軟件測試

壓縮包解壓開之后可以找到里面有個test_data文件夾和它下面的示例程序test_data/run.cfg,可以直接運行測試一下軟件能不能在你的服務器上跑通。當然這一步是非必須的哈瓦侮。

cd NextDenovo
nextDenovo test_data/run.cfg

運行自己的項目

生成輸入文件

把自己的組裝數(shù)據(jù)的絕對路徑存入文件并命名成input.fofn

ls /path/to/01RawData/PacBio/*hifi_reads.fastq.gz > input.fofn

編寫config文件

拷貝一份測試數(shù)據(jù)的cfg文件過來

cp ../NextDenovo/doc/run.cfg .

按照自己的項目的實際情況去修改參數(shù)艰赞。我的test.run.cfg文件如下:

[General]
job_type = local # local, slurm, sge, pbs, lsf
job_prefix = test_nextDenovo
task = all # all, correct, assemble
rewrite = yes # yes/no
deltmp = yes 
parallel_jobs = 24 # number of tasks used to run in parallel
input_type = raw # raw, corrected
read_type = hifi # clr, ont, hifi
input_fofn = input.fofn
workdir = 01_rundir

[correct_option]
read_cutoff = 1k
genome_size = x.xg # estimated genome size
sort_options = -m 20g -t 15
minimap2_options_raw = -t 8
pa_correction = 3 # number of corrected tasks used to run in parallel, each corrected task requires ~TOTAL_INPUT_BASES/4 bytes of memory usage.
correction_options = -p 15

[assemble_option]
minimap2_options_cns = -t 8 
nextgraph_options = -a 1

更多的參數(shù)說明可以訪問下面這個官方教程地址:

https://nextdenovo.readthedocs.io/en/latest/OPTION.html

接下來去run就可以了

nohup nextDenovo test.run.cfg &

私貨時間

  1. 在我目前用PacBio HiFi數(shù)據(jù)組裝基因組的項目中,NextDenovo的效果僅次于hifiasm肚吏。
  2. GitHub上目前NextDenovo團隊是把HiFi給劃掉了方妖,不知道是不推薦使用NextDenovo用于組裝HiFi數(shù)據(jù)還是啥別的意思。
  3. NextDenovo現(xiàn)在文章還未發(fā)布罚攀,如果使用了請引用GitHub地址:
    https://github.com/Nextomics/NextDenovo
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末党觅,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子斋泄,更是在濱河造成了極大的恐慌杯瞻,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,324評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件炫掐,死亡現(xiàn)場離奇詭異魁莉,居然都是意外死亡,警方通過查閱死者的電腦和手機募胃,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,356評論 3 392
  • 文/潘曉璐 我一進店門旗唁,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人痹束,你說我怎么就攤上這事检疫。” “怎么了祷嘶?”我有些...
    開封第一講書人閱讀 162,328評論 0 353
  • 文/不壞的土叔 我叫張陵屎媳,是天一觀的道長。 經(jīng)常有香客問我论巍,道長烛谊,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,147評論 1 292
  • 正文 為了忘掉前任嘉汰,我火速辦了婚禮晒来,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘郑现。我一直安慰自己,他們只是感情好荧降,可當我...
    茶點故事閱讀 67,160評論 6 388
  • 文/花漫 我一把揭開白布接箫。 她就那樣靜靜地躺著,像睡著了一般朵诫。 火紅的嫁衣襯著肌膚如雪辛友。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,115評論 1 296
  • 那天,我揣著相機與錄音废累,去河邊找鬼邓梅。 笑死,一個胖子當著我的面吹牛邑滨,可吹牛的內(nèi)容都是我干的日缨。 我是一名探鬼主播,決...
    沈念sama閱讀 40,025評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼掖看,長吁一口氣:“原來是場噩夢啊……” “哼匣距!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起哎壳,我...
    開封第一講書人閱讀 38,867評論 0 274
  • 序言:老撾萬榮一對情侶失蹤毅待,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后归榕,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體尸红,經(jīng)...
    沈念sama閱讀 45,307評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,528評論 2 332
  • 正文 我和宋清朗相戀三年刹泄,在試婚紗的時候發(fā)現(xiàn)自己被綠了外里。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,688評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡循签,死狀恐怖级乐,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情县匠,我是刑警寧澤风科,帶...
    沈念sama閱讀 35,409評論 5 343
  • 正文 年R本政府宣布,位于F島的核電站乞旦,受9級特大地震影響贼穆,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜兰粉,卻給世界環(huán)境...
    茶點故事閱讀 41,001評論 3 325
  • 文/蒙蒙 一故痊、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧玖姑,春花似錦愕秫、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,657評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至闪彼,卻和暖如春甜孤,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,811評論 1 268
  • 我被黑心中介騙來泰國打工缴川, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留茉稠,地道東北人。 一個月前我還...
    沈念sama閱讀 47,685評論 2 368
  • 正文 我出身青樓把夸,卻偏偏與公主長得像而线,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子扎即,可洞房花燭夜當晚...
    茶點故事閱讀 44,573評論 2 353

推薦閱讀更多精彩內(nèi)容