NextPolish由未來組開發(fā)對基因組序列進(jìn)行polish的工具曼氛,對三代以及二代均可進(jìn)行polish墨技。
gituhp地址:https://github.com/Nextomics/NextPolish
基因組進(jìn)行de novo組裝后娄琉,得到contig拌禾,必須使用三代(尤其是沒有consensus胜蛉,比如minimap2+miniasm)掌桩,二代進(jìn)行糾錯(cuò)遣蚀。NextPolish是一個(gè)非常不錯(cuò)的選擇矾麻,同時(shí)支持三代纱耻,二代,hifi進(jìn)行糾錯(cuò)险耀。
1 安裝
本次安裝的最新版本為v1.3.1, 下載后
tar -vxzf NextPolish.tgz && cd NextPolish && make
2 配置文件
[General]
job_type = local ## local, sge, pbs... (default: sge)
job_prefix = nextPolish # 輸入名
task = best # 有【all, default, best,1,2,5,12,1212..】1,2 針對二代reads膝迎,5 針對長reads,默認(rèn)為best即可
rewrite = no # 以后文件是否覆蓋結(jié)構(gòu)胰耗;默認(rèn) no
rerun = 3 # 未完成jobs進(jìn)行再次運(yùn)行限次;默認(rèn) 3
parallel_jobs = 2 # 并行的任務(wù);默認(rèn)6
multithread_jobs = 3 # 每一個(gè)任務(wù)線程柴灯; 默認(rèn) 5
genome = ./raw.genome.fasta # 基因組文件
genome_size = auto # 自動(dòng)即可
workdir = ./01_rundir # 輸入文件
polish_options = -p {multithread_jobs} # 進(jìn)行polish的進(jìn)行數(shù)量
[sgs_option] ## 短reads參數(shù)設(shè)置
sgs_fofn = ./sgs.fofn # 含有二代reads路徑的文本卖漫,每行一個(gè)文件
sgs_options = -max_depth 100 -bwa # 默認(rèn)用bwa進(jìn)行比對,還可以選擇minimap2
[lgs_option] # 長reads 參數(shù)設(shè)置(如果僅用二代赠群,這個(gè)可以刪除)
lgs_fofn = ./lgs.fofn # 含有長reads的文本文件
lgs_options = -min_read_len 5k -max_depth 100
lgs_minimap2_options = -x map-ont ## pacbio為map-pb, ont為map-ont
3 運(yùn)行示例文件
nextPolish test_data/run.cfg
結(jié)果為/NextPolish/test_data/01_rundir/genome.nextpolish.fasta
序列小寫字母表示低質(zhì)量堿基羊始,一般由于雜合導(dǎo)致