SOAPdenovo2
下載地址: https://github.com/aquaskyline/SOAPdenovo2
使用方法分為兩步:
第一步: 構(gòu)建配置文件, 最簡(jiǎn)單的配置方法如下摊沉,詳細(xì)的參考"example.config"
#maximal read length
max_rd_len=150
[LIB]
avg_ins=200
reverse_seq=0
asm_flag=3
rd_len_cutoff=150
rank=1
pair_num_cutoff=3
map_len=32
q1=/path/to/read_1.fq
q2=/path/to/read_2.fq
需要調(diào)整的參數(shù)基本就下面兩個(gè)
- max_rd_len: read的長(zhǎng)度
- avg_ins: 插入文庫(kù)長(zhǎng)度风罩,例如500bp, 350bp文庫(kù)
第二步: 開始組裝, 主要參數(shù)就是K, 如果K<=63, 用SOAPdenovo-63mer
, 大于63則是SOAPdenovo-127mer
. -p
是線程數(shù)。
SOAPdenovo-63mer all -p 20 -s config -K 63 -R -o salvia 1> ass.log 2> ass.log &
結(jié)果文件是:
- *.config: contig序列
- *.scafSeq: scaffold序列
MaSuRCA: 混合組裝工具
適用于二代和三代混合組裝,也可以就只裝二代數(shù)據(jù)楼咳。
官方提示:使用原始數(shù)據(jù)抽碌,不做任何的預(yù)處理宣蔚,任何trimming, cleaning和error correction操作都會(huì)影響組裝的結(jié)果疆前。
這估計(jì)是軟件本身會(huì)做上面這一步吧。
軟件使用分為三步:
- 創(chuàng)建配置文件
~/opt/biosoft/MaSuRCA-3.2.4/bin/masurca -g config.txt
- 按照需求修改配置文件
主要分為DATA和PARAMETERS爷辙,DATA部分用來指定PE(雙端illumina普通文庫(kù)), JUMP(illumina大片段文庫(kù)), OTHER(其他平臺(tái)的測(cè)序結(jié)果)
PE = aa 180 20 /data/fwd_reads.fastq /data/rev_reads.fastq
# 兩個(gè)字符作為前綴彬坏,文庫(kù)插入平均大小,標(biāo)準(zhǔn)差(如果不清楚膝晾,約等于文庫(kù)插入平均大小X0.15)
- 產(chǎn)生組裝程序并運(yùn)行
~/opt/biosoft/MaSuRCA-3.2.4/bin/masurca config.txt
./assemble.sh
最后的組裝結(jié)果為genome.ctg.fasta
栓始,genome.scf.fasta
關(guān)于插入片段建議閱讀一篇文章說清楚什么是“插入片段”?