導讀
SPAdes是2012年發(fā)表在Journal of Computational Biology上的一篇文章提出的二代測序組裝軟件,是目前引用量已經達到6200+退唠,在宏基因組組裝軟件中引用量最高【其他組學不清楚了】鹃锈。SPAdes不僅推出rnaSPAdes【轉錄組】、metaSPAdes【宏基因組】瞧预、plasmindSPAdes【質潦赫】,還推出了可以用于二代垢油、三代測序數(shù)據混合組裝的hybrid SPAdes功能盆驹。SPAdes雖然在速度、效率上比不過megahit滩愁,但SPAdes內部含校錯功能躯喇,組裝更加準確,也因此適合二代硝枉、三代混合組裝廉丽。
官網:http://cab.spbu.ru/software/spades/
一、SPAdes相關的文章
【1】SPAdes
文章:SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing
雜志:J Comput Biol.
時間:2012
引用:6241+
【2】plasmidSPAdes
雜志:plasmidSPAdes: assembling plasmids from whole genome sequencing data
雜志:Bioinformatics
時間:2016
【3】hybridSPAdes
文章:hybridSPAdes: an algorithm for hybrid assembly of short and long reads
雜志:Bioinformatics
時間:2016
【4】metaSPAdes
文章:metaSPAdes: a new versatile metagenomic assembler
雜志:Genome Res.
時間:2017
【5】rnaSPAdes
文章:rnaSPAdes: a de novo transcriptome assembler and its application to RNA-Seq data
雜志:Gigascience
時間:2019
二妻味、下載正压、安裝SPAdes
wget -c http://cab.spbu.ru/files/release3.14.0/SPAdes-3.14.0-Linux.tar.gz
# 下載目前最新版spades3.14.0
# 下載解壓即可使用
meta rna plasmind都在里面了,hybrid在spades中使用混合組裝參數(shù)即可【在下面了】
conda安裝
conda create -n assembly
conda activate assembly
conda install spades
三责球、SPAdes混合組裝二代焦履、三代
在軟件canu文章的補充材料中看到了SPAdes混合組裝的方法拓劝。
軟件:canu
文章:Canu: scalable and accurate long-read assembly via adaptive k-mer weighting and repeat separation
雜志:Genome Research
時間:2017
引用:1220+
illumina混合pacbio組裝:
./spades.py -1 [illumina1.fq] -2 [illumina2.fq] --pacbio [pacbio.fa] -t 52 -m 400 -o hybrid_pacbio
illumina混合nanopore組裝:
./spades.py -1 [illumina1.fq] -2 [illumina2.fq] --pacbio [ont.fasta] -t 52 -m 400 -o hybrid_nanopore
結果
四、SPAdes組裝二代
下載解壓最新版
wget -c http://cab.spbu.ru/files/release3.15.2/SPAdes-3.15.2-Linux.tar.gz
tar -zxvf SPAdes-3.15.2-Linux.tar.gz
cd SPAdes-3.15.2-Linux/bin/
./spades.py --help
組裝meta測序數(shù)據
/public/home/zzumgg03/huty/softwares/SPAdes-3.15.2-Linux/bin/./spades.py \
--meta -t 2 -m 10 \
-1 SRR341593_bowtie2.1.fastq \
-2 SRR341593_bowtie2.2.fastq \
-o out_dir
# m, memeory 250G by default
# t, thread 16 by default
spades只支持fastq文件嘉裤,fasta文件不能用
五郑临,組裝質粒
質控
kneaddata \
-i ./rawdata/FC2282_FDSW210258126-1r_1.fq \
-i ./rawdata/FC2282_FDSW210258126-1r_2.fq \
-o ./cleandata/ \
--trimmomatic /route/miniconda3/envs/kneaddata/share/trimmomatic/ \
-t 4 \
--trimmomatic-options "SLIDINGWINDOW:4:20 MINLEN:50" \
--remove-intermediate-output
上下游序列一共1G數(shù)據量,spades比較吃內存屑宠,內存不夠后期會報錯厢洞,下面分配50G memory做組裝。軟件默認是250G mem 16 threads侨把。
組裝
$route/plasmidspades.py \
-1 ./cleandata/FC2282_FDSW210258126-1r_1_kneaddata.trimmed.1.fastq \
-2 ./cleandata/FC2282_FDSW210258126-1r_1_kneaddata.trimmed.2.fastq \
--threads 16 \
--memory 50 \
-o ./assembly/
結果