第一步安裝軟件
conda install SPAdes
#通過miniconda3安裝SPAdes,可隨時調(diào)用,無需再添加環(huán)境變量扑馁。
第二步轉(zhuǎn)到工作目錄
cd /home/monkeyflower/bioworkplace
第三步盼玄,拼裝序列
spades.py --pe1-1 L4-3_1.clean.fq.gz --pe1-2 L4-3_2.clean.fq.gz -t 200 -k 21,33,55,77 -m 600 --careful --phred-offset 33 -o testfile
#--pe1-1贴彼、--pe1-2:需要拼接的前后兩個序列
#-t:線程數(shù)
#-k:kmer選擇的值,默認的值為21,33,55,77,數(shù)字必須是小于128的奇數(shù)
#-m:內(nèi)存埃儿,最大允許使用內(nèi)存(GB)
#--careful:read糾錯,減少錯誤和插入序列
#--phred-offset:堿基質(zhì)量體系,在數(shù)據(jù)糾錯中會用到器仗,illumina數(shù)據(jù)一般采用33
#-o:輸出文件目錄
第四步,導出輸出文件
#文件scaffolds.fasta和contigs.fasta便是需要的結(jié)果文件
#corrected/:包含用BayesHammer糾錯reads產(chǎn)生*.fastq.gz文件童番。
#scaffolds.fasta:包含產(chǎn)生的scaffolds
#contigs.fasta:包含產(chǎn)生的contigs
#assembly_graph.gfa:包含SPAdes組裝圖和scaffolds的路徑精钮。
#assembly_graph.fastg:包含SPAdes組裝圖。(FASTG格式)
#contigs.paths:組裝圖中包含與contigs.fasta對應的路徑剃斧。
#scaffolds.paths:組裝圖中包含與scaffolds.fasta對應的路徑