背景:目前用于新一代的測(cè)序的主要儀器有Illumina/Solexa的Genome Analyzer英妓、ABI的Solid和Roche的454,它們都能高通量的測(cè)序,產(chǎn)生大量的測(cè)序結(jié)果。接下來就要對(duì)序列進(jìn)行拼接,用于拼接的軟件也有很多奶是。這里我們將采用SPAdes和Velvet對(duì)同一組數(shù)據(jù)處理并比較。
處理的文件分別為test_7942raw_1.fq.gz和test_7942raw_2.fq.gz
SPAdes組裝
1竣灌、由于我的fq文件在Seqs目錄下聂沙,所以在test文件名前加上其路徑,且將文件輸出到Seqs目錄中
spades.py --careful --pe1-1 ~/Seqs/test_7942raw_1.fq.gz --pe1-2 ~/Seqs/test_7942raw_2.fq.gz -o ~/Seqs/SPAdesout_7942_new
--注:pe1指第一個(gè)pe文庫(kù)初嘹,pe1-1是指第一個(gè)pe文庫(kù)的正向及汉,pe1-2是指第一個(gè)pe文庫(kù)的反向 2、運(yùn)行成功后屯烦,進(jìn)入Seqs中查看:多了一個(gè)SPAdesout_7942_new文件
其中的contigs.fasta文件為quast處理文件
Velvet組裝
velvet的使用分為兩步:第一步是velveth利用數(shù)據(jù)構(gòu)建一個(gè)hash表坷随,第二步是velvetg進(jìn)行序列拼接
1、輸入代碼:(用velveth命令構(gòu)建一個(gè)hash表)
velveth velvet_out 31 -shortPaired -fastq -separate test_7942raw_1.fq.gz test_7942raw_2.fq.gz
(注意fq文件的路徑驻龟,若文件當(dāng)前目錄下温眉,則可不用輸入路徑)
2、輸入代碼:(用velvetg命令進(jìn)行組裝)
velvetg velvet_out -exp_cov auto -cov_cutoff auto -very_clean yes
3翁狐、就可以看到目錄下生成velvet.out文件其中的contigs类溢。fa為quast處理文件
QUAST判斷兩個(gè)軟件的評(píng)價(jià)效果
①spades
1、輸入代碼:
quast.py ~/Seqs/SPAdesout_7942/contigs.fasta -o ~/Seqs/SPAdesout_7942/quast_out
結(jié)果顯示在/Seqs/SPAdesout_7942/quast_out/下
2露懒、在linux下打開report文件
less report.txt
②velvet
1闯冷、輸入代碼:
quast.py ~/Seqs/velvet_out/contigs.fa -o ~/Seqs/velvet_out/quast_out
輸出結(jié)果在/Seqs/velvet_out/quast_out/下
2、打開report文件
③比較
1隐锭、輸入代碼:./表示在當(dāng)前目錄下窃躲,使用的文件和輸出都在當(dāng)前目錄下
quast.py -o compare_spa_velvet ./SPAdesout_7942_new/contigs.fasta ./velvet_out/contigs.fa
如圖
3蒂窒、查看比較結(jié)果,打開report.txt文件荞怒。兩個(gè)軟件拼接結(jié)果整合在一起
less report.txt