Dada 2 流程
DADA2數(shù)據(jù)處理不以序列相似度聚類(lèi)泥畅,只進(jìn)行去重(或相當(dāng)于以100%序列相似度聚類(lèi))料扰,生成的是以ASV為單元的表格凭豪;
Vsearch數(shù)據(jù)處理與Usearch類(lèi)似,以序列間相似度聚類(lèi)(默認(rèn)序列相似度為97%)晒杈,生成的是OTU為單元的矩陣文件嫂伞。
DADA2去噪分析分辨率更高,準(zhǔn)確性更強(qiáng)拯钻。
雙端數(shù)據(jù)命令示例:
1.降噪
輸入:導(dǎo)入QIIME 2的 raw reads(summary_pe.qza)
time qiime dada2 denoise-paired \
--i-demultiplexed-seqs summary_pe.qza \
--o-table table-dada2_pe.qza \
--o-representative-sequences rep-seqs-dada2_pe.qza \
--o-denoising-stats dada2-stats_pe.qza \
--p-trim-left-f 0 \
--p-trim-left-r 4 \
--p-trunc-len-f 220 \
--p-trunc-len-r 240
參數(shù)解釋?zhuān)?/h4>
–p-trim-left-f 0 :表示從forward左端的第0位置開(kāi)始裁剪
–p-trim-left-r 0: 表示從reverse左端的第0位置開(kāi)始裁剪
–p-trunc-len-f 250 :表示forward總共保留的長(zhǎng)度為250
–p-trunc-len-r 250:表示reverse總共保留的長(zhǎng)度為250
輸出:
table-dada2_pe.qza:特征表:即后綴名為biom的OTU table文件帖努。
rep-seqs-dada2_pe.qza: 代表序列文件
dada2-stats_pe.qza: 過(guò)程統(tǒng)計(jì)文件
–p-trim-left-f 0 :表示從forward左端的第0位置開(kāi)始裁剪
–p-trim-left-r 0: 表示從reverse左端的第0位置開(kāi)始裁剪
–p-trunc-len-f 250 :表示forward總共保留的長(zhǎng)度為250
–p-trunc-len-r 250:表示reverse總共保留的長(zhǎng)度為250
table-dada2_pe.qza:特征表:即后綴名為biom的OTU table文件帖努。
rep-seqs-dada2_pe.qza: 代表序列文件
dada2-stats_pe.qza: 過(guò)程統(tǒng)計(jì)文件
上面的參數(shù)(非0數(shù)字(—p-n-threads除外))因個(gè)人的測(cè)序而定
2.過(guò)程統(tǒng)計(jì)文件可視化:
qiime metadata tabulate \
--m-input-file dada2-stats.qza \
--o-visualization dada2-stats.qzv
3. 導(dǎo)出otu table文件并轉(zhuǎn)化格式
QIIME 2 的產(chǎn)物 qza 后綴文件相當(dāng)于一個(gè)壓縮包,可以使用 “ unzip ”命令解壓粪般。
特征表文件 feature_table.qza 或 table.qza 文件解壓后拼余,在 data/ 目錄下會(huì)獲得一個(gè)后綴為.biom的文件,將其轉(zhuǎn)換為 tsv 文件的命令是:
unzip table-dada2.qza
biom convert -i feature-table.biom -o table.tsv --to-tsv
4. otu table和代表序列可視化
qiime feature-table summarize \
--i-table table-dada2.qza \
--o-visualization table.qzv \
--m-sample-metadata-file sample-metadata.tsv
qiime feature-table tabulate-seqs \
--i-data rep-seqs.qza \
--o-visualization rep-seqs-dada2.qza
單端數(shù)據(jù)命令示例:
qiime dada2 denoise-single \
--i-demultiplexed-seqs demux-summary.qza \
--p-trim-left 0 \
--p-trunc-len 120 \
--o-representative-sequences rep-seqs-dada2.qza \
--o-table table.qza \
--o-denoising-stats dada2-stats.qza