dada2
插件對(duì)原始數(shù)據(jù)paired-end-demux.qza
進(jìn)行質(zhì)量過(guò)濾需要兩個(gè)參數(shù)瑞佩,trunc-len-f
和trunc-len-r
箕戳。這個(gè)想法是通過(guò)盡可能多地刪除較低質(zhì)量部分來(lái)優(yōu)化正向和反向的讀取與合并步势,并且仍然保留足夠的重疊部分驹碍。我們可以通過(guò)檢查原始數(shù)據(jù)的質(zhì)量值來(lái)獲得過(guò)濾參數(shù)。現(xiàn)在可以通過(guò)figaro
程序來(lái)得到合適的參數(shù).
1. 安裝figaro
(https://github.com/Zymo-Research/figaro)
wget http://john-quensen.com/wp-content/uploads/2020/03/figaro.yml
conda env create -n figaro --file figaro.yml
conda activate figaro
2. github
下載為figaro
的zip文件
wget https://github.com/Zymo-Research/figaro/archive/master.zip
unzip master.zip
mv figaro-master figaro
cd figaro
chmod 777 figaro.py
3. 運(yùn)行figaro
#創(chuàng)建data文件夾放入要處理的原始數(shù)據(jù)
mkdir data
A1_16s_R1.fastq
A1_16s_R2.fastq
A2_16s_R1.fastq
A2_16s_R2.fastq
#請(qǐng)嚴(yán)格按照此格式命名
conda activate figaro
python $PWD/figaro/figaro.py -i data -o data -f 1 -r 1 -a 465 -F zymo
-i 輸入目錄
-o 輸出目錄
-f 正向引物的長(zhǎng)度脆烟。如果已除去引物山林,請(qǐng)輸入1。
-r 反向引物的長(zhǎng)度浩淘。如果已除去引物捌朴,請(qǐng)輸入1。
-a 預(yù)期的合并擴(kuò)增子長(zhǎng)度(即引物擴(kuò)增長(zhǎng)度)张抄,可以保守一些砂蔽,并提供稍大的價(jià)值。
(此處以341F-806R為示例)
-F 文件名格式(請(qǐng)嚴(yán)格按照代碼所示填寫(xiě))
4. 輸出文件解讀
trimParameters.json
forwardExpectedError.png
reverseExpectedError.png
要獲取推薦的截?cái)鄥?shù)署惯,請(qǐng)查看trimParameters.json:如下所示
[
{
"trimPosition": [
247,
240
],
"maxExpectedError": [
2,
3
],
"readRetentionPercent": 87.24,
"score": 82.24249607692565
},
]
推薦的正向截?cái)辔恢脼?47左驾,
推薦的反向截?cái)辔恢脼?40。
修剪和截?cái)嗪蠹辏蜃x取的預(yù)期錯(cuò)誤數(shù)為2诡右,
反向讀取的預(yù)期錯(cuò)誤數(shù)為3,
qiime2 dada2插件合并87.24%的讀數(shù)