導(dǎo)讀
用Metabat2分箱的方法見:宏基因組分箱(二)Metabat2分箱實(shí)戰(zhàn)。本篇將展示用Metawrap的quant_bins模塊計(jì)算每個(gè)樣品中每個(gè)Bin的豐度的方法痹兜。quant_bins模塊利用salmon軟件的算法估計(jì)豐度渣聚。
一、查看輸入文件
- 原始數(shù)據(jù),即每個(gè)樣品的質(zhì)控后的fastq序列。
ls -alh Clean_data/
總用量 105G
drwxrwxr-x 2 cheng WST 4.0K 10月 15 16:45 .
drwxrwxr-x 14 cheng WST 4.0K 10月 23 19:46 ..
-rw-rw-r-- 1 cheng WST 11G 10月 15 16:13 H1_1.fastq
-rw-rw-r-- 1 cheng WST 11G 10月 15 16:14 H1_2.fastq
-rw-rw-r-- 1 cheng WST 13G 10月 15 16:14 H2_1.fastq
-rw-rw-r-- 1 cheng WST 13G 10月 15 16:15 H2_2.fastq
-rw-rw-r-- 1 cheng WST 5.0G 10月 15 16:15 H3_1.fastq
-rw-rw-r-- 1 cheng WST 5.0G 10月 15 16:15 H3_2.fastq
-rw-rw-r-- 1 cheng WST 13G 10月 15 16:15 H4_1.fastq
-rw-rw-r-- 1 cheng WST 13G 10月 15 16:16 H4_2.fastq
-rw-rw-r-- 1 cheng WST 12G 10月 15 16:16 H5_1.fastq
-rw-rw-r-- 1 cheng WST 12G 10月 15 16:16 H5_2.fastq
- 由Megahit共組裝得到的contig文件塘幅。
-rw-rw-r-- 1 cheng WST 261391061 10月 15 10:42 final.contigs.fa
- 有Metabat2分箱得到的bIn文件(分裝好的contig文件)。
ls -alh Bin/
總用量 159M
drwxrwxr-x 2 cheng WST 4.0K 10月 24 10:38 .
drwxrwxr-x 14 cheng WST 4.0K 10月 23 19:46 ..
-rw-rw-r-- 1 cheng WST 1.5M 10月 15 15:00 bin.10.fa
-rw-rw-r-- 1 cheng WST 1.1M 10月 15 15:00 bin.11.fa
-rw-rw-r-- 1 cheng WST 1.2M 10月 15 15:00 bin.12.fa
-rw-rw-r-- 1 cheng WST 1.2M 10月 15 15:00 bin.13.fa
-rw-rw-r-- 1 cheng WST 767K 10月 15 15:00 bin.14.fa
-rw-rw-r-- 1 cheng WST 229K 10月 15 15:00 bin.15.fa
...
二凭舶、Metawrap計(jì)算Bin豐度
source activate metawrap-env
# 進(jìn)入metawrap工作環(huán)境
metawrap quant_bins -t 32 -o Bin_quant/ -b Bin/ -a final.contigs.fa Clean_data/H*.fastq
參數(shù):
-t # 線程
-o # 輸出文件夾(自動(dòng)創(chuàng)建)
-b # Bin所在文件夾
-a # contig組裝結(jié)果
最后是fastq/a(初始數(shù)據(jù))文件所在文件夾
三晌块、豐度計(jì)算結(jié)果
metawrap quant_bins結(jié)果:
ls -alh Bin_quant/
總用量 296K
drwxrwxr-x 4 cheng WST 4.0K 10月 26 15:26 .
drwxrwxr-x 14 cheng WST 4.0K 10月 23 19:46 ..
drwxrwxr-x 2 cheng WST 4.0K 10月 15 17:00 assembly_index
-rw-rw-r-- 1 cheng WST 259K 10月 15 17:23 bin_abundance_heatmap.png
-rw-rw-r-- 1 cheng WST 9.8K 10月 26 15:26 bin_abundance.pdf
-rw-rw-r-- 1 cheng WST 5.0K 10月 15 17:22 bin_abundance_table.tab
drwxrwxr-x 2 cheng WST 4.0K 10月 15 17:22 quant_files
查看每個(gè)樣品每個(gè)Bin的豐度:
less Bin_quant/bin_abundance_table.tab
# 如下:
Genomic bins H2 H3 H1 H4 H5
bin.89 2.134105 0.893291 0.0 0.028242 0.0
bin.20 41.204144 19.519443 23.791852 36.713749 37.634001
bin.4 0.169901 0.218777 0.120826 0.9935795000000001 0.513861
bin.25 0.0 0.027746 2.670033 0.008831 0.0
bin.22 2.421549 7.251491 12.911376 0.775966 0.826068
bin.6 0.364747 0.120078 3.01643 0.607021 0.401539
bin.59 33.633947500000005 18.263084 20.202049 30.182607 30.293537
bin.68 0.884554 0.7562530000000001 0.036951 0.12255150000000001 0.437777
...
打開bin_abundance_heatmap.png,如下圖所示帅霜。顏色和縱坐標(biāo)設(shè)置都不好,可以自己用bin_abundance_table.tab文件重新畫熱圖呼伸。
圖片.png
相關(guān)閱讀:
宏基因組分箱(一)Megahit組裝和QUAST質(zhì)量評(píng)價(jià)
宏基因組分箱(二)Metabat2分箱實(shí)戰(zhàn)
宏基因組分箱(三)Blobology可視化Bin