導(dǎo)讀
上一篇:宏基因組分箱(一)Megahit組裝和QUAST質(zhì)量評(píng)價(jià)。分箱工具有很多杏愤,我為什么選擇Metabat2呢靡砌?請(qǐng)見(jiàn):宏基因組最佳分箱工具M(jìn)etabat2。下面是Metabat2分箱的步驟:1. 建索引珊楼;2. 比對(duì)通殃;3. sam2bam;4. bam2sorted.bam厕宗;5. 計(jì)算contig深度画舌;6. 分箱;7. 結(jié)果已慢。
一曲聂、建索引
使用bowtie2的bowte2-build功能給測(cè)序數(shù)據(jù)組裝得到的contig建索引文件,用于比對(duì)佑惠。
time bowtie2-build -f final.contigs.fa final --threads 16
-f:輸入文件
[final]:輸出文件前綴
--threads:線程
time:計(jì)時(shí)
--large-index:force generated index to be 'large', even if ref has fewer than 4 billion nucleotides
二朋腋、比對(duì)
使用bowtie2比對(duì)測(cè)序數(shù)據(jù)和contig。
time bowtie2 -1 ALL_READS_1.fastq -2 ALL_READS_2.fastq -p 16 -x final -S final.sam
-1:上有序列
-2:下游序列
-p:處理器
-x:索引文件前綴
-S:比對(duì)結(jié)果sam文件
time:計(jì)時(shí)
三膜楷、格式轉(zhuǎn)換:SAM > BAM
使用samtools將sam文件轉(zhuǎn)換成bam文件旭咽。
time samtools view -@ 16 -b -S final.sam -o final.bam
-@:線程
-b:輸出格式為BAM
-S:自動(dòng)檢測(cè)輸入格式
-o:輸出文件
time:計(jì)時(shí)
四、BAM排序
使用samtools排序bam文件獲得sorted.bam文件赌厅。
time samtools sort -@ 16 -l 9 -O BAM final.bam -o final.sorted.bam
-@:線程
-l:壓縮等級(jí)0-9穷绵,0是不壓縮,9最高
-O:輸出格式可選SAM, BAM, CRAM
-o:輸出文件
time:計(jì)時(shí)
五特愿、計(jì)算contig深度
以上一步得到的sorted.bam文件為輸入请垛,用Metabat2中自帶的jgi_summarize_bam_contig_depths程序計(jì)算contig深度催训。
time jgi_summarize_bam_contig_depths --outputDepth final.depth.txt final.sorted.bam
--outputDepth:輸出文件
[final.sorted.bam]:輸入文件
六、分箱
time metabat2 -m 1500 -t 16 -i final.contigs.fa -a final.depth.txt -o all -v
-m:最小contig長(zhǎng)度
-t:線程
-i:contig文件
-a:contig深度
-o:輸出文件路徑和前綴
-v:?jiǎn)履J?br> time:計(jì)時(shí)
七宗收、分箱結(jié)果
分箱其實(shí)就是利用核苷酸頻率和豐度模式將序列組裝得到的contig打包分類的過(guò)程漫拭,所以分箱結(jié)果就是一堆contig的fasta文件如下:
-rw-rw-r-- 1 cheng WST 3489348 9月 26 17:05 all.10.fa
-rw-rw-r-- 1 cheng WST 429510 9月 26 17:05 all.11.fa
-rw-rw-r-- 1 cheng WST 268311 9月 26 17:05 all.12.fa
-rw-rw-r-- 1 cheng WST 1588561 9月 26 17:05 all.13.fa
-rw-rw-r-- 1 cheng WST 388664 9月 26 17:05 all.14.fa
-rw-rw-r-- 1 cheng WST 1499768 9月 26 17:05 all.15.fa
-rw-rw-r-- 1 cheng WST 546539 9月 26 17:05 all.16.fa
-rw-rw-r-- 1 cheng WST 634631 9月 26 17:05 all.17.fa
-rw-rw-r-- 1 cheng WST 1051141 9月 26 17:05 all.18.fa
-rw-rw-r-- 1 cheng WST 2150085 9月 26 17:05 all.1.fa
-rw-rw-r-- 1 cheng WST 237183 9月 26 17:05 all.2.fa
-rw-rw-r-- 1 cheng WST 2181418 9月 26 17:05 all.3.fa
-rw-rw-r-- 1 cheng WST 982074 9月 26 17:05 all.4.fa
-rw-rw-r-- 1 cheng WST 1716234 9月 26 17:05 all.5.fa
-rw-rw-r-- 1 cheng WST 1649397 9月 26 17:05 all.6.fa
-rw-rw-r-- 1 cheng WST 1759432 9月 26 17:05 all.7.fa
-rw-rw-r-- 1 cheng WST 1386934 9月 26 17:05 all.8.fa
-rw-rw-r-- 1 cheng WST 487116 9月 26 17:05 all.9.fa
打開(kāi)一個(gè)看看:
less -S all.1.fa
# 如下:
>k93_1756
AAATTCTCTCTTAAAGTTTAACTTTACATTAATTGTTTCTTTACTCTAACAAAGTGCAAA
TATATTAATAAAACTGAAACGAACAACTATTTTATTGAAAAAACCTTGTAAATCTATCAA
TTTGTTAATTAAACATGCCACTTTATGCTTAATAACAGATTTTTCACACTTAAAAAACCT
>k93_2772
GAGCGTGGTAACGAGATGAGCCAGGTTCTTGAGGAATTCTCAGAGCTTATTGACCCAAAG
相關(guān)閱讀:
宏基因組分箱(一)Megahit組裝和QUAST質(zhì)量評(píng)價(jià)