上文提到用bowtie2獲得了三個sam文件相嵌,但通常會將其轉(zhuǎn)化為bam文件進行查閱毒姨。
使用conda下載samtools工具叶雹,過程參考《生信小白——初學(xué)bowtie2》。
sam to bam
進入之前獲得的read目錄下落竹,其中有待轉(zhuǎn)化的sam文件。輸入$ samtools view -bS a_20_Tsa.sam(輸入sam文件) > a_20_Tsa.bam(輸出bam文件) 货抄。
分別獲得對應(yīng)的bam文件
以此類推獲得相應(yīng)的bam文件述召,從文件大小可以看出轉(zhuǎn)換后的bam文件比sam文件要小很多。
bam文件不同于sam文件可以用文本編輯打開蟹地,因為它是一個二進制文檔积暖,不可讀。因此在bam文件所在目錄下輸入samtools view a_0_Tsa.bam(文件名) |less -SN查看怪与。
查看bam文件
bam文件顯示的結(jié)果
sort指令
剛才的比對結(jié)果是以reads的輸入順序進行排序的夺刑,但后續(xù)分析通常是用比對到基因組的位置進行排序,這里就需要用到sort。輸入samtools sort a_0_Tsa.bam(輸入文件名) -o a_0_Tsa.sorted.bam(輸出文件名)
得到sort后的bam文件
再次查看結(jié)果遍愿,就和之前的結(jié)果不一樣了存淫。
sort后bam文件顯示的結(jié)果
bam文件的具體介紹可以看(http://www.reibang.com/p/364e640d3c9f),非常詳細沼填。
參考及感謝
黃樹嘉????從零開始完整學(xué)習(xí)全基因組測序數(shù)據(jù)分析:第5節(jié) 理解并操作BAM文件:http://www.reibang.com/p/364e640d3c9f