bam文件的可視化（測序深度）

bam文件的可視化（測序深度） | IGV

寫在前面

沒有系統(tǒng)地學(xué)過生信井厌，當(dāng)時靠著導(dǎo)師的“威逼”，在學(xué)長的指導(dǎo)下學(xué)了perl致讥，然后開始了邊學(xué)邊用的生信路程仅仆。

回頭去看，才意識到基礎(chǔ)有多不扎實拄踪。所以現(xiàn)在但凡遇到+解決一點(diǎn)小問題蝇恶，都盡量歸納整理出來。

之前用IGV去看比對情況惶桐，直接導(dǎo)入bam文件(一個外顯子的比對文件6G左右）撮弧，結(jié)果筆記本就卡頓了，特別不順姚糊。當(dāng)時因為不著急贿衍，也就沒想過要去了解變通方案。

可以將bam轉(zhuǎn)為tdf文件救恨。tdf文件很小贸辈，再也不用擔(dān)心IGV卡頓了。但是tdf文件只能反映基因組每個區(qū)域的測序深度肠槽，無法看到具體的比對情況擎淤，適合用來check找到的peak或者CNV奢啥。

實戰(zhàn)

#安裝igvtools
conda install igvtools

#remove duplicated reads
samtools rmdup -s sample.bam sample.rmdup.bam 
samtools index sample.rmdup.bam

#自定義genome的chrom.sizes文件 （根據(jù)bam的header獲得），這里需要根據(jù)具體的header來去除相應(yīng)的行嘴拢，僅保留染色體名稱和長度信息
samtools view -H sample.rmdup.bam | awk -F '[\t:]' '{print $3"\t"$5}' | grep -v "coordinate" | grep -v "bwa" | grep -v "SAM" >mm10.chrom.sizes

cp mm10.chrom.sizes /root/miniconda2/share/igvtools-2.3.93-0/genomes/

#從bam生成tdf
igvtools count -z 5 -w 10 -e 0 sample.rmdup.bam sample.tdf mm10 
#-w The window size over which coverage is averaged. Defaults to 25 bp.
#The count command computes average feature density over a specified window size across the genome.
#The input file must be sorted by start position. See the sort command below.
#會調(diào)用 /root/miniconda2/share/igvtools-2.3.93-0/genomes/mm10.chrom.sizes 文件桩盲，需要chrom名字對應(yīng)

導(dǎo)入樣本的tdf文件：File >>> Load from file
導(dǎo)入基因組：Genomes >>> Load genome from file
導(dǎo)入注釋文件：File >>> Load from file。從UCSC上可以很方便的下載到.bed格式的注釋文件席吴。
選擇相應(yīng)的基因組（這里是mm10）,就可以查看了赌结。

Note : 如果發(fā)現(xiàn)一片空白，好像啥都沒有孝冒，不要心慌柬姚。可能只是顯示了全基因組庄涡，信息太多沒顯示出來量承，選擇其中一條染色體，也就是縮小顯示范圍啼染，就能看到希望的柱子了宴合。O(∩_∩)O哈哈~

最后編輯于：2019.01.22 16:59:07

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者