Fig 1
對(duì)于各種表觀組學(xué)你辣,如ChIP-seq、ATAC-seq拦盹、CUT&TAG鹃祖、MNase-seq,deeptools是下游分析中非常常用的軟件之一普舆。該軟件發(fā)表于2014年(Fig 1)恬口,目前已經(jīng)引用超1000次。
Fig 2
Fig 3
今天的推送主要介紹deeptools軟件的兩個(gè)主要使用場(chǎng)景沼侣,數(shù)據(jù)質(zhì)控-相關(guān)性分析(Fig 2)和聚類分析(Fig 3)祖能。
01 輸入文件的準(zhǔn)備
Fig 4
對(duì)于比對(duì)的sam文件,我們轉(zhuǎn)為bam文件并完成基本過濾和排序华临,然后轉(zhuǎn)成bw文件芯杀。
Deeptools內(nèi)置了bamCoverage功能,可以完成bam2bw的操作(Fig 4)雅潭。
--binSize Size of the bins, in bases, for the output of the bigwig/bedgraph file. (Default: 50)
--normalizeUsing {RPKM,CPM,BPM,RPGC,None}
02??樣本相關(guān)性分析
Fig 5
Fig 6
multiBigwigSummary選項(xiàng)可以對(duì)多個(gè)bw文件進(jìn)行整合(Fig 5)揭厚,然后結(jié)合plotCorrelation和plotPCA可以實(shí)現(xiàn)樣本相關(guān)性分析(Fig 6-10)。
Fig 7
Fig 8
Fig 9
03 聚類分析
Fig 10
Fig 11
computeMatrix可以展示指定位置附近的seq信號(hào)強(qiáng)度扶供,它有“scale-regions”和“reference-point”兩種模式筛圆,前者將指定的區(qū)間縮放到指定大小,后者將指定的區(qū)間縮放成一個(gè)點(diǎn)椿浓,實(shí)例中使用scale-regions模式太援,輸入了所有基因的位置信息,將每個(gè)基因縮放成2k扳碍,展示上下游2k的信息(Fig 10)提岔。Bed文件為bed6格式,記得加入正負(fù)鏈信息(Fig 11)
Fig 12
利用plotHeatmap繪圖(Fig 12-15)
Fig 13 test1
Fig 14 test2
Fig 15 test3