????說到deeptools,大家很容易想到ChIP拇泛。deeptools集美貌與才華?是表觀分析的深海利器滨巴。關(guān)于deeptools的應(yīng)用,其中最為經(jīng)典的就是plotHeatmap和plotProfiles(如下圖)俺叭。幾乎每個經(jīng)典的表觀文章都能找到他們的身影恭取。
經(jīng)典的用法主要是研究某種組蛋白或者轉(zhuǎn)錄因子是不是在TSS區(qū)域富集(如下圖)。
但殊不知deeptools不僅僅是查看組蛋白或者轉(zhuǎn)錄因子在基因區(qū)域的修飾熄守,還能為三維基因組理論奠定基礎(chǔ)添磚加瓦蜈垮,例如EP_loop(enhancer_promoter構(gòu)成的loop)的CTCF以及蛋白修飾情況(如下圖):
例如耗跛,TAD邊界以及ABcompartment兩端的組蛋白修飾情況(如下圖):
說到這里,小編的手機(jī)響了攒发,收到 一條信息~~
Hi~~fan调塌,原來deeptools還可以用作HiC多組學(xué)分析呀,那我想拿TAD邊界的組蛋白修飾和AB compartment組蛋白修飾練練手惠猿,我具體該怎么做呢羔砾?
哈哈,別急紊扬,容我一一道來~~
首先看圖~~?
TAD邊界這幅圖呢蜒茄,主要是以一個點(diǎn)為中心,而ABcompart這幅圖則是有兩個中心點(diǎn)border1餐屎,border2(箭頭所指)
這就涉及deeptools的computeMatrix兩種模式(如下圖):
deeptools? computeMatrix模塊可以計算每個基因區(qū)域的結(jié)合得分檀葛,生成中間文件用以給plotHeatmap和plotProfiles作圖。
reference-point mode則是給定一個bed file腹缩,以某個點(diǎn)為中心開始統(tǒng)計信號(如TSS/TES/center)屿聋。
來舉個'??':
首先,整理一下TAD邊界的bed文件boundaries.bed??
其次藏鹊,第二步通過以下命令將bam轉(zhuǎn)換成bigwig:
????bamCoverage --bam? CTCF.bam -o?CTCF.bw
? ? --binSize 10
? ? --numberOfProcessors 4?
? ?--normalizeUsingRPKM
? ? --extendReads
之后润讥,第三步利用reference-point 計算以這個點(diǎn)為中心上下游500k范圍內(nèi)以10k為窗口計算每個窗口CHIP的信號強(qiáng)度:
computeMatrix reference-point? --referencePoint center?
? ?????-b 500000 -a 500000?
? ? ? ?-R boundaries.bed
? ? ? ? -S CTCF.bw H3K27ac.bw H3K27me3.bw H3K4me3.bw --skipZeros
? ? ? ? -o? boundaries_modification.gz?
? ? ? ?--binSize 10000
然后,第四步畫線圖:
plotProfile -m boundaries_modification.gz?
????-out boundaries_modification.pdf?
? ? ? --plotType se?
??????--plotFileFormat 'pdf'?
????--refPointLabel Boundary --numPlotsPerRow 4?
?????--perGroup?
????--plotHeight 8 --plotWidth 8 -
? ? --legendLocation lower-center?
????--yMin 0 --plotTitle ""
?????--yAxisLabel "Normalized signal"
經(jīng)過以上四步就可以收工了盘寡,快來看結(jié)果楚殿,怎么都感覺有點(diǎn)小清新呢~
scale-regions mode簡單來說會將給定bed file范圍內(nèi)的結(jié)合信號做一個統(tǒng)計(指的是一段長度),并將基因長度統(tǒng)一scale到設(shè)定regionBdoyLength的長度,加上統(tǒng)計基因上游和下游(通過beforeRegionStartLength參數(shù)和afterRegionStartLength參數(shù)設(shè)定)n bp的信號。
同樣的針對ABcompartment先要識別連續(xù)的ABcomaprtment位點(diǎn)形成chr猴誊,start,end三列bed文件(A_com.bed ,B_com.bed)变隔。
之后scale-regions? 計算當(dāng)前以及延伸區(qū)域的信號值~
computeMatrix scale-regions?
????--regionsFileName A_com.bed? B_com.bed
?????--scoreFileName? H3K27ac.bw? ?H3K27me3.bw? H3K36me3.bw? ?H3K4me3.bw? ????????????H3K9me3.bw??
?????--skipZeros?
????--regionBodyLength 6000000?
????--beforeRegionStartLength 2000000?
????--afterRegionStartLength 2000000?
????--startLabel border --endLabel border?
????-outFileName? AB_modification.gz??
?????--binSize 100000?
統(tǒng)計完信號之后,就可以畫圖了:
plotProfile? -m? ?AB_modification.gz??
????-out? AB_mod_lineProfile.pdf?
????--plotType? se?
????--startLabel border?
????--endLabel border?
????--plotFileFormat? pdf?
? ?--plotHeight 8 --plotWidth 12
? ? --yAxisLabel "Reads Density"
? ? ?--perGroup
咚咚咚~~蟹倾,通過這樣簡單的步驟匣缘,圖就畫好了,驚不驚喜鲜棠?意不意外肌厨?
艾瑪,就扯到這兒吧~~岔留,朕累了~~