【HiC】繪制TAD邊界強(qiáng)度

背景

經(jīng)常在HiC文章中看到TAD邊界強(qiáng)度變化圖酷愧,大體上可以反映TAD之間隔絕情況,絕緣系數(shù)越低艰管,TAD之間交互越弱。
如下圖:


image.png

畫(huà)圖的方法:

  • 有點(diǎn)類(lèi)似ChIP-seq peak profiler圖,可以借助deeptools來(lái)繪制。

    image.png

    image.png

  • 同時(shí)我們也可以用bedtools進(jìn)行統(tǒng)計(jì)说莫,用R畫(huà)圖术羔。


實(shí)踐:

TAD邊界位點(diǎn)

image.png

1.deeptools 繪圖

deeptools默認(rèn)binsize為10bp,得到的矩陣會(huì)非常很大(數(shù)據(jù)為G級(jí)別)赢赊,binsize需要根據(jù)自己需要進(jìn)行修改,一定不要默認(rèn)參數(shù)跑哦级历。

## Step1: boundary 邊界位點(diǎn)
$ cat *boundaries.bed | cut -f 4,5 | grep -v "track" | cut -d "|" -f 3 | tr ":-" "\t" | sort -Vk 1 -k2,2n > sample_boundary.bed

## Step2: insulation score 轉(zhuǎn)換成bigwig格式
$ cat *bedGraph| grep -v "track"  | sort -Vk 1 -k2,2n | grep -v "chrY" | grep -v "NA" > sample_insulationscore.bedgraph

$ bedGraphToBigWig sample_insulationscore.bedgraph hg19.ChrSize.bed sample_insulationscore.bw

## Step3:deeptools畫(huà)圖
computeMatrix reference-point  --referencePoint center --binSize 10000 \
-b 500000 -a 500000 \
-R sample_boundary.bed -S sample_insulationscore.bw \
--skipZeros -o sample_matrix_boundary_500Kb_bin10Kb.gz

plotProfile -m sample_matrix_boundary_500Kb_bin10Kb.gz \
              -out sample_matrix_boundary_500Kb_bin10Kb.pdf \
              --plotTitle "boundary strength"

畫(huà)圖效果如圖:


image.png

2.bedtools+R 繪圖

:用bedtools overlap 函數(shù)释移,取bed與bedgraph交集,最終輸出結(jié)果不是按順序輸出寥殖。如下圖所示玩讳。

image.png

  • bedtools
## bedgraph區(qū)域保留NA位置
$ cat *bedGraph| grep -v "track"  | sort -Vk 1 -k2,2n | grep -v "chrY" >  bedtools_sample_insulationscore.bedgraph

## bed文件拓展
$ 

$ cat sample_boundary.bed | awk 'BEGIN{FS=OFS="\t"}{$2=$2-480000;$3=$3+480000}{print $0}' > bedtools_sample_boundary.bed 

## 統(tǒng)計(jì)matrix
$ cat bedtools_sample_boundary.bed | while read id; do 
echo $id| tr " " "\t" > bedtools_tmp;
intersectBed -a bedtools_tmp -b bedtools_sample_insulationscore.bedgraph -wa -wb|sort -k 6,6n | cut -f 8 | xargs| tr " " "\t" >> bedtools_matrix
done
  • R 畫(huà)圖
## R 畫(huà)圖
x <- readline()
setwd(x)

library(ggplot2)
library(patchwork)

boundary_matrix <- read.table("bedtools_matrix2")
dim(boundary_matrix)
vector_test <- apply(boundary_matrix,2 ,function(x){median(x,na.rm = T)})
# plot(1:25,vector_test,type = "l")

dat=as.data.frame(vector_test)
dat$num=c(1:25)
p1<-ggplot(data = dat,aes(x=num,y=vector_test))+
  #geom_line()+
  geom_smooth(se = F)+
  scale_x_continuous(breaks =c(1,12.5,25),
                     labels = c("-500Kb","0","500Kb"))+
  theme_classic()+
  xlab("TAD boundary")+ylab("Mean insulation score")
p1
p2 <- ggplot(data = dat,aes(x=num,y=vector_test))+geom_line()+
  scale_x_continuous(breaks =c(1,12.5,25),
                     labels = c("-500Kb","0","500Kb"))
p1+p2
Left Fig: 顯示折線圖擬合之后的線圖;Right Fig:顯示原始折線圖

思考:

  • 畫(huà)此圖需要搞清楚嚼贡,TAD boundary邊界如何取點(diǎn)
  • 選取合適的工具及其參數(shù)熏纯,統(tǒng)計(jì)boundary附近的InsulationScore分布
  • 可以進(jìn)一步提高計(jì)算InsulationScore的精確度,采用10Kb為binsize進(jìn)行統(tǒng)計(jì)粤策,得到的結(jié)果不需要進(jìn)行擬合直接畫(huà)圖
image.png

歡迎評(píng)論留言豆巨,交流學(xué)習(xí)??~

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市掐场,隨后出現(xiàn)的幾起案子往扔,更是在濱河造成了極大的恐慌,老刑警劉巖熊户,帶你破解...
    沈念sama閱讀 219,188評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件萍膛,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡嚷堡,警方通過(guò)查閱死者的電腦和手機(jī)蝗罗,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,464評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén)艇棕,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人串塑,你說(shuō)我怎么就攤上這事沼琉。” “怎么了桩匪?”我有些...
    開(kāi)封第一講書(shū)人閱讀 165,562評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵打瘪,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我傻昙,道長(zhǎng)闺骚,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,893評(píng)論 1 295
  • 正文 為了忘掉前任妆档,我火速辦了婚禮僻爽,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘贾惦。我一直安慰自己胸梆,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,917評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布须板。 她就那樣靜靜地躺著碰镜,像睡著了一般。 火紅的嫁衣襯著肌膚如雪逼纸。 梳的紋絲不亂的頭發(fā)上洋措,一...
    開(kāi)封第一講書(shū)人閱讀 51,708評(píng)論 1 305
  • 那天济蝉,我揣著相機(jī)與錄音杰刽,去河邊找鬼。 笑死王滤,一個(gè)胖子當(dāng)著我的面吹牛贺嫂,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播雁乡,決...
    沈念sama閱讀 40,430評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼第喳,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了踱稍?” 一聲冷哼從身側(cè)響起曲饱,我...
    開(kāi)封第一講書(shū)人閱讀 39,342評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎珠月,沒(méi)想到半個(gè)月后扩淀,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,801評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡啤挎,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,976評(píng)論 3 337
  • 正文 我和宋清朗相戀三年驻谆,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,115評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡胜臊,死狀恐怖勺卢,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情象对,我是刑警寧澤黑忱,帶...
    沈念sama閱讀 35,804評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站织盼,受9級(jí)特大地震影響杨何,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜沥邻,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,458評(píng)論 3 331
  • 文/蒙蒙 一危虱、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧唐全,春花似錦埃跷、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,008評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至延届,卻和暖如春剪勿,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背方庭。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,135評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工厕吉, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人械念。 一個(gè)月前我還...
    沈念sama閱讀 48,365評(píng)論 3 373
  • 正文 我出身青樓头朱,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親龄减。 傳聞我的和親對(duì)象是個(gè)殘疾皇子项钮,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,055評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容