HI-C 數(shù)據(jù)分析pipeline(三:AB compartment 區(qū)室計算)

使用HicPro處理fastq data达舒,并進行了數(shù)據(jù)格式轉(zhuǎn)換以后哭懈,就可以進行一些常規(guī)的HiC下游計算了,最常規(guī)的包括AB compartment挫鸽,TAD相關(guān)計算缚柳,loop相關(guān)計算埃脏。本文整理了我自己使用的AB區(qū)室計算的相關(guān)方法和代碼。

一秋忙、HiC ValidPair修飾

hicpro 軟件輸出的validPair文件彩掐,經(jīng)過簡單修飾后,再使用homer進行compartment計算PC1值灰追,PC1>0的區(qū)域為A區(qū)室堵幽,PC1<0為B區(qū)室。

homer軟件只需要validPair的前7列:

cat CT.allValidPairs |awk 'BEGIN{FS=OFS="\t"}{print $1,$2,$3,$4,$5,$6,$7}' > CT.allValidPairs.homer

二监嗜、call PC1 value —— homer

## step 1 : makeTagDir
tagdir=~/data/hic/homer/tagDir
makeTagDirectory ${tagdir}/CT -format HiCsummary CT.allValidPairs.homer
## step 2 : calculate PC1 value
## 如果有ATAC 測序數(shù)據(jù)谐檀,則ATAC narrowPeak文件可以作為 seed 輸入抡谐,輔助計算PC1
mm10=~/data/database/Mus_musculus.GRCm38.dna.toplevel.fa
seed=~/data/hic/homer/seed_active/
output=~/data/hic/homer/compartment/
runHiCpca.pl ${output}-500k ${tagdir}/CT -cpu 20 -res 500000  -genome $mm10 -pc 1 -active ${seed}/CT.narrowPeak
## output data,兩個output
head -n 5 CT-500k.PC1.bedGraph
track name="..."  yLineMark="0.0" alwaysZero=on maxHeightPixels=100:75:11 visibility=full viewLimits=-1:1 autoScale=on type=bedGraph
chr11   3080000 3120000 -0.220452952221998
chr11   3120000 3160000 -0.200718202287763
chr11   3160000 3200000 0.0416765017206624
chr11   3200000 3240000 0.343580286630125
[medhdl@login2 compartment]$ head -n 5 CT-500k.PC1.txt
#peakID chr     start   end     strand  PC1
chr11-3080000   chr11   3080000 3120000 +       -0.510452952221998
chr11-3120000   chr11   3120000 3160000 +       -0.314718202287763
chr11-3160000   chr11   3160000 3200000 +       0.0806765017206624
chr11-3200000   chr11   3200000 3240000 +       0.894380286630125

以上運行所得的矩陣可以導入R中進行相關(guān)下游分析裁奇,非常方便。

三麦撵、使用PC1 value 進行后續(xù)分析

變成文本了以后刽肠,用R進行統(tǒng)計就可以。

1免胃、標記 AB compartment

通過PC1的正負符號標記 AB compartment音五。

#為了方便理解,這里盡量了使用最簡單的Rcode
pc1.ct <- read.table("CT-500k.PC1.txt") #讀入計算所得的PC1矩陣
colnames(pc1.ct) <- c("peakID","chr","start","end","strand","PC1")
pc1.A <- read.table("A-500k.PC1.txt") #讀入計算所得的PC1矩陣
colnames(pc1.A) <- c("peakID","chr","start","end","strand","PC1")
pc1.dat <- merge(pc1.ct,pc1.A,by=c("peakID","chr","start","end","strand"))
colnames(pc1.dat)[6:7] <- c("CT","A") #合并矩陣
pc1.dat$ABtrans <- ifelse(pc1.dat$CT < 0 & pc1.dat$A < 0,"BB",
                              ifelse(pc1.dat$CT > 0 & pc1.dat$A > 0,"AA",
                                     ifelse(pc1.dat$CT < 0 & pc1.dat$A > 0,"BA","AB"))) #標記區(qū)室信息

2羔沙、計算區(qū)室轉(zhuǎn)換的比例

統(tǒng)計AB區(qū)室轉(zhuǎn)換的數(shù)量和比例躺涝。


pc1.trans <- pc1.dat %>% group_by(ABtrans) %>%
  summarise(n=n()) %>% as.data.frame() #計算四類區(qū)室轉(zhuǎn)換的染色質(zhì)區(qū)域個數(shù)
pc1.trans$percentage <- round(x=(pc1.trans$n)/sum(pc1.trans$n),digits = 2) #計算四類區(qū)室轉(zhuǎn)換的占比
pc1.trans$label <- paste0(pc1.trans$ABtrans,"(",pc1.trans$percentage,"%)") #設(shè)置畫圖標記

3、畫圖

使用ggplot2包簡單畫個餅圖扼雏,存成svg格式坚嗜,再在PPT中修改格式細節(jié)。


p <- pc1.transW7vsM25.pctrans %>% 
  ggplot(aes(x="",y=percentage,fill=ABtrans))+
  geom_bar(stat="identity")+
  coord_polar(theta = "y")+
  labs(title = "ABtrans_portion")+
  scale_fill_manual(values = brewer.pal(9,"Blues")[c(2,4,5,3)],labels=pc1.trans$label)+
  theme_bw(base_line_size = NA)+
  theme(axis.text = element_text(size = 12,color="black"),legend.position = "top")
svg(file="ABtrans.svg",height=8,width=8) #保存svg格式诗充,方便在window上進行修改
p
dev.off()

svg格式的圖片靈活性還是蠻高的苍蔬,可以根據(jù)需求隨便改【只要不改數(shù)據(jù)】,一個簡單的效果圖:


圖1.png

也可以畫成類似文獻中的bar圖蝴蜓,這個就看大家的喜好啦碟绑,比如:

圖2.png

圖片來源發(fā)表文獻

區(qū)室分析內(nèi)容差不多就這些俺猿,一些其他的聯(lián)合分析,還需要視具體情況而定格仲。例如可以在IGV或WashU上進行Track觀察押袍,聯(lián)合ATAC-seq和RNA-seq數(shù)據(jù)觀察區(qū)室轉(zhuǎn)換與基因表達調(diào)控的聯(lián)系等。

下篇繼續(xù)總結(jié)TAD相關(guān)的分析凯肋。

公眾號原文: HI-C 數(shù)據(jù)分析pipeline(三:AB compartment 區(qū)室計算)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末伯病,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子否过,更是在濱河造成了極大的恐慌午笛,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,723評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件苗桂,死亡現(xiàn)場離奇詭異药磺,居然都是意外死亡,警方通過查閱死者的電腦和手機煤伟,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,485評論 2 382
  • 文/潘曉璐 我一進店門癌佩,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人便锨,你說我怎么就攤上這事围辙。” “怎么了放案?”我有些...
    開封第一講書人閱讀 152,998評論 0 344
  • 文/不壞的土叔 我叫張陵姚建,是天一觀的道長。 經(jīng)常有香客問我吱殉,道長掸冤,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,323評論 1 279
  • 正文 為了忘掉前任友雳,我火速辦了婚禮稿湿,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘押赊。我一直安慰自己饺藤,他們只是感情好,可當我...
    茶點故事閱讀 64,355評論 5 374
  • 文/花漫 我一把揭開白布流礁。 她就那樣靜靜地躺著涕俗,像睡著了一般。 火紅的嫁衣襯著肌膚如雪崇棠。 梳的紋絲不亂的頭發(fā)上咽袜,一...
    開封第一講書人閱讀 49,079評論 1 285
  • 那天,我揣著相機與錄音枕稀,去河邊找鬼询刹。 笑死谜嫉,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的凹联。 我是一名探鬼主播沐兰,決...
    沈念sama閱讀 38,389評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼蔽挠!你這毒婦竟也來了住闯?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,019評論 0 259
  • 序言:老撾萬榮一對情侶失蹤澳淑,失蹤者是張志新(化名)和其女友劉穎比原,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體杠巡,經(jīng)...
    沈念sama閱讀 43,519評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡量窘,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,971評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了氢拥。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片蚌铜。...
    茶點故事閱讀 38,100評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖嫩海,靈堂內(nèi)的尸體忽然破棺而出冬殃,到底是詐尸還是另有隱情,我是刑警寧澤叁怪,帶...
    沈念sama閱讀 33,738評論 4 324
  • 正文 年R本政府宣布审葬,位于F島的核電站,受9級特大地震影響骂束,放射性物質(zhì)發(fā)生泄漏耳璧。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,293評論 3 307
  • 文/蒙蒙 一展箱、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧蹬昌,春花似錦混驰、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,289評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至明刷,卻和暖如春婴栽,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背辈末。 一陣腳步聲響...
    開封第一講書人閱讀 31,517評論 1 262
  • 我被黑心中介騙來泰國打工愚争, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留映皆,地道東北人。 一個月前我還...
    沈念sama閱讀 45,547評論 2 354
  • 正文 我出身青樓轰枝,卻偏偏與公主長得像捅彻,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子鞍陨,可洞房花燭夜當晚...
    茶點故事閱讀 42,834評論 2 345

推薦閱讀更多精彩內(nèi)容