表觀調(diào)控-果蠅探索PRC復合物之文章復現(xiàn)(一)

果蠅探索PRC復合物之文章復現(xiàn)(一)

老大曾在公眾號上發(fā)過一篇推文:在果蠅探索PRC復合物(逆向收費讀文獻2019-18),里面提到了表觀領域的一篇文章:Global changes of H3K27me3 domains and Polycomb group protein distribution in the absence of recruiters Spps or Pho荸镊。這篇文章?lián)f是RNA-seq和ChIP-seq數(shù)據(jù)分析結(jié)合的典范料皇。關于PRC復合物,文章中的結(jié)論是-PcG recruiters, the PRC2 component E(z), and the PRC1 components Psc and Ph cobind thousands of active genes outside of H3K27me3 domains.關于如何獲取數(shù)據(jù)也就是拿到peaks文件和表達矩陣蝇裤,可以去嗶哩嗶哩網(wǎng)站搜索生信技能樹Chip—seq測序數(shù)據(jù)分析視頻。其實呢老大已經(jīng)錄制好了關于這篇文章中圖表復現(xiàn)的視頻葬荷,我這里跟著視頻喂窟,復現(xiàn)文章中的圖圖。

  • 第一個復現(xiàn)的圖-Figure S12 Decreased expression of Pho and Spps in the corresponding mutants
image-20191124184625541

上圖來自做完RNA-seq后的counts值椒舵,如果還不會linux的小伙伴又想直接練習R中的代碼蚂踊,可以問我要counts矩陣。

先要讀取表達矩陣笔宿,表達矩陣來自RNA-seq的feature counts的結(jié)果犁钟。也就是文件all.counts.id.txt

讀進來的表達矩陣如下圖

image-20191125211211864
  • 第一列:基因名
  • 第二列:染色體
  • 第三列:基因起始坐標
  • 第四列:基因終止坐標
  • 第五列:略

為什么有些基因有這么多的其實坐標和終止坐標呢泼橘?是因為有些基因有多個外顯子涝动。

在復現(xiàn)上面的第一張圖片前,老大出題兒讓我對這個表達矩陣做進一步了解炬灭。

題目一

挑選出基因名前兩位為AB或者ab的基因名醋粟,并挑選出長度最長的基因

ab <- a[grep('^AB',a$Geneid,ignore.case = T),]
ab
lapply(1:nrow(ab),function(i){
  sum(as.numeric(strsplit(ab[i,4],';')[[1]])-as.numeric(strsplit(ab[i,3],';')[[1]]))
})
image-20191125215709061
which.max(lapply(1:nrow(ab),function(i){
  sum(as.numeric(strsplit(ab[i,4],';')[[1]])-as.numeric(strsplit(ab[i,3],';')[[1]]))
}))
image-20191125215755174
ab[which.max(lapply(1:nrow(ab),function(i){
  sum(as.numeric(strsplit(ab[i,4],';')[[1]])-as.numeric(strsplit(ab[i,3],';')[[1]]))
})),1]
image-20191125215832326

或者可以

ab <- a[grep('^AB',a$Geneid,ignore.case = T),]
tmp2 <- apply(ab,1, function(i){
  sum(as.numeric(strsplit(i[4],';')[[1]])-as.numeric(strsplit(i[3],';')[[1]]))
})
tmp2
names(tmp) <- ab$Geneid#這一步是給向量tmp加上基因名,用names函數(shù)重归,給向量加基因名用names函數(shù)
tmp
加了基因名的tmp2
names(which.max(tmp))
image-20191125215947436

題目二:chr這一列有多少種元素

a
tmp3 <- as.data.frame(a$Chr)
unique(apply(tmp3,1, function(i){
  unique(sort(str_split(i,';',simplify = T)[1,]))
}))

上面的代碼有點長米愿,需要分解一下

apply(tmp3,1, function(i){
  unique(sort(str_split(i,';',simplify = T)[1,]))
})
image-20191125220703638

得到的結(jié)果有17714行,實際上這個a矩陣就是有這么多鼻吮。那么我們在用uniq去重復就好了

image-20191125220404800

現(xiàn)在對第一張圖復現(xiàn)育苟,圖是敲了Pho后看看敲除后的效果,rna-seq的表達量是否降低椎木。

rm(list = ls())
options(stringsAsFactors = F)
a=read.table('all.counts.id.txt',header = T)
dim(a)


cg1=a[a[,1]=='pho',7:16]
library(ggpubr)
library(stringr)
dat=data.frame(gene=as.numeric(cg),
               sample=names(cg),
               group=str_split(names(cg),'_',simplify = T)[,1]
               )
ggbarplot(dat,x='sample',y='gene',color = 'group')
image-20191125221726602

可以看到雖然上面的圖和文章的圖圖還有些差別违柏,關于作圖可以再另一個作圖的板塊細細的寫一下笨腥!上圖可以看出Pho敲除組的表達量是明顯低于其他組的,就OK了勇垛。

上面的代碼均來自生信技能樹哦

最后友情宣傳生信技能樹

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市闲孤,隨后出現(xiàn)的幾起案子谆级,更是在濱河造成了極大的恐慌,老刑警劉巖讼积,帶你破解...
    沈念sama閱讀 211,817評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件肥照,死亡現(xiàn)場離奇詭異,居然都是意外死亡勤众,警方通過查閱死者的電腦和手機舆绎,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,329評論 3 385
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來们颜,“玉大人吕朵,你說我怎么就攤上這事】唬” “怎么了努溃?”我有些...
    開封第一講書人閱讀 157,354評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長阻问。 經(jīng)常有香客問我梧税,道長,這世上最難降的妖魔是什么称近? 我笑而不...
    開封第一講書人閱讀 56,498評論 1 284
  • 正文 為了忘掉前任第队,我火速辦了婚禮,結(jié)果婚禮上刨秆,老公的妹妹穿的比我還像新娘凳谦。我一直安慰自己,他們只是感情好坛善,可當我...
    茶點故事閱讀 65,600評論 6 386
  • 文/花漫 我一把揭開白布晾蜘。 她就那樣靜靜地躺著,像睡著了一般眠屎。 火紅的嫁衣襯著肌膚如雪剔交。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,829評論 1 290
  • 那天改衩,我揣著相機與錄音岖常,去河邊找鬼。 笑死葫督,一個胖子當著我的面吹牛竭鞍,可吹牛的內(nèi)容都是我干的板惑。 我是一名探鬼主播,決...
    沈念sama閱讀 38,979評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼偎快,長吁一口氣:“原來是場噩夢啊……” “哼冯乘!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起晒夹,我...
    開封第一講書人閱讀 37,722評論 0 266
  • 序言:老撾萬榮一對情侶失蹤裆馒,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后丐怯,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體喷好,經(jīng)...
    沈念sama閱讀 44,189評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,519評論 2 327
  • 正文 我和宋清朗相戀三年读跷,在試婚紗的時候發(fā)現(xiàn)自己被綠了梗搅。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,654評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡效览,死狀恐怖无切,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情钦铺,我是刑警寧澤订雾,帶...
    沈念sama閱讀 34,329評論 4 330
  • 正文 年R本政府宣布,位于F島的核電站矛洞,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏烫映。R本人自食惡果不足惜沼本,卻給世界環(huán)境...
    茶點故事閱讀 39,940評論 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望锭沟。 院中可真熱鬧抽兆,春花似錦、人聲如沸族淮。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,762評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽祝辣。三九已至贴妻,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間蝙斜,已是汗流浹背名惩。 一陣腳步聲響...
    開封第一講書人閱讀 31,993評論 1 266
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留孕荠,地道東北人娩鹉。 一個月前我還...
    沈念sama閱讀 46,382評論 2 360
  • 正文 我出身青樓攻谁,卻偏偏與公主長得像,于是被迫代替她去往敵國和親弯予。 傳聞我的和親對象是個殘疾皇子戚宦,可洞房花燭夜當晚...
    茶點故事閱讀 43,543評論 2 349