幫老婆寫代謝組的熱圖和火山圖

rm(list=ls())
setwd('/Users/zhangjuxiang/Desktop/R time seq/')
#Bioconductor 安裝 edgeR
#install.packages('BiocManager')  #需要首先安裝 BiocManager，如果尚未安裝請先執(zhí)行該步
BiocManager::install('edgeR',force=T)
#讀取基因表達(dá)矩陣
targets <- read.csv('rawdata.csv')
as.matrix(targets)
rownames(targets) <- targets[,1]
targets <- targets[,-1]
#指定分組柿扣，注意要保證表達(dá)矩陣中的樣本順序和這里的分組順序是一一對應(yīng)的
#對照組在前页响，處理組在后
group <- rep(c('BC', 'EC'),c(121,192))





library(edgeR)
#數(shù)據(jù)預(yù)處理
#（1）構(gòu)建 DGEList 對象
dgelist <- DGEList(counts = targets, group = group)

#（2）過濾 low count 數(shù)據(jù)，例如 CPM 標(biāo)準(zhǔn)化（推薦）
keep <- rowSums(cpm(dgelist) > 1 ) >= 2
dgelist <- dgelist[keep,, keep.lib.sizes = FALSE]

#（3）標(biāo)準(zhǔn)化鸟缕，以 TMM 標(biāo)準(zhǔn)化為例
dgelist_norm <- calcNormFactors(dgelist, method = 'TMM')






#差異表達(dá)基因分析
#首先根據(jù)分組信息構(gòu)建試驗設(shè)計矩陣晶框，分組信息中一定要是對照組在前排抬，處理組在后
design <- model.matrix(~group)

#（1）估算基因表達(dá)值的離散度
dge <- estimateDisp(dgelist_norm, design, robust = TRUE)

#（2）模型擬合，edgeR 提供了多種擬合算法
#負(fù)二項廣義對數(shù)線性模型
fit <- glmFit(dge, design, robust = TRUE)
lrt <- topTags(glmLRT(fit), n = nrow(dgelist$counts))

write.table(lrt, 'control_treat.glmLRT.txt', sep = '\t', col.names = NA, quote = FALSE)

#擬似然負(fù)二項廣義對數(shù)線性模型
fit <- glmQLFit(dge, design, robust = TRUE)
lrt <- topTags(glmQLFTest(fit), n = nrow(dgelist$counts))

write.table(lrt, 'control_treat.glmQLFit.txt', sep = '\t', col.names = NA, quote = FALSE)








##篩選差異表達(dá)基因
#讀取上述輸出的差異倍數(shù)計算結(jié)果
gene_diff <- read.delim('control_treat.glmLRT.txt', row.names = 1, sep = '\t', check.names = FALSE)

#首先對表格排個序授段，按 FDR 值升序排序蹲蒲，相同 FDR 值下繼續(xù)按 log2FC 降序排序
gene_diff <- gene_diff[order(gene_diff$FDR, gene_diff$logFC, decreasing = c(FALSE, TRUE)), ]

#log2FC≥1 & FDR<0.01 標(biāo)識 up，代表顯著上調(diào)的基因
#log2FC≤-1 & FDR<0.01 標(biāo)識 down侵贵，代表顯著下調(diào)的基因
#其余標(biāo)識 none届搁，代表非差異的基因
gene_diff[which(gene_diff$logFC >= 1 & gene_diff$FDR < 0.05),'sig'] <- 'up'
gene_diff[which(gene_diff$logFC <= -1 & gene_diff$FDR < 0.05),'sig'] <- 'down'
gene_diff[which(abs(gene_diff$logFC) <= 1 | gene_diff$FDR >= 0.05),'sig'] <- 'none'

#輸出選擇的差異基因總表
gene_diff_select <- subset(gene_diff, sig %in% c('up', 'down'))
write.table(gene_diff_select, file = 'control_treat.glmQLFit.select.txt', sep = '\t', col.names = NA, quote = FALSE)

#根據(jù) up 和 down 分開輸出
gene_diff_up <- subset(gene_diff, sig == 'up')
gene_diff_down <- subset(gene_diff, sig == 'down')

write.table(gene_diff_up, file = 'control_treat.glmQLFit.up.txt', sep = '\t', col.names = NA, quote = FALSE)
write.table(gene_diff_down, file = 'control_treat.glmQLFit.down.txt', sep = '\t', col.names = NA, quote = FALSE)







install.packages('pheatmap')
library(pheatmap)
{
  tmp = gene_diff_select[gene_diff_select$PValue < 0.05,]
  #差異結(jié)果需要先根據(jù)p值挑選
  nrDEG_Z = tmp[ order( tmp$logFC ), ]
  nrDEG_F = tmp[ order( -tmp$logFC ), ]
  choose_gene = c( rownames( nrDEG_Z )[1:100], rownames( nrDEG_F )[1:100] )
  choose_matrix = targets[ choose_gene, ]
  choose_matrix = t( scale( t( choose_matrix ) ) )
  
  choose_matrix[choose_matrix > 2] = 2
  choose_matrix[choose_matrix < -2] = -2
  
  annotation_col = data.frame( CellType = factor( group ) )
  rownames( annotation_col ) = colnames( targets )
  choose_matrix <- na.omit(choose_matrix)
  pheatmap( fontsize = 2, choose_matrix, annotation_col = annotation_col, show_rownames = F, annotation_legend = F, filename = "heatmap_BRCA_medianexp2.png")
}








install.packages('ggplot2')
library( "ggplot2" )
nrDEG <- gene_diff
logFC_cutoff <- with( nrDEG, mean( abs( logFC ) ) + 2 * sd( abs( logFC ) ) )
logFC_cutoff
logFC_cutoff = 1
{
  nrDEG$change = as.factor( ifelse( nrDEG$PValue < 0.01 & abs(nrDEG$logFC) > logFC_cutoff,
                                    ifelse( nrDEG$logFC > logFC_cutoff , 'UP', 'DOWN' ), 'NOT' ) )
  
  save( nrDEG, file = "nrDEG_array_medianexp.Rdata" )
  
  this_tile <- paste0( 'Cutoff for logFC is ', round( logFC_cutoff, 3 ),
                       ' The number of up M/Z is ', nrow(nrDEG[ nrDEG$change =='UP', ] ),
                       ' The number of down M/Z is ', nrow(nrDEG[ nrDEG$change =='DOWN', ] ) )
  
  volcano = ggplot(data = nrDEG, aes( x = logFC, y = -log10(PValue), color = change)) +
    geom_point( alpha = 0.4, size = 1.75) +
    theme_set( theme_set( theme_minimal( base_size = 15 ) ) ) +
    xlab( "log2 fold change" ) + ylab( "-log10 p-value" ) +
    theme(legend.title = element_text(colour="black", size=6, face="bold")) +
    theme(legend.text = element_text(colour="black", size = 7, face = "bold")) +
    theme(axis.title.x = element_text(size = 9, color = "black", face = "bold")) +
    theme(axis.title.y = element_text(size = 9, color = "black", face = "bold")) +
    ggtitle( this_tile ) + theme( plot.title = element_text( size = 8, hjust = 0.5, face = "bold" )) +
    theme(legend.position=c(1.2, 0.8)) +
    theme(aspect.ratio=1) +
    scale_colour_manual( values = c('green','black','red') ) + theme(panel.grid.major = element_line(colour = "white", 
                                                                                                     linetype = "blank"), panel.grid.minor = element_line(colour = "white"), 
                                                                     panel.background = element_rect(fill = "aliceblue", 
                                                                                                     colour = "white"), plot.background = element_rect(colour = "azure1"))
  print( volcano ) 
  ggsave( volcano, filename = 'volcano_BRCA_medianexp.tiff' )
  dev.off()
}

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市窍育，隨后出現(xiàn)的幾起案子卡睦，更是在濱河造成了極大的恐慌，老刑警劉巖漱抓，帶你破解...
沈念sama閱讀 211,884評論 6贊 492
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件表锻，死亡現(xiàn)場離奇詭異，居然都是意外死亡乞娄，警方通過查閱死者的電腦和手機瞬逊，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 90,347評論 3贊 385
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來仪或，“玉大人码耐，你說我怎么就攤上這事∪芷洌” “怎么了骚腥？”我有些...
開封第一講書人閱讀 157,435評論 0贊 348
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長瓶逃。經(jīng)常有香客問我束铭，道長，這世上最難降的妖魔是什么厢绝？我笑而不...
開封第一講書人閱讀 56,509評論 1贊 284
?港島之戀（遺憾婚禮）
正文為了忘掉前任契沫，我火速辦了婚禮，結(jié)果婚禮上昔汉，老公的妹妹穿的比我還像新娘懈万。我一直安慰自己，他們只是感情好靶病，可當(dāng)我...
茶點故事閱讀 65,611評論 6贊 386
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布会通。她就那樣靜靜地躺著，像睡著了一般娄周。火紅的嫁衣襯著肌膚如雪涕侈。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 49,837評論 1贊 290
城市分裂傳說
那天煤辨，我揣著相機與錄音裳涛，去河邊找鬼木张。笑死，一個胖子當(dāng)著我的面吹牛端三，可吹牛的內(nèi)容都是我干的舷礼。我是一名探鬼主播，決...
沈念sama閱讀 38,987評論 3贊 408
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼郊闯，長吁一口氣：“原來是場噩夢啊……” “哼且轨！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起虚婿，我...
開封第一講書人閱讀 37,730評論 0贊 267
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤旋奢，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后然痊，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體至朗，經(jīng)...
沈念sama閱讀 44,194評論 1贊 303
?護(hù)林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 36,525評論 2贊 327
?白月光啟示錄
正文我和宋清朗相戀三年剧浸，在試婚紗的時候發(fā)現(xiàn)自己被綠了锹引。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 38,664評論 1贊 340
活死人
序言：一個原本活蹦亂跳的男人離奇死亡唆香，死狀恐怖嫌变，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情躬它，我是刑警寧澤腾啥，帶...
沈念sama閱讀 34,334評論 4贊 330
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站冯吓，受9級特大地震影響倘待，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜组贺，卻給世界環(huán)境...
茶點故事閱讀 39,944評論 3贊 313
男人毒藥：我在死后第九天來索命
文/蒙蒙一凸舵、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧失尖，春花似錦啊奄、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,764評論 0贊 21
一樁弒父案菇夸，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至胧辽，卻和暖如春峻仇，著一層夾襖步出監(jiān)牢的瞬間公黑，已是汗流浹背邑商。一陣腳步聲響...
開封第一講書人閱讀 31,997評論 1贊 266
情欲美人皮
我被黑心中介騙來泰國打工摄咆，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人人断。一個月前我還...
沈念sama閱讀 46,389評論 2贊 360
代替公主和親
正文我出身青樓吭从，卻偏偏與公主長得像，于是被迫代替她去往敵國和親恶迈。傳聞我的和親對象是個殘疾皇子涩金，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 43,554評論 2贊 349

幫老婆寫代謝組的熱圖和火山圖

推薦閱讀更多精彩內(nèi)容