0.寫(xiě)在前面
從我學(xué)生信開(kāi)始,畫(huà)熱圖用的就是pheatmap斧抱,有時(shí)復(fù)雜化的需求會(huì)用到ComplexHeatmap。作為R語(yǔ)言畫(huà)圖的絕對(duì)霸主,ggplot2的熱圖卻無(wú)法在熱圖的世界占到與pheatmap相匹敵的地位此洲。硬傷有二:
- 不會(huì)聚類(lèi)
- 沒(méi)有直觀的分組注釋條條
這個(gè)函數(shù)+推文,我從晚上11:05寫(xiě)到了凌晨?jī)牲c(diǎn)委粉,原計(jì)劃是12點(diǎn)錢(qián)發(fā)出去呜师,想寫(xiě)完整詳細(xì)版代碼,后來(lái)覺(jué)得有點(diǎn)麻煩贾节,細(xì)節(jié)太多汁汗。所以我把它寫(xiě)成了函數(shù),工作量翻了幾倍栗涂,但是以后直接使用就好啦知牌,雖然沒(méi)來(lái)得及昨天更推文,但是很值得斤程!好久沒(méi)有熬夜了角寸,為了這個(gè)小突破,任性一次也沒(méi)關(guān)系的忿墅!注意扁藕,這個(gè)函數(shù)是1.3.4以上版本的tinyarray可用o。
但當(dāng)我想用patchwork將pheatmap與點(diǎn)圖放到一起的時(shí)候疚脐,找到了解決辦法纹磺,as.ggplot將pheatmap轉(zhuǎn)換為ggplot2對(duì)象。后來(lái)亮曹,就發(fā)現(xiàn)了pheatmap的拼圖硬傷橄杨,圖例無(wú)法收集,大小也不能像ggplot一樣自動(dòng)匹配對(duì)齊照卦。
所以我就想式矫,如果我非要用ggplot2來(lái)畫(huà)熱圖呢?注釋條條要役耕,聚類(lèi)也可以要采转,有沒(méi)有辦法實(shí)現(xiàn)呢?
本文部分借鑒了CRAN的R包ggrisk的思維,就是做一個(gè)假的注釋條條故慈,然后和熱圖按比例拼到一起板熊!
至于聚類(lèi),借鑒了豆豆的思維察绷,只實(shí)現(xiàn)聚類(lèi)的操作干签,不顯示聚類(lèi)樹(shù)。
1. 數(shù)據(jù)和R包準(zhǔn)備
#devtools::install_github("xjsun1221/tinyarray")
library(tinyarray)
library(ggplot2)
library(patchwork)
輸入數(shù)據(jù)是一個(gè)表達(dá)矩陣(exp_dat)和分組信息(group),分組信息要整理成因子拆撼,水平(levels)設(shè)置對(duì)照組在前容劳,實(shí)驗(yàn)組在后。因子正文順序無(wú)所謂闸度。
rm(list = ls())
exp_dat = matrix(sample(100:1000,40),ncol = 4)
exp_dat[seq(1,(nrow(exp_dat)),2),] = exp_dat[seq(1,(nrow(exp_dat)),2),]-1000
rownames(exp_dat) = paste0("sample",1:nrow(exp_dat))
colnames(exp_dat) = paste0("gene",1:ncol(exp_dat))
exp_dat[1:4,1:4]
## gene1 gene2 gene3 gene4
## sample1 -808 -424 -496 -104
## sample2 327 510 161 694
## sample3 -405 -739 -1 -234
## sample4 266 566 295 503
group = rep(c("A","B"),times = nrow(exp_dat)/2)
group = factor(group,levels = c("A","B"))
group
## [1] A B A B A B A B A B
## Levels: A B
3.出圖竭贩!
輸入數(shù)據(jù)準(zhǔn)備好,一步就畫(huà)圖莺禁。
默認(rèn)不聚類(lèi)留量,如果想要聚類(lèi),那就加參數(shù)cluster = T哟冬。下圖是不聚類(lèi)(p1)和聚類(lèi)(p2)的對(duì)比楼熄。聚類(lèi)算法和pheatmap一致,目前只支持hclust柒傻,如果以后有人提需求孝赫,我就加上別的算法~
p1 = ggheat(exp_dat,group)
p2 = ggheat(exp_dat,group,cluster = T)
p1/p2
還有幾個(gè)參數(shù)可調(diào)整,例如是否顯示熱圖行列名红符,以及圖例名稱(chēng)修改青柄。具體的意義可以看字面意思或幫助文檔。
ggheat(exp_dat,group,cluster = T,show_rownames = F,
show_colnames = F,groupname = "risk",expname = "expression")
4.拼圖毫無(wú)壓力预侯!
這樣畫(huà)出來(lái)的圖致开,是根正苗紅的ggplot2!所以配上patchwork拼圖萎馅,那叫一個(gè)整整齊齊双戳!
po1 = ggplot(iris,aes(Species,Sepal.Length,fill = Species))+
geom_boxplot()+theme_bw()
po2 = ggplot(iris,aes(Species,Sepal.Length,color = Species))+
geom_jitter()+theme_bw()
po1/po2/p1