本次筆記內(nèi)容:
- 使用ggplot2及ggrepel繪制主圖和副圖
- 多種方法整合主圖與副圖:
ggpubr: ggarange() , 副圖注釋在主圖外
ggplot2: ggplotGrob + annotation_custom, 副圖注釋在主圖內(nèi)
ggExtra: ggMarginal(), 副圖重疊注釋在主圖外
cowplot: 副圖注釋在主圖外- 總結(jié):形式為功能服務(wù)募判,不要lost在細(xì)節(jié)的漩渦奖唯,但細(xì)節(jié)如何處理得心里有數(shù)。
使用iris這個示例數(shù)據(jù)普气,用ggplot2畫一個基本圖。
鳶尾花(iris)是數(shù)據(jù)挖掘常用到的一個數(shù)據(jù)集焰檩,有150個鳶尾花樣本信息副签,包括3個物種(setosa,versicolour和virginica)奶是。每個樣本具有5個特征(Sepal.Length,Sepal.Width, Petal.Length, Petal.Width, Species)。
data("iris")
iris <- data.frame(iris)
col <- brewer.pal(3, "Set1")
ggplot(data = iris, aes(Sepal.Length, Sepal.Width, colour = Species)) +
geom_point(size = 5, alpha = .6) +
scale_color_manual(values = col)
使用ggplot2及ggrepel繪制主圖和副圖
使用iris這個示例數(shù)據(jù)繪制主圖和副圖聚磺。在以下代碼中我切了一個子數(shù)據(jù)集出來坯台,并加上了一個‘group’列,作為演示ggrepel用瘫寝。
主圖:
# required packages
library(RColorBrewer)
library(ggrepel)
library(ggpubr)
library(cowplot)
library(ggExtra)
data("iris")
iris <- data.frame(iris)
iris_sub <- iris[iris$Sepal.Length > 2 & iris$Sepal.Width > 3.5, ]
iris_sub$group <- c(rep('group1',10), rep('group2',9))
col <- brewer.pal(3, "Set1")
col1 <- brewer.pal(3,"Set3")[1:2]
# main scatter plot
gg <- ggplot(data = iris, aes(Sepal.Length, Sepal.Width, colour = Species)) +
geom_point(size = 5, alpha = .6) +
scale_color_manual(values = col) +
geom_label_repel(data = iris_sub,
aes(
Sepal.Length, Sepal.Width,
label=rownames(iris_sub),
fill = group,
color = group
),
color = 'black', alpha=1,
point.padding = unit(0.1,"lines"),
box.padding = 0.5,
segment.color = 'grey55') +
# 連接label和點的線:顏色設(shè)置為gery55
scale_fill_manual(values = setNames(col1, levels(iris_sub$group))) +
# 將col1的兩個顏色蜒蕾,設(shè)置為iris_sub的兩個group的顏色,ggrepel按照這個顏色來fill
theme(legend.position = "bottom")
# 把legend設(shè)置在底部焕阿,因為副圖可能會遮蓋住右邊的Legend
副圖:
# annotated plot
xplot <- ggplot(data = iris, aes(x = Species, y = Sepal.Length, fill = Species)) +
geom_boxplot(position = position_dodge(0.8)) +
geom_point(position = position_jitterdodge())+
scale_fill_brewer(palette = "Set1") +
coord_flip() +
# 把豎著的boxplot橫過來
clean_theme() +
# 去掉所有theme, 比如x和y軸咪啡,只留下box。在調(diào)整階段可以先留著暮屡,以觀察把主副圖合并時有沒有把坐標(biāo)軸對齊
theme(legend.position = "none")
# 去掉lengend
yplot <- ggplot(data = iris, aes(x = Species, y = Sepal.Width, fill = Species)) +
geom_boxplot(position = position_dodge(0.8)) +
geom_point(position = position_jitterdodge())+
scale_fill_brewer(palette = "Set1") +
clean_theme() +
theme(legend.position = "none")
多種方法整合主圖與副圖:
ggpubr: ggarange() , 副圖注釋在主圖外
ggarrange(xplot, NULL,gg,yplot,
widths = c(5,1),heights = c(1,4), align = "hv")
ggarange()將副圖整合在主圖外部撤摸。如果把clean_theme()
去掉,發(fā)現(xiàn)因為主圖legend的緣故,副圖的坐標(biāo)軸沒法和主圖對齊愁溜。這里可能得根據(jù)實際情況調(diào)整主圖的legend疾嗅。ggarange()的好處在于可以調(diào)整整合圖的比例,參數(shù)設(shè)置簡單冕象。
ggplotGrob + annotaion_custom
# ggplotGrob + annotaion_custom
x_grob <- ggplotGrob(xplot)
y_grob <- ggplotGrob(yplot)
xmin <- min(iris$Sepal.Length)
xmax <- max(iris$Sepal.Length)
ymin <- min(iris$Sepal.Width)
ymax <- max(iris$Sepal.Width)
yoffset <- (1/20) * ymax
xoffset <- (1/30) * xmax
gg + annotation_custom(grob = x_grob,
xmin = xmin, xmax = xmax,
ymin = ymin-yoffset, ymax = ymin+yoffset) +
annotation_custom(grob = y_grob,
xmin = xmin-xoffset, xmax = xmin+xoffset,
ymin = ymin, ymax = ymax)
ggGrob + annotation_custom()設(shè)置起來比較麻煩代承,其副圖注釋在主圖內(nèi)部。但存在一系列問題渐扮。坐標(biāo)軸很難對齊论悴,主圖與副圖重疊很多。所以實際操作起來墓律,為避免圖之間的overlap, 可能還是副圖注釋在主圖外比較合適膀估。
ggExtra: ggMarginal()
ggMarginal(gg, type = "boxplot",groupColour = TRUE, groupFill = TRUE)
ggMarginal()可以用簡潔的代碼畫出上述的圖。注釋在主圖外耻讽,且坐標(biāo)軸可以對齊察纯。但副圖之間有overlap...可能繪制可以重疊的分布曲線比較合適。我始終沒有找到如何避免boxplot之間overlap的辦法=_=
ggMarginal()有個好處在于不需要畫出副圖针肥,只需要主圖饼记。這個包會幫你直接繪制副圖。但也意味著你沒辦法自定義副圖的一些屬性慰枕。
cowplot
p1 <- insert_xaxis_grob(gg, xplot, grid::unit(.2, "null"), position = "top")
p2 <- insert_yaxis_grob(p1, yplot, grid::unit(.2, "null"), position = "right")
ggdraw(p2)
cowplot畫出的圖是我覺得比較滿意的一種具则。副圖注釋在主圖外,坐標(biāo)軸對齊具帮,代碼簡單博肋,不用調(diào)試太多參數(shù)。
p.s. 還有一個ggscatterhist() 可以試試
http://www.sthda.com/english/articles/32-r-graphics-essentials/131-plot-two-continuous-variables-scatter-graph-and-alternatives/
總結(jié)
....有時候很難找到一個合適的包蜂厅,能滿足所有的需求:副圖和主圖之間的空白不要那么大匪凡,坐標(biāo)軸要互相對齊,box之間最好不要有overlap葛峻,lengend的位置不要影響到副圖的位置...等等锹雏。圖是為表達(dá)科學(xué)問題的一種形式,更好的反應(yīng)出科學(xué)假設(shè)與結(jié)果才是作圖的目的术奖。一些代碼難以處理的細(xì)枝末節(jié)可以在圖的形式大致確定下來之后礁遵,使用其他圖片編輯軟件進(jìn)行微調(diào)。
參考鏈接:
color filling in ggrepel:
https://github.com/slowkow/ggrepel/issues/82
https://stackoverflow.com/questions/37664025/ggrepel-label-fill-color-questions
http://rstudio-pubs-static.s3.amazonaws.com/155546_17c0cb7ee350417e902dfb9031b81f48.html
annotated to the main plot:
http://www.sthda.com/english/wiki/wiki.php?id_contents=7930
http://www.sthda.com/english/articles/24-ggpubr-publication-ready-plots/78-perfect-scatter-plots-with-correlation-and-marginal-histograms/
http://www.r-graph-gallery.com/277-marginal-histogram-for-ggplot2/