前情回顧:
Network在單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)分析中的應(yīng)用
筛冶纾基圖在單細(xì)胞數(shù)據(jù)探索中的應(yīng)用
熱圖在單細(xì)胞數(shù)據(jù)分析中的應(yīng)用
R-南丁格爾玫瑰圖: 人民日報(bào)都在用的細(xì)胞分群占比圖
三元相圖怎么看怎么畫(附R代碼示例)
在數(shù)據(jù)科學(xué)中幌缝,我們主要目標(biāo)是描述元素的對象和屬性及其之間的關(guān)系。在單細(xì)胞數(shù)據(jù)科學(xué)中定续,上游是在描述元素翩腐,如細(xì)胞的特性或基因的表達(dá)量逐纬,下游往往是描述細(xì)胞之間或基因之間的關(guān)系,如矢沿,配受體滥搭。關(guān)系型數(shù)據(jù),即兩個(gè)或以上變量之間的關(guān)系捣鲸,其可視化是一門技術(shù)與藝術(shù)的科學(xué)瑟匆。之前我們介紹的網(wǎng)絡(luò)圖,稍曰蹋基圖愁溜,熱圖其實(shí)也都是關(guān)系型數(shù)據(jù)可視化的例子疾嗅,今天,我們再介紹一種常用的關(guān)系型數(shù)據(jù)可視化的工具:圈圖冕象,或circos圖代承。
在這之前,我們先來思考一個(gè)相對宏觀的問題:如何選擇可視化工具呢渐扮?首先需要對我們的數(shù)據(jù)進(jìn)行分類论悴,不同的數(shù)據(jù)結(jié)構(gòu)可以選擇不同的可視化工具,以達(dá)成自己想說明的具體問題墓律。
不要被這個(gè)導(dǎo)圖嚇到膀估,它至少告訴我們數(shù)據(jù)類型是有限的,可視化的方法也是有限的只锻,而不是無限的玖像。好處是紫谷,避免了拿到數(shù)據(jù)手足無措的尷尬齐饮。關(guān)系型數(shù)據(jù)的可視化主要的技術(shù)有,和弦圖笤昨,網(wǎng)絡(luò)圖祖驱,桑基圖瞒窒,以及它們的變形捺僻,如下:
當(dāng)我們需要對"關(guān)系"進(jìn)一步細(xì)化的時(shí)候,可以用顏色崇裁,面積匕坯,粗細(xì)等屬性來映射不同的數(shù)據(jù)意義。下面來講我們今天的圈圖拔稳,請注意葛峻,這里的圈圖是廣義上的,是包含了和弦圖(Chord diagram)的巴比,和弦圖往往往往出現(xiàn)在圈圖的中心术奖,如下圖的ABC:
圖D當(dāng)然是圈圖,而其中沒有和弦圖轻绞,在這個(gè)意義上采记,圈圖是一種用來描述復(fù)雜關(guān)系的組合圖。由于圈層可以有多個(gè)政勃,每個(gè)圈層都可以按分類安排一種簡單圖唧龄,如柱形圖,折線圖奸远,環(huán)形圖等选侨。來說說圈圖中的和弦圖先掖鱼。
和弦圖用于探索實(shí)體組之間的關(guān)系,實(shí)體之間的連接用于顯示它們共享某些共同點(diǎn)援制,這使和弦圖非常適合比較數(shù)據(jù)集內(nèi)或不同數(shù)據(jù)組之間的相似性戏挡。下圖很好地反映出,如何將一個(gè)二維表映射成一個(gè)和弦圖:
- 細(xì)胞來源
那么晨仑,我們首先想到的應(yīng)用是多樣本聚類后褐墅,看每個(gè)群中不同細(xì)胞的樣本來源,我們在曾經(jīng)用珊榧海基圖實(shí)現(xiàn)過這個(gè)功能妥凳,幾乎,所有的纱鸩叮基圖都可以繪制成和弦圖:
如果這里每個(gè)亞群都注釋好細(xì)胞類型逝钥,又是不同部位的PMBC的話,是不是可以反映出細(xì)胞的去向與募集情況呢拱镐?
- 受配圖對
然后艘款,不同細(xì)胞類型之間的特異的受體和配體對關(guān)系,如NicheNet所繪制的那樣:
外在的六種顏色是六個(gè)細(xì)胞類型沃琅,不同細(xì)胞類型之間的受配體對用相同的顏色映射哗咆。
- V-J基因關(guān)系
我們知道,在單細(xì)胞免疫組庫的數(shù)據(jù)分析中益眉,V基因和J基因也有著對應(yīng)關(guān)系晌柬,這時(shí)候可以用和弦圖來反映V-J 之間的關(guān)系:
- metadata 圈圖
在圈圖中關(guān)鍵是定義每一圈層的意義,在我們熟悉的Seurat對象中郭脂,metadata里的信息每一列都是一個(gè)獨(dú)立的屬性年碘,所以我們可以把metadata信息繪制在圈圖之中。
#install.packages('circlize')
library(circlize)
library(Seurat)
library(ggraph,lib.loc = 'F:\\EE\\software\\R\\R-4.0.2\\library')
library(pbmc3k.SeuratData,lib.loc = 'F:\\EE\\software\\R\\R-4.0.2\\library')
.libPaths()
library(tidyverse)
library(cowplot)
library(clustree,lib.loc = 'F:\\EE\\software\\R\\R-4.0.2\\library')
unclass("Seurat")
class("Seurat")
head(pbmc3k.final@meta.data)
orig.ident nCount_RNA nFeature_RNA seurat_annotations percent.mt RNA_snn_res.0.5 seurat_clusters
AAACATACAACCAC pbmc3k 2419 779 Memory CD4 T 3.0177759 1 1
AAACATTGAGCTAC pbmc3k 4903 1352 B 3.7935958 3 3
AAACATTGATCAGC pbmc3k 3147 1129 Memory CD4 T 0.8897363 1 1
AAACCGTGCTTCCG pbmc3k 2639 960 CD14+ Mono 1.7430845 2 2
AAACCGTGTATGCG pbmc3k 980 521 NK 1.2244898 6 6
AAACGCACTGGTAC pbmc3k 2163 781 Memory CD4 T 1.6643551 1 1
繪制圈圖:
pbmc3k.final@meta.data -> df
circos.par("track.height" = 0.1)
circos.initialize(df$seurat_annotations, x = df$nFeature_RNA)
circos.track(df$seurat_annotations, y = df$nCount_RNA,
panel.fun = function(x, y) {
circos.text(CELL_META$xcenter,
CELL_META$cell.ylim[1.3] + mm_y(2),
CELL_META$sector.index)
circos.axis(labels.cex = 0.6)
})
col = rep(c("#FF0000"), length(levels(Idents(pbmc3k.final))))
circos.trackPoints(df$seurat_annotations, df$nFeature_RNA, df$nCount_RNA, col=col,pch = 16, cex = 0.5)
circos.text(1200, 1600, "lab", sector.index = "NK")
bgcol = rep(c( "#CCCCCC"), length(levels(Idents(pbmc3k.final))))
circos.trackHist(df$seurat_annotations, df$nFeature_RNA, bin.size = 20, bg.col = bgcol, col = NA)
circos.track(df$seurat_annotations, x = df$nFeature_RNA, y = df$nCount_RNA,
panel.fun = function(x, y) {
ind = sample(length(x), 10)
x2 = x[ind]
y2 = y[ind]
od = order(x2)
circos.lines(x2[od], y2[od])
})
circos.track(df$seurat_annotations, x = df$nFeature_RNA, y = df$percent.mt,
panel.fun = function(x, y) {
ind = sample(length(x), 10)
x2 = x[ind]
y2 = y[ind]
od = order(x2)
circos.lines(x2[od], y2[od])
})
circos.track(ylim = c(0, 1), panel.fun = function(x, y) {
xlim = CELL_META$xlim
ylim = CELL_META$ylim
breaks = seq(xlim[1], xlim[2], by = 100)
n_breaks = length(breaks)
circos.rect(breaks[-n_breaks], rep(ylim[1], n_breaks - 1),
breaks[-1], rep(ylim[2], n_breaks - 1),
col = rand_color(n_breaks), border = NA)
})
circos.link("B", c(400, 800), "NK", c(800,1000), col = "red",
border = "blue", h = 0.2)
circos.link("CD14+ Mono", 400, "FCGR3A+ Mono", c(400,1200), col = "green", border = "black", lwd = 2, lty = 2)
##################
circos.clear()
dev.off()
通過以上的例子展鸡,我們可以感受到屿衅,圈圖也好,和弦圖也好娱颊,其實(shí)都是一個(gè)框架傲诵,有了這個(gè)框架我們就可以在這個(gè)上面填充信息。如果說通過數(shù)據(jù)類型來尋找繪圖結(jié)構(gòu)是買毛坯房箱硕,那么拴竹,給每個(gè)繪圖元素映射生物學(xué)意義就是在裝修這個(gè)房屋。
不知道剧罩,這篇文章有沒有啟發(fā)到你呢栓拜?
https://jokergoo.github.io/circlize_book/book/circos-heatmap.html
https://xgaoo.github.io/ClusterMap/ClusterMap.html
https://yimingyu.shinyapps.io/shinycircos/
https://www.data-to-viz.com/graph/chord.html
http://circos.ca/
https://www.bioconductor.org/packages/release/BiocViews.html#___SingleCell
https://www.r-graph-gallery.com/310-custom-hierarchical-edge-bundling.html
https://davemcg.github.io/post/lets-plot-scrna-dotplots/
https://pxy.shatterspikeneopets.online/dotplot-seurat.html
https://jokergoo.github.io/circlize_book/book/introduction.html#principle-of-design
https://divingintogeneticsandgenomics.rbind.io/post/enhancement-of-scrnaseq-heatmap-using-complexheatmap/
https://gdevailly.netlify.app/post/plotting-big-matrices-in-r/
http://www.reibang.com/p/0dbdd6733b34