單細(xì)胞繪圖系列:
- Seurat繪圖函數(shù)總結(jié)
- 使用ggplot2優(yōu)化Seurat繪圖
- scRNAseq靈活的點(diǎn)圖繪制:FlexDotPlot
- 富集分析結(jié)果雷達(dá)圖
- DoHeatmap的優(yōu)化+ComplexHeatmap繪制帶特定基因的單細(xì)胞熱圖
1. 文獻(xiàn)中的細(xì)胞群之間的相關(guān)性熱圖
相關(guān)性分析
是指對(duì)兩個(gè)或多個(gè)具備相關(guān)性的變量元素進(jìn)行分析成洗,從而衡量?jī)蓚€(gè)變量因素的相關(guān)密切程度白嘁。相關(guān)性分析旨在研究?jī)蓚€(gè)或兩個(gè)以上隨機(jī)變量之間相互依存關(guān)系的方向和密切程度富雅。
兩個(gè)變量之間的相關(guān)性可以用簡(jiǎn)單相關(guān)系數(shù)(例如皮爾森相關(guān)系數(shù)等)進(jìn)行表示,相關(guān)系數(shù)越接近1耘眨,兩個(gè)元素相關(guān)性越大,相關(guān)系數(shù)越接近0,兩個(gè)元素越獨(dú)立怖现。
在讀單細(xì)胞的文獻(xiàn)的時(shí)候經(jīng)常會(huì)看到這種細(xì)胞群間的相關(guān)性熱圖
這類(lèi)細(xì)胞群間的相關(guān)性熱圖的主要意義在于查看細(xì)胞群于群之間的相似性,有助于尋找相似的功能性亞群玉罐。
2. 一個(gè)簡(jiǎn)單的實(shí)現(xiàn)方法:
使用R從Seurat對(duì)象中提取標(biāo)準(zhǔn)差最大的top基因計(jì)算相關(guān)性屈嗤,用pheatmap畫(huà)圖。
library(Seurat)
pbmc <- readRDS("pbmc.rds")
table(pbmc$cell_type)
av <-AverageExpression(pbmc,
group.by = "cell_type",
assays = "RNA")
av=av[[1]]
head(av)
# Naive CD4 T Memory CD4 T CD14+ Mono B CD8 T FCGR3A+ Mono NK DC Platelet
# AL627309.1 0.006007987 0.04854338 0.006065400 0.00000000 0.01995673 0.00000000 0.00000000 0.00000000 0
# AP006222.2 0.000000000 0.01088471 0.008397321 0.00000000 0.01157323 0.00000000 0.00000000 0.00000000 0
# RP11-206L10.2 0.007306336 0.00000000 0.000000000 0.02065031 0.00000000 0.00000000 0.00000000 0.08462847 0
# RP11-206L10.9 0.000000000 0.01050116 0.000000000 0.00000000 0.00000000 0.01200008 0.00000000 0.00000000 0
# LINC00115 0.014872162 0.03753737 0.031095957 0.03888541 0.01892413 0.01469374 0.06302423 0.00000000 0
# NOC2L 0.501822970 0.27253750 0.346874253 0.58653489 0.59129394 0.50026775 0.65705381 0.32861136 0
#選出標(biāo)準(zhǔn)差最大的1000個(gè)基因
cg=names(tail(sort(apply(av, 1, sd)),1000))
#查看這1000個(gè)基因在各細(xì)胞群中的表達(dá)矩陣
View(av[cg,])
#查看細(xì)胞群的相關(guān)性矩陣
View(cor(av[cg,],method = 'spearman'))
#pheatmap繪制熱圖
pheatmap::pheatmap(cor(av[cg,],method = 'spearman')) #默認(rèn)是Pearson
使用Scanpy可以更簡(jiǎn)單的繪制細(xì)胞群間的相關(guān)圖
import scanpy as sc
adata = sc.datasets.pbmc68k_reduced()
sc.tl.dendrogram(adata, 'bulk_labels')
#sc.pl.dendrogram(adata, 'bulk_labels')
sc.pl.correlation_matrix(adata, 'bulk_labels', figsize=(5,3.5))
3. 相關(guān)性分析方法
相關(guān)分析有不同的方法:主要包括Pearson參數(shù)相關(guān)檢驗(yàn)饶号,Spearman和Kendall基于秩的相關(guān)分析。
1. Pearson相關(guān)(皮爾遜積差相關(guān))
Pearson相關(guān)系數(shù)是用于表示相關(guān)性大小的最常用指標(biāo)季蚂,數(shù)值介于-1~1之間茫船,越接近0相關(guān)性越低,越接近-1或1相關(guān)性越高扭屁。正負(fù)號(hào)表明相關(guān)方向算谈,正號(hào)為正相關(guān)、負(fù)號(hào)為負(fù)相關(guān)疯搅。適用于兩個(gè)正態(tài)分布的連續(xù)變量
濒生。
2. Spearman等級(jí)相關(guān)(斯皮爾曼秩相關(guān))
利用兩變量的秩次大小來(lái)進(jìn)行分析,屬于非參數(shù)統(tǒng)計(jì)方法幔欧。適用于不滿足Pearson相關(guān)系數(shù)正態(tài)分布要求的連續(xù)變量
罪治。也可以用于有序分類(lèi)變量
的之間的相關(guān)性測(cè)量丽声。
3. Kendall's Tau相關(guān)
Kendall's Tau相關(guān)系數(shù)是一種非參數(shù)檢驗(yàn),適用于兩個(gè)有序分類(lèi)變量
觉义。
4. 其它
此外衡量?jī)蓚€(gè)變量之間關(guān)系的方法還有:卡方檢驗(yàn)雁社、Fisher精確檢驗(yàn)等。