在進(jìn)行單細(xì)胞降維分析時(shí)冈敛,resolution
值的確定會(huì)影響亞群數(shù)的多少掷匠,但最開(kāi)始分析的時(shí)候不知道亞群數(shù)最佳為多少慷蠕,可通過(guò)一些分析結(jié)果進(jìn)行確定忧陪。
10X單細(xì)胞轉(zhuǎn)錄組測(cè)序—常規(guī)流程 - 簡(jiǎn)書(shū) (jianshu.com)
獲取PCA分析后的結(jié)果 ②⑥
PBMC.all3=readRDS("E:/project/test/PBMC.all3.rds")
P值分析 號(hào)
通過(guò)p值分析,確定最多降維出多少個(gè)亞群是可信的浆洗。參數(shù)dims可設(shè)置最大(最大為PCA分析時(shí)參數(shù)npcs
值的大小催束,默認(rèn)為30)。
作出的圖中有一條虛線辅髓,只要實(shí)線在虛線之上就認(rèn)為是可信的泣崩。若實(shí)現(xiàn)太靠上或太靠下,顯得不美觀洛口,可調(diào)整ymax值的大小矫付。
PBMC.all3 = JackStraw(PBMC.all3,dims = 30)PBMC.all3 = ScoreJackStraw(PBMC.all3,dims=1:30)JackStrawPlot(PBMC.all3,dims=1:30,ymax = 0.6)
可通過(guò)碎石圖初步確定亞群數(shù) 宇宙
通過(guò)人為確定拐點(diǎn)來(lái)確定分組數(shù)
ElbowPlot(PBMC.all3,ndims = 30)
樹(shù)形圖確定
不能確定resolution
就設(shè)置一系列resolution
值進(jìn)行篩選
library(clustree)library(patchwork)#umap非線性降維PBMC.all3 <- RunUMAP(PBMC.all3,dims = 1:30,reduction = "harmony")PBMC.all3 = FindNeighbors(PBMC.all3,reduction = "harmony",dims = 1:30)seq <- seq(0.1, 1, by = 0.1)for(res in seq){ PBMC.all3 <- FindClusters(object = PBMC.all3,method = "igraph",resolution = res)}p1 <- clustree(PBMC.all3, prefix = 'RNA_snn_res.') + coord_flip()p1p2 <- DimPlot(PBMC.all3,group.by = 'RNA_snn_res.0.1', label = T)p2p1 + p2 + plot_layout(widths = c(2, 1))
解讀:箭頭的指向代表了一種從屬關(guān)系,每一列代表一種resolution
值第焰,resolution
值從左到右依次增大买优,每一個(gè)圓圈代表該resolution
值的一個(gè)亞群,箭頭的指向應(yīng)盡量避免雜亂挺举,如果出現(xiàn)兩個(gè)箭頭共同指向同一個(gè)亞群杀赢,說(shuō)明降維效果不好,應(yīng)找不出現(xiàn)這種情況的最小resolution
湘纵,即當(dāng)前最適合的resolution
脂崔,若想繼續(xù)減小resolution
,需要對(duì)降維參數(shù)進(jìn)行優(yōu)化梧喷。
優(yōu)化思路
- 數(shù)據(jù)質(zhì)控的好壞會(huì)影響降維的好壞∑痰校可根據(jù)我寫的10X單細(xì)胞轉(zhuǎn)錄組測(cè)序—常規(guī)流程 - 簡(jiǎn)書(shū) (jianshu.com)
中質(zhì)控的方法,調(diào)整各類型基因所占比例的闕值偿凭,也可以刪除reads數(shù)貢獻(xiàn)較大的基因,也可刪除線粒體弯囊,核糖體痰哨,血紅蛋白相關(guān)基因胶果。 - 若沒(méi)有刪除細(xì)胞周期相關(guān)基因斤斧,需要進(jìn)行周期分析,回歸掉相關(guān)基因折欠,降低該部分基因?qū)稻S的影響。
- 若分析的是免疫細(xì)胞吼过,那就可以用相關(guān)的免疫細(xì)胞的marker基因進(jìn)行標(biāo)準(zhǔn)化和降維锐秦,例如
cellmarker
數(shù)據(jù)庫(kù)中的基因。在我的10X單細(xì)胞轉(zhuǎn)錄組測(cè)序—常規(guī)流程 - 簡(jiǎn)書(shū) (jianshu.com)
中都有涉及盗忱。標(biāo)準(zhǔn)化和PCA分析時(shí)可將參數(shù)features
設(shè)置成不同的基因集,來(lái)篩選哪種設(shè)置方法最佳扇谣。 - 各個(gè)函數(shù)中
dims
參數(shù)的大小也會(huì)影響降維的好壞闲昭。