Seurat24式太極拳之8右攬雀尾---在Seurat中使用sctransform

八邻辉、右攬雀尾
后坐扣腳 收腳抱球 轉(zhuǎn)體上步 弓步掤臂 擺臂后捋
轉(zhuǎn)體搭手 弓步前擠 轉(zhuǎn)腕分手 后坐引手 弓步前按

單細胞RNA-seq數(shù)據(jù)中的生物異質(zhì)性通常與包括測序深度在內(nèi)的技術(shù)因素混淆。即使在同一細胞類型內(nèi),每個細胞中檢測到的分子數(shù)量也可能在細胞之間發(fā)生顯著變化囱修。對scRNA-seq數(shù)據(jù)的解釋需要有效的預(yù)處理和標準化想诅,以消除這種技術(shù)差異。在Hafemeister和Satija雁比,2019年稚虎,我們引入了一個建某纺郏框架偎捎,用于對來自scRNA-seq實驗的分子計數(shù)數(shù)據(jù)進行歸一化和方差穩(wěn)定化。此過程省略了對包括偽計數(shù)加法或?qū)?shù)轉(zhuǎn)換在內(nèi)的啟發(fā)式步驟的需要序攘,并改善了常見的下游分析任務(wù)茴她,例如可變基因選擇,降維和差異表達程奠。

在此插圖中丈牢,我們演示了與對數(shù)歸一化相比,使用基于sctransform的歸一化如何能夠恢復(fù)更清晰的生物學(xué)區(qū)別瞄沙。

library(Seurat)
library(ggplot2)
library(sctransform)

加載數(shù)據(jù)并創(chuàng)建Seurat對象

pbmc_data <- Read10X(data.dir = "../data/pbmc3k/filtered_gene_bc_matrices/hg19/")
pbmc <- CreateSeuratObject(counts = pbmc_data)

應(yīng)用sctransform規(guī)范化

  • 請注意己沛,這個單一命令替換NormalizeData()ScaleData()FindVariableFeatures()`距境。
  • 轉(zhuǎn)換后的數(shù)據(jù)將在SCT分析中提供申尼,運行sctransform后將其設(shè)置為默認值
  • 在標準化期間,我們還可以刪除混雜的變異源垫桂,例如線粒體作圖百分比
# store mitochondrial percentage in object meta data
pbmc <- PercentageFeatureSet(pbmc, pattern = "^MT-", col.name = "percent.mt")

# run sctransform
pbmc <- SCTransform(pbmc, vars.to.regress = "percent.mt", verbose = FALSE)

最新版本sctransform還支持使用glmGamPoi軟件包师幕,從而大大提高了學(xué)習(xí)過程的速度∥芴玻可以通過指定調(diào)用它method="glmGamPoi"霹粥。

if (!requireNamespace("BiocManager", quietly = TRUE)) install.packages("BiocManager")

BiocManager::install("glmGamPoi")
pbmc <- SCTransform(pbmc, method = "glmGamPoi", vars.to.regress = "percent.mt", verbose = FALSE)

通過PCA和UMAP嵌入執(zhí)行降維

# These are now standard steps in the Seurat workflow for visualization and clustering
pbmc <- RunPCA(pbmc, verbose = FALSE)
pbmc <- RunUMAP(pbmc, dims = 1:30, verbose = FALSE)

pbmc <- FindNeighbors(pbmc, dims = 1:30, verbose = FALSE)
pbmc <- FindClusters(pbmc, verbose = FALSE)
DimPlot(pbmc, label = TRUE) + NoLegend()
image

標準的Seurat工作流程中,我們重點關(guān)注此數(shù)據(jù)集的10個PC疼鸟,盡管我們強調(diào)指出后控,此參數(shù)的設(shè)置較高時,結(jié)果相似空镜。有趣的是浩淘,我們發(fā)現(xiàn)使用sctransform時,通彻昧眩可以通過將此參數(shù)推得更高來受益馋袜。我們認為這是因為sctransform工作流程執(zhí)行了更有效的規(guī)范化,從而從數(shù)據(jù)中強烈消除了技術(shù)影響舶斧。

即使經(jīng)過標準的對數(shù)歸一化后欣鳖,測序深度的變化仍然是一個混雜因素(請參見圖1),并且這種影響會微妙地影響更高的PC茴厉。在sctransform中泽台,此效果已大大減輕(請參見圖3)什荣。這意味著更高的PC更可能代表微妙的但與生物學(xué)相關(guān)的異質(zhì)性來源-因此包括它們可能會改善下游分析。

此外怀酷,默認情況下稻爬,sctransform返回3,000個可變功能,而不是2,000蜕依∥Τ基本原理相似,其他可變特征不太可能受細胞間技術(shù)差異的驅(qū)動样眠,而可能代表更微妙的生物學(xué)波動友瘤。通常,我們發(fā)現(xiàn)用sctransform生成的結(jié)果對這些參數(shù)的依賴性較虚苁(實際上辫秧,在轉(zhuǎn)錄組中使用所有基因時,我們獲得了幾乎相同的結(jié)果被丧,盡管這確實降低了計算效率)盟戏。這可以幫助用戶生成更可靠的結(jié)果,此外甥桂,還可以使用具有相同參數(shù)設(shè)置的標準分析管道進行應(yīng)用柿究,這些參數(shù)設(shè)置可以快速應(yīng)用于新的數(shù)據(jù)集:

例如,以下代碼在一個命令中復(fù)制了完整的端到端工作流程:

pbmc <- CreateSeuratObject(pbmc_data) %>% PercentageFeatureSet(pattern = "^MT-", col.name = "percent.mt") %>% 
    SCTransform(vars.to.regress = "percent.mt") %>% RunPCA() %>% FindNeighbors(dims = 1:30) %>% 
    RunUMAP(dims = 1:30) %>% FindClusters()

如我們的論文所述格嘁,sctransform使用“正負二項式回歸”計算scRNA-seq數(shù)據(jù)中的技術(shù)噪聲模型笛求。該模型的殘差為歸一化值,可以為正或負糕簿。給定細胞中給定基因的正殘基表明探入,與基因在種群和細胞測序深度中的平均表達相比,我們觀察到的UMI比預(yù)期多懂诗,而負殘基則相反蜂嗽。

sctransfrom的結(jié)果存儲在“ SCT”分析中。您可以在我們的插圖殃恒,命令備忘單開發(fā)人員指南中了解有關(guān)Seurat中多測定數(shù)據(jù)和命令的更多信息植旧。

  • pbmc[["SCT"]]@scale.data包含殘差(歸一化值),并直接用作PCA的輸入离唐。請注意病附,此矩陣是非稀疏的,因此如果為所有基因存儲亥鬓,可能會占用大量內(nèi)存完沪。為了節(jié)省內(nèi)存,我們僅通過在SCTransform()`函數(shù)調(diào)用中默認設(shè)置return.only.var.genes = TRUE來為變量基因存儲這些值。

  • 協(xié)助進行可視化和解釋覆积。我們還將Pearson殘差轉(zhuǎn)換回“校正”的UMI計數(shù)听皿。您可以將它們解釋為如果所有單元格都測序到相同深度,我們期望觀察到的UMI計數(shù)宽档。如果您想確切了解我們?nèi)绾螆?zhí)行此操作尉姨,請在此處查看正確的功能。

  • “更正后的” UMI計數(shù)存儲在中pbmc[["SCT"]]@counts吗冤。我們將這些校正后的計數(shù)的對數(shù)標準化版本存儲在中pbmc[["SCT"]]@data又厉,這對可視化非常有幫助。

  • 您可以將校正后的對數(shù)歸一化計數(shù)用于差異表達和積分欣孤。但是馋没,原則上,最好直接對(存儲在scale.data插槽中的)殘差本身執(zhí)行這些計算降传。Seurat v3當前不支持此功能,但很快就會支持勾怒。

    • *</details>

用戶可以基于規(guī)范標記單獨注釋集群婆排。但是,與標準的Seurat工作流程相比笔链,sctransform歸一化方法在生物學(xué)上有更明顯的區(qū)別段只,其中包括:

  • 基于CD8A,GZMK鉴扫,CCL5赞枕,GZMK表達,至少3個CD8 T細胞群體(幼稚坪创,記憶炕婶,效應(yīng)子)的清晰分離
  • 基于S100A4,CCR7莱预,IL32和ISG15的三個CD4 T細胞群體(天然柠掂,記憶,IFN激活)的清晰分離
  • 基于TCL1A依沮,F(xiàn)CER2的B細胞簇中的其他發(fā)育子結(jié)構(gòu)
  • 根據(jù)XCL1和FCGR3A涯贞,將NK細胞進一步分離為CD56dim與明亮簇
# These are now standard steps in the Seurat workflow for visualization and clustering Visualize
# canonical marker genes as violin plots.
VlnPlot(pbmc, features = c("CD8A", "GZMK", "CCL5", "S100A4", "ANXA1", "CCR7", "ISG15", "CD3D"), 
    pt.size = 0.2, ncol = 4)
image
# Visualize canonical marker genes on the sctransform embedding.
FeaturePlot(pbmc, features = c("CD8A", "GZMK", "CCL5", "S100A4", "ANXA1", "CCR7"), pt.size = 0.2, 
    ncol = 3)
image
FeaturePlot(pbmc, features = c("CD3D", "ISG15", "TCL1A", "FCER2", "XCL1", "FCGR3A"), pt.size = 0.2, 
    ncol = 3)
image

說明一個樣本也可以使用sctransform處理的。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末危喉,一起剝皮案震驚了整個濱河市宋渔,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌辜限,老刑警劉巖皇拣,帶你破解...
    沈念sama閱讀 216,372評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異列粪,居然都是意外死亡审磁,警方通過查閱死者的電腦和手機谈飒,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評論 3 392
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來态蒂,“玉大人杭措,你說我怎么就攤上這事〖鼗郑” “怎么了手素?”我有些...
    開封第一講書人閱讀 162,415評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長瘩蚪。 經(jīng)常有香客問我泉懦,道長,這世上最難降的妖魔是什么疹瘦? 我笑而不...
    開封第一講書人閱讀 58,157評論 1 292
  • 正文 為了忘掉前任崩哩,我火速辦了婚禮,結(jié)果婚禮上言沐,老公的妹妹穿的比我還像新娘邓嘹。我一直安慰自己,他們只是感情好险胰,可當我...
    茶點故事閱讀 67,171評論 6 388
  • 文/花漫 我一把揭開白布汹押。 她就那樣靜靜地躺著,像睡著了一般起便。 火紅的嫁衣襯著肌膚如雪棚贾。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,125評論 1 297
  • 那天榆综,我揣著相機與錄音妙痹,去河邊找鬼。 笑死奖年,一個胖子當著我的面吹牛细诸,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播陋守,決...
    沈念sama閱讀 40,028評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼震贵,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了水评?” 一聲冷哼從身側(cè)響起猩系,我...
    開封第一講書人閱讀 38,887評論 0 274
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎中燥,沒想到半個月后寇甸,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,310評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,533評論 2 332
  • 正文 我和宋清朗相戀三年拿霉,在試婚紗的時候發(fā)現(xiàn)自己被綠了吟秩。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,690評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡绽淘,死狀恐怖涵防,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情沪铭,我是刑警寧澤壮池,帶...
    沈念sama閱讀 35,411評論 5 343
  • 正文 年R本政府宣布,位于F島的核電站杀怠,受9級特大地震影響椰憋,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜赔退,卻給世界環(huán)境...
    茶點故事閱讀 41,004評論 3 325
  • 文/蒙蒙 一橙依、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧离钝,春花似錦票编、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽鲤竹。三九已至浪读,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間辛藻,已是汗流浹背碘橘。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評論 1 268
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留吱肌,地道東北人痘拆。 一個月前我還...
    沈念sama閱讀 47,693評論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像氮墨,于是被迫代替她去往敵國和親纺蛆。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,577評論 2 353

推薦閱讀更多精彩內(nèi)容