10X單細(xì)胞空間聯(lián)合分析之十一(CellTrek)

hello乳讥,大家好,又是周一活合,新一周的開(kāi)始雏婶,第一天分享一個(gè)簡(jiǎn)單的內(nèi)容,就是一個(gè)新的單細(xì)胞空間分析的軟件白指,CellTrek,這個(gè)軟件最新的地方在于添加了細(xì)胞之間的共定位分析酵紫,文章在Spatial charting of single cell transcriptomes in tissues,我們還是先來(lái)看看文章告嘲,最后看看代碼,我也把之前的單細(xì)胞空間聯(lián)合分析的軟件分享列在下面奖地,供大家參考橄唬。

MIA用于單細(xì)胞和空間的聯(lián)合分析

10X單細(xì)胞和空間聯(lián)合分析的方法---cell2location

10X空間轉(zhuǎn)錄組和10X單細(xì)胞數(shù)據(jù)聯(lián)合分析方法匯總

10X單細(xì)胞空間聯(lián)合分析之四----DSTG

10X單細(xì)胞空間聯(lián)合分析之三----Spotlight

10X單細(xì)胞空間聯(lián)合分析之五----spatialDWLS

10X單細(xì)胞空間聯(lián)合分析之六(依據(jù)每個(gè)spot的細(xì)胞數(shù)量進(jìn)行單細(xì)胞空間聯(lián)合分析)----Tangram

10X單細(xì)胞-10X空間轉(zhuǎn)錄組聯(lián)合分析之七----CellDART

當(dāng)然還有依據(jù)marker注釋空間轉(zhuǎn)錄組的方法,10X空間轉(zhuǎn)錄組數(shù)據(jù)分析之思路總結(jié)(針對(duì)腫瘤樣本)

10X單細(xì)胞-10X空間轉(zhuǎn)錄組聯(lián)合分析之八----STRIDE(三維重構(gòu))

10X空間轉(zhuǎn)錄組數(shù)據(jù)分析之空間注釋(解卷積参歹,STdeconvolve)

10X單細(xì)胞空間聯(lián)合分析之十(RCTD)

好了仰楚,開(kāi)始我們的分享

圖片.png

Abstract

單細(xì)胞 RNA 測(cè)序 (scRNA-seq) 方法可以分析單細(xì)胞的轉(zhuǎn)錄組,但不能保留空間信息犬庇。 相反僧界,空間轉(zhuǎn)錄組學(xué) (ST) 分析可以描繪組織切片中的空間區(qū)域,但沒(méi)有單細(xì)胞基因組分辨率臭挽。 在這里捂襟,作者開(kāi)發(fā)了一種稱為 CellTrek 的計(jì)算方法,它結(jié)合了這兩個(gè)數(shù)據(jù)集來(lái)實(shí)現(xiàn)單細(xì)胞空間映射欢峰。 測(cè)試使用模擬研究和兩個(gè)原位數(shù)據(jù)集對(duì) CellTrek 進(jìn)行了基準(zhǔn)測(cè)試葬荷。 然后涨共,應(yīng)用 CellTrek 從正常小鼠大腦和腎臟組織的現(xiàn)有數(shù)據(jù)集中重建細(xì)胞空間結(jié)構(gòu)。 分析還對(duì)兩個(gè)導(dǎo)管原位癌 (DCIS) 組織進(jìn)行了 scRNA-seq 和 ST 實(shí)驗(yàn)宠漩,并應(yīng)用 CellTrek 來(lái)識(shí)別僅限于不同導(dǎo)管的腫瘤亞克隆举反,以及與腫瘤區(qū)域相鄰的特定 T 細(xì)胞狀態(tài)。 數(shù)據(jù)表明扒吁,CellTrek 可以準(zhǔn)確地繪制不同組織類型中的單個(gè)細(xì)胞火鼻,以解析它們的空間組織。

Introduction

單細(xì)胞 RNA 測(cè)序 (scRNA-seq) 方法極大地?cái)U(kuò)展了我們對(duì)不同細(xì)胞類型的基因表達(dá)程序及其在發(fā)育和疾病中的作用的理解瘦陈。然而凝危,scRNA-seq 在組織解離步驟中固有地丟失了細(xì)胞空間信息,這對(duì)于理解細(xì)胞微環(huán)境和細(xì)胞間相互作用至關(guān)重要晨逝。雖然空間測(cè)序方法蛾默,包括空間轉(zhuǎn)錄組學(xué) (ST) 和 Slide-seq,可以在空間上描繪跨組織切片的基因表達(dá)捉貌,但它們僅限于測(cè)量具有細(xì)胞混合物的小區(qū)域支鸡,并且不能輕易提供單細(xì)胞信息。為了解決這個(gè)問(wèn)題趁窃,已經(jīng)設(shè)計(jì)了計(jì)算方法(例如牧挣,cell2locationRCTD)來(lái)將 ST spot解卷積為不同細(xì)胞類型的比例醒陆。然而瀑构,空間去卷積方法僅限于推斷每個(gè)spot的細(xì)胞類型比例,無(wú)法實(shí)現(xiàn)單細(xì)胞分辨率刨摩。此外寺晌,去卷積方法將細(xì)胞類型進(jìn)一步解析為反映不同生物學(xué)功能的更細(xì)粒度的“細(xì)胞狀態(tài)”(表達(dá)程序)的能力有限。最后澡刹,大多數(shù)反卷積方法只能預(yù)測(cè)分類標(biāo)簽呻征,而不能以空間分辨率推斷連續(xù)的細(xì)胞信息(例如,譜系軌跡罢浇、基因特征陆赋、連續(xù)表型)

在這里嚷闭,作者開(kāi)發(fā)了 CellTrek攒岛,這是一種計(jì)算工具包,可以根據(jù) scRNA-seq 和 ST 數(shù)據(jù)將單個(gè)細(xì)胞直接映射回組織切片中的空間坐標(biāo)凌受。 這種方法提供了一種不同于 ST 反卷積的新模式阵子,能夠更靈活、更直接地研究具有空間地形的單細(xì)胞數(shù)據(jù)胜蛉。 CellTrek 工具包還提供了兩個(gè)下游分析模塊挠进,包括用于空間共定位分析的 SColoc 和用于空間共表達(dá)分析的 SCoexp色乾。 使用模擬和原位數(shù)據(jù)集對(duì) CellTrek 進(jìn)行了基準(zhǔn)測(cè)試。 然后领突,將 CellTrek 應(yīng)用于來(lái)自正常小鼠大腦和腎臟組織的現(xiàn)有數(shù)據(jù)集以及從兩個(gè)人類導(dǎo)管原位癌 (DCIS) 樣本生成的數(shù)據(jù)暖璧,以研究單細(xì)胞空間分辨率下細(xì)胞類型/狀態(tài)的組織。

Results

Overview of CellTrek toolkit

CellTrek 首先將 ST 和 scRNA-seq 數(shù)據(jù)集成并共嵌入到共享特征空間中


圖片.png
  • Overview of the CellTrek workflow. CellTrek first co-embeds scRNA-seq and ST datasets into a shared latent space. Using the ST data, CellTrek trains a multivariate random forests (RF) model with spatial coordinates as the outcome and latent features as the predictors. A 2D spatial interpolation on the ST data is introduced to augment the ST spots. The trained RF model is then applied to the co-embedded data (ST interpolated) to derive an RF-distance matrix which will be converted into a sparse graph using mutual nearest neighbors (MNN). Based on the sparse graph, CellTrek transfers the coordinates to single cells from their neighboring ST spots.

CellTrek 使用 ST 數(shù)據(jù)訓(xùn)練multivariate random forests (RF) model君旦,以使用共享降維特征預(yù)測(cè)空間坐標(biāo)澎办。 引入了對(duì) ST 數(shù)據(jù)的空間非線性插值以增加空間分辨率。 然后將訓(xùn)練后的模型應(yīng)用于共嵌入數(shù)據(jù)以導(dǎo)出 RF 距離矩陣金砍,該矩陣測(cè)量 ST spot和由空間坐標(biāo)監(jiān)督的單個(gè)細(xì)胞之間的表達(dá)相似性局蚀。 基于 RF 距離矩陣,CellTrek 在閾值化后使用相互最近鄰 (MNN) 生成稀疏spot細(xì)胞圖恕稠。 最后琅绅,CellTrek 從相鄰spot傳輸細(xì)胞的空間坐標(biāo)。 為了提高兼容性鹅巍,CellTrek 可以接受從其他方法(例如 novoSpaRc)計(jì)算的任何細(xì)胞位置概率/距離矩陣作為細(xì)胞空間圖表的輸入千扶。 此外,提供了一個(gè)圖形用戶界面 (GUI)骆捧,用于對(duì)結(jié)果 CellTrek map進(jìn)行交互式可視化澎羞。

為了概括不同細(xì)胞類型之間的空間關(guān)系,開(kāi)發(fā)了一個(gè)下游計(jì)算模塊 SColoc敛苇,它將 CellTrek 結(jié)果匯總為圖形抽象


圖片.png
  • 注:The SColoc module. Based on the CellTrek result map, three different spatial dissimilarity methods, i.e., KL, DT, KD, can be applied to calculate a cell-type spatial dissimilarity matrix, and an MST is used to generate a tree structure. These steps are conducted repetitively on bootstrapped samples to calculate a consensus matrix on dissimilarity matrices or MSTs, which produces a final cell-type spatial graph representation

提供了三種方法妆绞,即 Kullback-Leibler 散度 (KL)、Delaunay 三角測(cè)量 (DT) 和 K-最近鄰距離 (KD)枫攀,用于計(jì)算細(xì)胞類型之間的空間差異摆碉。 基于相異度矩陣,SColoc 可以構(gòu)造一個(gè)最小生成樹(shù) (MST)脓豪,表示簡(jiǎn)化的空間細(xì)胞鄰近度。 上述步驟將在引導(dǎo)樣本上迭代執(zhí)行以生成共識(shí)矩陣(在差異或 MST 上)忌卤。 此后扫夜,圖形將通過(guò)具有可調(diào)邊緣閾值和顏色映射功能的 GUI 呈現(xiàn)。 此外驰徊,SColoc 提供了一個(gè) Kdistance 度量笤闯,用于測(cè)量細(xì)胞到選定參考組的空間距離。

為了研究不同的表達(dá)程序是否分布在不同的地形區(qū)域棍厂,作者開(kāi)發(fā)了 SCoexp颗味,它利用 CellTrek 坐標(biāo)來(lái)檢測(cè)目標(biāo)細(xì)胞內(nèi)的共表達(dá)基因模塊。


圖片.png
  • 注:The SCoexp module. For cells of interest, based on the CellTrek map, SCoexp first calculates a spatial kernel matrix using RBF based on their spatial distance. Next, based on the spatial kernel matrix and cell-gene expression matrix, SCoexp calculates the spatial weighted gene co-expression. Gene modules are then identified using CC or WGCNA. For the identified co-expression modules, module activity scores can be computed and mapped back to the CellTrek coordinates.

首先牺弹,SCoexp 根據(jù)它們的空間距離計(jì)算空間核權(quán)重矩陣浦马。 使用這個(gè)權(quán)重矩陣时呀,SCoexp 計(jì)算空間加權(quán)基因共表達(dá)矩陣。 此后晶默,SCoexp 利用共識(shí)聚類 (CC) 或加權(quán)相關(guān)網(wǎng)絡(luò)分析 (WGCNA) 來(lái)識(shí)別基因模塊谨娜。 對(duì)于識(shí)別的模塊,我們可以計(jì)算模塊分?jǐn)?shù)并investigate它們的空間組織磺陡。

Benchmarking and simulations

為了對(duì) CellTrek 的性能進(jìn)行基準(zhǔn)測(cè)試趴梢,利用了三個(gè)空間數(shù)據(jù)集,1) 具有自定義空間模式的模擬 scRNA-seq 數(shù)據(jù)集


圖片.png
  • 注:(a) UMAP of a simulated scRNA-seq data with 5 cell groups. (b) Spatial organization of the simulated data as the ground truth
  1. 基于熒光原位雜交 (FISH) 的果蠅胚胎單細(xì)胞數(shù)據(jù)集


    圖片.png
  • 注:(d) UMAP of Drosophila embryo FISH-generated single cell data. (e) Spatial organization of Drosophila embryo cells as the ground truth.
    3)小鼠胚胎的seqFISH數(shù)據(jù)集
    圖片.png
  • 注:(g) UMAP of mouse embryo seqFISH data (Group1: Cardiomyocytes; Group2: Cranial mesoderm; Group3: Definitive endoderm; Group4:Dermomyotome; Group5: Endothelium; Group6: Erythroid; Group7: Forebrain midbrain hindbrain; Group8: Gut tube; Group9: Haematoendothelial progenitors; Group10: Intermediate mesoderm; Group11: Lateral plate mesoderm; Group12: Mixed mesenchymal mesoderm; Group13: Neural crest; Group14: Presomitic mesoderm; Group15: Spinal cord; Group16: Splanchnic mesoderm; Group17:Suface ectoderm). (h) Spatial organization of the mouse embryo cells as the ground truth.

生成了三個(gè)相應(yīng)的 ST 數(shù)據(jù)集币他,每個(gè)spot聚合了五個(gè)空間最近的細(xì)胞


圖片.png
  • 注:(f) mouse embryo ST data generated based on panel (h). In (c), (f) and (i), each ST spot aggregates the 5 nearest cells to generate the ST data.

將 CellTrek 應(yīng)用于 scRNA-seq 和 ST 數(shù)據(jù)以重建它們的空間細(xì)胞圖坞靶。 然后,將CellTrek 與另外兩種細(xì)胞制圖方法進(jìn)行了比較:1) NVSP-CellTrek蝴悉,它使用基于參考的 novoSpaRc(一種空間重建方法)來(lái)計(jì)算細(xì)胞空間概率矩陣彰阴,然后利用 CellTrek 生成空間圖,以及 2) Seurat coordinate transfer (SrtCT) which uses the data transfer approach to transfer ST coordinates to single cells辫封。 CellTrek 和 NVSP-CellTrek 都重建了模擬數(shù)據(jù)的原始空間格局硝枉,而 SrtCT 只重建了細(xì)胞之間的粗略空間關(guān)系,不能準(zhǔn)確地映射細(xì)胞


圖片.png

與 NVSP-CellTrek 相比倦微,CellTrek 以更高的空間密度繪制了更多的細(xì)胞妻味。 為了定量評(píng)估這些方法,我們使用 KL 散度將細(xì)胞繪圖結(jié)果的空間密度與不同細(xì)胞類型的原始空間分布進(jìn)行了比較欣福。 CellTrek 和 NVSPCellTrek 均以低 KL 散度實(shí)現(xiàn)了良好的性能责球,而 SrtCT 與參考分布的差異要大得多

圖片.png

在果蠅胚胎數(shù)據(jù)中,CellTrek 準(zhǔn)確重建了原始空間布局拓劝,三種方法中 KLdivergences 最低


圖片.png

在 CellTrek 結(jié)果中進(jìn)一步研究了幾種已知的果蠅胚胎發(fā)生基因雏逾,并發(fā)現(xiàn)了與先前研究一致的空間模式


圖片.png

在小鼠胚胎數(shù)據(jù)中,我們發(fā)現(xiàn) CellTrek 和 NVSP-CellTrek 準(zhǔn)確地重建了原始空間結(jié)構(gòu)郑临,而 CellTrek 在第 5栖博、9 和 17 組中顯示出略高的 KL-divergences


圖片.png

為了研究 CellTrek 是否可以揭示小鼠胚胎發(fā)育的空間模式,我們選擇了一組腸管細(xì)胞厢洞,發(fā)現(xiàn)一些標(biāo)記基因與之前的研究存在空間一致性


圖片.png

然后我們使用 Monocle 進(jìn)行了軌跡分析仇让,結(jié)果表明偽時(shí)間反映了腸管細(xì)胞的空間發(fā)育模式以及前后軸
圖片.png

接下來(lái)評(píng)估了 CellTrek 在三種不同模擬設(shè)置下對(duì)模擬數(shù)據(jù)的性能:1)read counts,2) 空間隨機(jī)性躺翻,以及 3) 組織密度丧叽。 我們使用 KL 散度和 Pearson 相關(guān)性在 CellTrek 地圖和參考之間的細(xì)胞空間坐標(biāo)上評(píng)估 CellTrek 性能。 在三個(gè)模擬中(每個(gè)模擬有八個(gè)條件)公你,與置換測(cè)試相比踊淳,CellTrek 實(shí)現(xiàn)了良好的空間重建性能,并顯示出更低的 KL 散度和更高的相關(guān)性陕靠。 然而迂尝,增加空間隨機(jī)性會(huì)影響 CellTrek 的性能并降低統(tǒng)計(jì)顯著性脱茉,同時(shí)減少read counts或spot/cell密度將導(dǎo)致稀疏的細(xì)胞圖。 總體而言雹舀,該數(shù)據(jù)表明 CellTrek 是一種在不同實(shí)驗(yàn)條件下進(jìn)行單細(xì)胞空間映射的穩(wěn)健方法芦劣。

圖片.png

Topological organizations of mouse brain cells

將 CellTrek 應(yīng)用于公共小鼠大腦 scRNA-seq (Smart-seq2)和 ST 數(shù)據(jù)集(Visium,10X Genomics)说榆。 我們將 CellTrek 與 NVSP-CellTrek 和 SrtCT 方法進(jìn)行了比較虚吟。 CellTrek 按照 L2/3 端腦內(nèi) (IT)莲兢、L4初肉、L5 IT晦墙、L6 IT茧妒、L6 皮質(zhì)丘腦 (CT) 和 L6b 的順序重建了層流興奮性神經(jīng)元亞型的清晰層結(jié)構(gòu)朋贬,與大腦皮層結(jié)構(gòu)相匹配碧磅。 NVSP-CellTrek 顯示出類似的空間層趨勢(shì)例获,從而證明了 CellTrek 方法的靈活性和一致性杈抢。 然而神汹,NVSP-CellTrek 在某些區(qū)域?qū)е铝讼∈璧募?xì)胞映射庆捺。 SrtCT 未能準(zhǔn)確地將細(xì)胞位置投影到組織學(xué)圖像上。 然后我們使用 Seurat 標(biāo)簽轉(zhuǎn)移 (SrtLT) 來(lái)預(yù)測(cè)每種細(xì)胞類型的空間分布作為我們的參考屁魏。 細(xì)胞制圖結(jié)果與參考文獻(xiàn)之間的 KL 散度表明 CellTrek 成功地恢復(fù)了空間細(xì)胞結(jié)構(gòu)滔以,并且在三種方法中具有最低的 KL 散度


圖片.png
  • 注:CellTrek reconstructs spatial organization in a mouse brain tissue. a, Comparison of CellTrek, NVSP-CellTrek and SrtCT results for single cell spatial charting in a mouse brain tissue. b, KL-divergence of spatial cell charting methods for each cell type using SrtLT as a reference.

接下來(lái),驗(yàn)證 CellTrek 是否可以進(jìn)一步揭示同一細(xì)胞類型內(nèi)細(xì)胞狀態(tài)的拓?fù)淠J健?例如氓拼,L5 IT 細(xì)胞包含五種表達(dá)狀態(tài)你画,并在 UMAP 上以 Hsd11b1-Endou、Whrn-Tox2桃漾、Batf3坏匪、Col6a1-Fezf2 和 Col27a1 的順序顯示出連續(xù)趨勢(shì)。 L5 IT CellTrek map發(fā)現(xiàn)了一個(gè)精煉的子層架構(gòu)撬统,這與之前的研究一致适滓。 為了總結(jié)細(xì)胞空間共定位,我們使用基于 KL 的 MST 共識(shí)圖將 SColoc 應(yīng)用于 CellTrek 結(jié)果恋追。 谷氨酸能神經(jīng)元細(xì)胞類型按層結(jié)構(gòu)的順序構(gòu)建了圖形的線性主干粒竖。 到 L2/3 IT 細(xì)胞的空間 K 距離在圖表的相同順序中顯示出顯著增加的趨勢(shì)(Spearman's rho = 0.91,P < 2.2e-16)


圖片.png
  • 注: c, UMAP (left) and CellTrek map (right) of scRNA-seq data of L5 IT cell states. d, Spatial colocalization graph of glutamatergic neurons using SColoc. e, CellTrek-based spatial K-distance of glutamatergic neurons to L2/3 IT cells. Boxplots show the median with interquartile ranges (25–75%); whiskers extend to 1.5X the interquartile range from the box.

然后几于,使用 SCoexp 研究了基因如何在 L5 IT 細(xì)胞中空間共表達(dá)。 鑒定了兩個(gè)共表達(dá)模塊(K1沿后、K2)并顯示出不同的生物學(xué)功能富集沿彭。 K1 模塊在細(xì)胞狀態(tài) Hsd11b1-Endou、Whrn-Tox2 中高度活躍并在空間上位于外層尖滚,而 K2 模塊在 Col27a1喉刘、Col6a1-Fezf2 和 Batf3 中高度活躍瞧柔,主要位于內(nèi)層。 這些結(jié)果表明 SCoexp 能夠識(shí)別相同細(xì)胞類型內(nèi)的細(xì)微轉(zhuǎn)錄差異并推斷它們的拓?fù)洚愘|(zhì)性睦裳。


圖片.png
  • 注: f, Spatial co-expression modules (K1 and K2) identified in L5 IT cells using SCoexp. g-h, UMAPs of L5 IT cells showing the K1 module activity scores (g) and the K2 module activity scores (h) and their corresponding CellTrek maps.
圖片.png
  • 注:(a-b) GO enrichment analyses (left) and module-correlated genes (right) for mouse brain L5 IT K1 and K2 modules, respectively

Spatial cell charting of the mouse hippocampus

還將 CellTrek 應(yīng)用于來(lái)自小鼠海馬體的 Slide-seq v230 和 scRNA-seq 數(shù)據(jù) 造锅。 Slide-seq 數(shù)據(jù)的無(wú)監(jiān)督聚類確定了 12 個(gè)具有高度組織空間結(jié)構(gòu)的聚類 (G01-G12)。 CellTrek 將單個(gè)細(xì)胞映射到它們的空間位置廉邑,這與 Slide-seq 集群一致哥蔚。 值得注意的是,G06 與 Cornu Ammonis (CA) 區(qū)域匹配蛛蒙,而 CellTrek 揭示了 CA1糙箍、CA2 和 CA3 主細(xì)胞的順序映射,這些主細(xì)胞無(wú)法單獨(dú)通過(guò) Slide-seq 聚類解決牵祟。 這些結(jié)果表明 CellTrek 可以廣泛應(yīng)用于不同的空間基因組平臺(tái)深夯,以實(shí)現(xiàn)更精細(xì)的空間細(xì)胞分辨率。

圖片.png

Spatial reconstruction of a mouse kidney tissue

將 CellTrek 應(yīng)用于公共小鼠腎臟數(shù)據(jù) 32 并將其與 NVSP-CellTrek 和 SrtCT 進(jìn)行比較诺苹。 CellTrek 使用位于不同組織學(xué)區(qū)域(例如咕晋,皮質(zhì)、外髓質(zhì)和內(nèi)髓質(zhì))的不同細(xì)胞類型準(zhǔn)確重建了細(xì)胞空間結(jié)構(gòu)收奔。與 CellTrek 相比掌呜,NVSP-CellTrek 顯示出相似的空間模式,而 SrtCT 無(wú)法重建小鼠腎細(xì)胞的準(zhǔn)確空間組織筹淫。使用 SrtLT 作為參考站辉,CellTrek 和 NVSP-CellTrek 都實(shí)現(xiàn)了整體低 KL 散度,NVSP-CellTrek 顯示出更高的 VSMC 和 RenaCorp 細(xì)胞的 KL 散度损姜。 SrtCT 顯示與參考分布的最高 KL 散度饰剥。為了進(jìn)一步研究空間細(xì)胞表達(dá)動(dòng)態(tài),我們分別推斷了 ProxTub 和 DistTub 細(xì)胞的軌跡摧阅,并基于 CellTrek 對(duì)它們的偽時(shí)間進(jìn)行了空間映射汰蓉。對(duì)于 ProxTub 細(xì)胞,我們觀察到從皮層外部到內(nèi)部的連續(xù)空間軌跡棒卷。 ProxTub 細(xì)胞的這種連續(xù)解剖變化與之前的研究一致顾孽。同樣,DistTub 細(xì)胞也顯示出具有清晰空間模式的連續(xù)軌跡比规∪艉瘢總的來(lái)說(shuō),這些結(jié)果表明 CellTrek 可以解決組織中單細(xì)胞連續(xù)表達(dá)程序的拓?fù)渑帕小?/p>

圖片.png
  • 注:CellTrek reconstructs spatial organization in a mouse kidney tissue. a, Comparison of CellTrek, NVSP-CellTrek and SrtCT results for single cell spatial charting in a mouse kidney tissue. (DistTub: distal tubule cells, T: T cells, ProxTub: proximal tubule cells, VSMC: vascular smooth muscle cells, Inter: intercalated cells, Prin: principal cells, TLLH: the loop of Henle, Vasc: vascular cells, Macro: macrophages, RenaCorp: renal corpuscle cells) b, KL-divergence of spatial cell charting methods for each cell type using SrtLT as a reference. c, Trajectory analysis for proximal tubule cells (left) and spatial mapping of the pseudotime values in the tissue section (right). d, Trajectory analysis for distal tubule cells (left) and spatial mapping of the pseudotime values in the tissue section (right).

接下來(lái)使用 SColoc 總結(jié)了一個(gè)細(xì)胞空間圖蜒什。 ProxTub 細(xì)胞被確定為樞紐并連接到 RenaCorp测秸、DistTub 和其他細(xì)胞類型。共識(shí)熱圖和層次聚類顯示出與圖抽象相似的模式。由于 scRNA-seq 數(shù)據(jù)是從小鼠腎臟的不同區(qū)域顯微解剖中收集的霎冯,我們?cè)儐?wèn) CellTrek 是否可以在沒(méi)有先驗(yàn)知識(shí)的情況下重述實(shí)驗(yàn)區(qū)域信息铃拇。根據(jù) CellTrek 結(jié)果,我們計(jì)算了 TLLH沈撞、DistTub 和 Prin 細(xì)胞到中心區(qū)域的一組細(xì)胞的 K 距離慷荔。觀察到一致的趨勢(shì)是 Kdistances 從皮質(zhì)到外髓質(zhì),然后到內(nèi)髓質(zhì)缠俺,這表明 CellTrek 成功揭示了小鼠腎臟的帶狀結(jié)構(gòu)显晶。此外,在 DistTub 細(xì)胞中晋修,我們使用 SCoexp 確定了兩個(gè)不同的空間共表達(dá)模塊(K1 和 K2)吧碾。 K1 模塊富含代謝途徑、腎系統(tǒng)發(fā)育墓卦,并與一些遠(yuǎn)曲小管 (DCT) 基因高度相關(guān)倦春。相比之下,K2 富含細(xì)胞基質(zhì)途徑落剪、嘌呤代謝途徑睁本,并與遠(yuǎn)端直管 (DST) 經(jīng)典基因相關(guān)。這兩個(gè)模塊在 UMAP 和 CellTrek 地圖上顯示了不同的模式忠怖。 K1在皮質(zhì)區(qū)高度活躍呢堰,而K2在髓質(zhì)區(qū)活躍,這與DCT和DST的解剖定位一致

圖片.png
  • 注:e, Spatial colocalization graph of different renal cell types using SColoc. f, Spatial consensus matrix of different renal cell types. g, CellTrek-based spatial K-distance of TLLH, DistTub and Prin cells to the tissue center cells across experimental zonal dissections (left). Center cells as reference are shown on the right panel. *** indicates P < 0.001. Boxplots show the median with interquartile ranges (25–75%); whiskers extend to 1.5X the interquartile range from the box. h, Spatial co-expression modules (K1 and K2) identified in distal tubule cells using SCoexp. i-j, UMAPs of distal tubule cells showing the K1 module activity scores (i) and the K2 module activity scores (j) and their corresponding CellTrek maps.
圖片.png

進(jìn)一步query CellTrek 是否可以通過(guò)利用空間信息來(lái)提高我們對(duì)細(xì)胞間通訊的理解凡泣。 我們使用 CellChat 對(duì) scRNA-seq 數(shù)據(jù)進(jìn)行了細(xì)胞-細(xì)胞相互作用分析枉疼,并使用 SColoc 圖通過(guò)假設(shè)共定位的細(xì)胞將有更高的機(jī)會(huì)相互作用來(lái)過(guò)濾細(xì)胞-細(xì)胞對(duì)。 與原始 CellChat 結(jié)果相比鞋拟,預(yù)測(cè)了所有細(xì)胞類型之間的許多非特異性相互作用骂维,空間過(guò)濾提供了一組更簡(jiǎn)潔、更具體的減少的相互作用贺纲。 重要的是航闺,分析確定了之前報(bào)道過(guò)的幾種相互作用,包括 ProxTub 表達(dá)的 Vegfa 與其受體 Flt1 和 Kdr 相互作用猴誊,后者由 Vasc 表達(dá)

圖片.png

Spatial subclone heterogeneity in a DCIS breast cancer

將 3' scRNA-seq(10X 基因組學(xué))和 ST(Visium潦刃,10X 基因組學(xué))應(yīng)用于 DCIS 樣本 (DCIS1),以分析 6,828 個(gè)單細(xì)胞和 1,567 個(gè) ST spot懈叹。 對(duì)于 scRNA-seq 數(shù)據(jù)乖杠,聚類和差異表達(dá) (DE) 分析確定了 5 種主要細(xì)胞類型,包括上皮細(xì)胞澄成、內(nèi)皮細(xì)胞滑黔、成纖維細(xì)胞笆包、髓細(xì)胞和自然殺傷 (NK)/T 細(xì)胞


圖片.png

應(yīng)用 CopyKAT 從 scRNA-seq 數(shù)據(jù)推斷拷貝數(shù)分布。在所有腫瘤細(xì)胞中觀察到一些克隆拷貝數(shù)改變 (CNA)略荡,包括染色體 3q (PIK3CA)、8q (MYC) 和 19p (STK11) 的增加以及染色體 8p (PPP2R2A)歉胶、10q (PTEN) 和 14q 的丟失汛兜。 AKT1)。 CNA 譜的 UMAP 和 dbscan 聚類確定了三個(gè)主要腫瘤亞克隆 (clone1-3) 具有一些不同的改變通今,包括克隆 2 和克隆 3 中的 17q (ERBB2) 增益和 11q (ATM) 丟失粥谬,克隆 2 中的 1q(MDM4 和 EPHX1)增益和克隆 3 中的 6q (FOXO3) 丟失”杷基于共有的 CNA 譜漏策,我們構(gòu)建了一個(gè)系統(tǒng)發(fā)育樹(shù),顯示克隆 1 是較早的亞克隆臼氨,與主要譜系不同掺喻,其次是克隆 2 和克隆 3。值得注意的是储矩,這三個(gè)亞克隆表現(xiàn)出轉(zhuǎn)錄異質(zhì)性感耙。 Hallmark 基因集富集分析確定了所有三個(gè)亞克隆的幾種常見(jiàn)途徑,包括 MYC 靶標(biāo)持隧、氧化磷酸化和 DNA 修復(fù)即硼。我們還確定了亞克隆特異性特征,包括富含克隆 2 和克隆 3 的雌激素反應(yīng)途徑屡拨,以及富含克隆 2 的干擾素 α/γ 反應(yīng)只酥、凝血和補(bǔ)體途徑。


圖片.png
  • 注:CellTrek identifies the spatial subclone heterogeneity in DCIS1. a, A heatmap of copy number (CN) profiles inferred by CopyKAT on the scRNA-seq data in DCIS1. The lower part represents a consensus CN profile of each cluster with some breast cancer-related genes annotated. b, CN-based UMAP of DCIS1. c,Phylogenetic tree based on the consensus CN profiles. d, Hallmark GSEA analysis of the expression data from three tumor subclones
圖片.png

為了了解三個(gè)腫瘤亞克隆的空間分布呀狼,我們將 CellTrek 應(yīng)用于 scRNA-seq 和 ST 數(shù)據(jù)裂允。大多數(shù)腫瘤細(xì)胞映射到 H&E 載玻片上的 DCIS 區(qū)域。此外赠潦,不同的腫瘤亞克隆映射到不同的導(dǎo)管區(qū)域叫胖,反映了廣泛的腫瘤內(nèi)空間異質(zhì)性。具體而言她奥,clone2 主要位于中間 (M) 導(dǎo)管瓮增,而 clone3 主要位于右側(cè) (R) 導(dǎo)管,而 clone1 分布在許多導(dǎo)管區(qū)域哩俭。 ST 腫瘤spot的無(wú)監(jiān)督聚類確定了五個(gè) ST cluster绷跑,它們顯示空間和基因表達(dá)與腫瘤 CellTrek 圖一致》沧剩基于每個(gè)導(dǎo)管的亞克隆組成砸捏,我們進(jìn)行了聚類分析并計(jì)算了香農(nóng)指數(shù)谬运,產(chǎn)生了四個(gè)具有不同亞克隆組成和空間模式的主要導(dǎo)管簇】巡兀總體而言梆暖,來(lái)自組織右側(cè)部分的導(dǎo)管顯示出較低的克隆多樣性,而來(lái)自中間和左側(cè)區(qū)域的一些導(dǎo)管顯示出較高的克隆多樣性


圖片.png
  • 注:e, Spatial cell charting of three tumor subclones using CellTrek. f, Tumor subclonal compositions within different ducts. The diamond symbol in each bar represents the Shannon index which measures the diversity of tumor subclones. g, H&E image of the DCIS tissue section with Shannon diversity index for each duct.
圖片.png

使用 SCoexp 進(jìn)一步研究了腫瘤細(xì)胞的空間共表達(dá)模式掂骏,并確定了三個(gè)基因模塊(K1轰驳、K2 和 K3)。 K1 模塊在 Clone1 中含量較高弟灼,并富含肌動(dòng)蛋白相關(guān)通路级解。 CellTrek 顯示具有高 K1 分?jǐn)?shù)的細(xì)胞在空間上對(duì)應(yīng)于腫瘤克隆 1。 相比之下田绑,K2 在 Clone2 和 Clone3 中含量較高勤哗,并且富含對(duì)雌二醇、乳腺導(dǎo)管形態(tài)發(fā)生和一些分解代謝過(guò)程的反應(yīng)掩驱。 有趣的是芒划,K3 模塊在增殖腫瘤細(xì)胞方面非常活躍昙篙,并且與細(xì)胞周期相關(guān)過(guò)程有關(guān)腊状。 K3 評(píng)分的空間映射顯示增殖的腫瘤細(xì)胞主要位于幾個(gè)導(dǎo)管的外圍區(qū)域附近。 總之苔可,這些數(shù)據(jù)表明 CellTrek 工具包可以描繪不同腫瘤亞克隆的拓?fù)鋱D及其在 DCIS 組織中的表達(dá)程序缴挖。

圖片.png

Spatial tumor-immune microenvironment of a DCIS tissue

在另一個(gè)具有同步侵入性成分 (DCIS2) 的 DCIS 樣本中,我們分析了 3,748 個(gè)單細(xì)胞(10X Genomics)和 2,063 個(gè) ST spot(Visium焚辅,10X Genomics)映屋。 無(wú)監(jiān)督聚類和 DE 分析確定了 10 個(gè)簇,包括三個(gè)上皮簇同蜻、內(nèi)皮細(xì)胞棚点、周細(xì)胞、成纖維細(xì)胞湾蔓、髓細(xì)胞瘫析、NK/T、B 和漿細(xì)胞樣樹(shù)突細(xì)胞 (pDC)默责。 CopyKAT 揭示了一個(gè)帶有 CNA 的非整倍體上皮Cluster(上皮 3)


圖片.png

H&E 圖像的組織病理學(xué)分析確定了 11 個(gè)帶有腫瘤細(xì)胞的導(dǎo)管區(qū)域 (T1-T11) 和包含基質(zhì)和免疫細(xì)胞的中間區(qū)域贬循。為了研究腫瘤免疫微環(huán)境,我們專注于來(lái)自 scRNA-seq 數(shù)據(jù)的非整倍體細(xì)胞和免疫細(xì)胞桃序。使用 CellTrek杖虾,我們將大部分非整倍體細(xì)胞映射到組織學(xué)定義的 DCIS 區(qū)域,將免疫細(xì)胞映射到導(dǎo)管和基質(zhì)區(qū)域周圍的區(qū)域媒熊。有趣的是奇适,我們發(fā)現(xiàn)一些免疫細(xì)胞坟比,包括 T、B嚷往、骨髓細(xì)胞和 pDC葛账,聚集在導(dǎo)管外的區(qū)域,尤其是 T1皮仁、T2注竿、T6 和 T7。將 CellTrek 結(jié)果與 H&E 圖像相結(jié)合魂贬,我們假設(shè)這些區(qū)域中存在三級(jí)淋巴結(jié)構(gòu) (TLS)。為了進(jìn)一步研究這個(gè)問(wèn)題裙顽,我們計(jì)算了 ST spot水平的 TLS 分?jǐn)?shù)付燥,發(fā)現(xiàn)具有高 TLS 分?jǐn)?shù)的spot通常對(duì)應(yīng)于我們 CellTrek 圖中的混合免疫細(xì)胞聚集體。此外愈犹,我們發(fā)現(xiàn) ST 級(jí) TLS 分?jǐn)?shù)與繪制的免疫細(xì)胞計(jì)數(shù)呈正相關(guān)(Pearson's R = 0.36键科,P = 1.2e-10)′鲈酰總之勋颖,這些結(jié)果表明 CellTrek 能夠基于 scRNA-seq 和 ST 數(shù)據(jù)重建空間腫瘤免疫微環(huán)境。


圖片.png
  • 注:CellTrek displays the spatial tumor-immune microenvironment in DCIS2. a, H&E image of the tissue section from the DCIS2 patient. Histopathological annotations of tumor regions are highlighted in red circles with labels from T1 to T11. b, UMAP of DCIS2 scRNA-seq data (tumor cells, B cells, NK/T cells, myeloid and pDC cells). c, CellTrek spatial mapping of tumor cells, B cells, NK/T cells, myeloid and pDC cells. Yellow boxes highlight potential locations of tertiary lymphoid structures (TLS) with aggregation of mixed immune cells. d, ST spot-level TLS signature scores. e, Boxplot showing the association between CellTrek-based immune cell counts and ST spot TLS score quantiles.

接下來(lái)勋锤,發(fā)現(xiàn)一些 T 細(xì)胞靠近腫瘤區(qū)域饭玲,一些位于腫瘤區(qū)域的遠(yuǎn)端。我們進(jìn)一步分析了 T 細(xì)胞并將它們重新聚集成六種細(xì)胞狀態(tài)叁执,包括幼稚 T (NaiveT)茄厘、CD4+ T (CD4T)、CD8+ T (CD8T)谈宛、調(diào)節(jié)性 T 細(xì)胞 (Treg)次哈、耗竭 CD4+ T (CD4Te) 和耗盡的 CD8+ T (CD8Te) 。研究了這些 T 細(xì)胞狀態(tài)在 CellTrek 圖中的分布吆录。值得注意的是窑滞,Tregs、CD4Te 和 CD8Te 細(xì)胞大多靠近腫瘤細(xì)胞恢筝。進(jìn)一步構(gòu)建了 T 細(xì)胞內(nèi)的空間圖哀卫,發(fā)現(xiàn)來(lái)自相同譜系的細(xì)胞傾向于在空間上共定位。計(jì)算了 T 耗竭分?jǐn)?shù)滋恬,發(fā)現(xiàn)耗竭分?jǐn)?shù)高的 T 細(xì)胞傾向于定位在腫瘤區(qū)域附近聊训。 T 細(xì)胞與其最近的 15 個(gè)腫瘤細(xì)胞的 K 距離顯示出與 UMAP 上的 T 耗竭評(píng)分相反的趨勢(shì)。正如預(yù)期的那樣恢氯,與非抑制性 T 細(xì)胞相比带斑,免疫抑制性 T 細(xì)胞(Treg鼓寺、CD4Te 和 CD8Te)具有更高的耗竭評(píng)分。根據(jù) K 距離將 T 細(xì)胞二值化為腫瘤遠(yuǎn)端 (TD) 和腫瘤近端 (TP) 組勋磕,發(fā)現(xiàn) TP 組顯示出明顯高于 TD 組的耗竭評(píng)分(P = 1.1e-4)妈候,表明存在DCIS 導(dǎo)管區(qū)域附近的免疫抑制微環(huán)境。還發(fā)現(xiàn)了類似的趨勢(shì)挂滓,其中 TP 與 TD 相比苦银,CD4T 和 Treg 細(xì)胞的耗竭分?jǐn)?shù)更高,而 NaiveT 細(xì)胞的趨勢(shì)相反赶站。重要的是幔虏,TD 組只包含很少的免疫抑制性 T 細(xì)胞,這與發(fā)現(xiàn)一致贝椿,即耗盡的 T 細(xì)胞傾向于共定位在 DCIS 區(qū)域附近想括。


圖片.png
  • 注: f, CellTrek spatial mapping of different T cell states. The contour plot represents the tumor cell densities. g, UMAP of scRNA-seq data showing different T cell states. h, Spatial colocalization graph of T cell states using SColoc. i, CellTrek spatial mapping of the T exhaustion scores. j, UMAP of T cells showing the exhaustion scores. k, UMAP of T cells showing the spatial K-distances to their 15 nearest tumor cells. l, Boxplot comparing the T cell exhaustion scores between different T cell states. m, Boxplot comparing the T cell exhaustion scores between T cells proximal to tumor cells (TP) and T cells distal to tumor cells (TD). n, Boxplot comparing the T cell exhaustion scores between TP and TD within each T cell state. In l, m and n, * indicates P < 0.05, *** indicates P < 0.01, *** indicates P < 0.001 using Wilcoxon rank-sum test. Boxplots show the median with interquartile ranges (25–75%); whiskers extend to 1.5X the interquartile range from the box.

髓細(xì)胞的重新聚類確定了四種細(xì)胞狀態(tài),包括常規(guī)樹(shù)突狀細(xì)胞 (cDC)烙博、單核細(xì)胞和兩種巨噬細(xì)胞亞群(Macro1 和 Macro2)瑟蜈。CellTrek 將大部分 cDC 投影到腫瘤近端區(qū)域≡埽空間圖顯示 Macro2 細(xì)胞與Macro1和cDC共定位铺根。然后我們計(jì)算了骨髓細(xì)胞到腫瘤細(xì)胞的K-距離,發(fā)現(xiàn)cDCs總體上顯示出最低的K-距離乔宿,而Macro1細(xì)胞具有更高的K-距離位迂。K-距離密度 圖顯示了類似的趨勢(shì)。我們進(jìn)一步檢查了 Macro1 細(xì)胞的空間共表達(dá)予颤,并使用 SCoexp 確定了兩個(gè)主要基因模塊(K1囤官、K2)和一個(gè)次要模塊。K1 模塊在來(lái)自腫瘤遠(yuǎn)端區(qū)域的巨噬細(xì)胞中更活躍蛤虐,并且相關(guān) 具有多個(gè) C1Q 基因党饮、HAVCR2、CD74驳庭、HLA-DRA 等刑顺。相反,K2 模塊顯示出相反的空間模式并與 CHIT1饲常、CSTB蹲堂、APOC1、MARCO 等相關(guān)


圖片.png

為了正交驗(yàn)證 CellTrek 推斷的腫瘤和免疫細(xì)胞的空間分布贝淤,我們對(duì)來(lái)自 DCIS2 和另一個(gè) DCIS 樣本 (DCIS3) 的組織切片的靶向探針進(jìn)行了免疫熒光 (RNAscope) 實(shí)驗(yàn)柒竞。該數(shù)據(jù)表明,DCIS 腫瘤細(xì)胞區(qū)域具有 ERBB2 的高表達(dá)播聪,而 TAGLN 標(biāo)記了導(dǎo)管的基底上皮層朽基。此外布隔,免疫抑制性 T 細(xì)胞標(biāo)志物,包括 CTLA4 和 FOXP3稼虎,在 DCIS2 的 DCIS 區(qū)域附近具有高表達(dá)衅檀,這與 CellTrek 結(jié)果一致。同樣霎俩,在 DCIS3 中哀军,我們?cè)趯?dǎo)管附近發(fā)現(xiàn)了具有 CTLA4 和 FOXP3 的免疫抑制性 T 細(xì)胞。此外打却,該數(shù)據(jù)顯示 B 細(xì)胞 (MS4A1)杉适、單核細(xì)胞/巨噬細(xì)胞 (CD68) 和樹(shù)突狀細(xì)胞 (CD1C) 也在 DCIS 導(dǎo)管區(qū)域附近,表明存在 TLS柳击,并且與 DCIS2 的 CellTrek 結(jié)果一致淘衙。相比之下,在同一組織切片的正常小葉上皮區(qū)域中觀察到的免疫細(xì)胞較少腻暮,尤其是免疫抑制性 T 細(xì)胞標(biāo)志物。這些數(shù)據(jù)證實(shí)了我們對(duì)使用 CellTrek 推斷的 DCIS 腫瘤免疫微環(huán)境的發(fā)現(xiàn)毯侦。

圖片.png

DISCUSSION

在這里哭靖,作者開(kāi)發(fā)了一種新的計(jì)算工具 CellTrek,用于基于 scRNA-seq 和 ST 數(shù)據(jù)重建空間細(xì)胞圖侈离。與傳統(tǒng)的去卷積方法相比试幽,CellTrek 提供了一種新范式,可以將單個(gè)細(xì)胞直接投影到組織切片中的空間坐標(biāo)卦碾,從而充分利用 scRNA-seq 數(shù)據(jù)铺坞。我們還開(kāi)發(fā)了兩個(gè)下游計(jì)算模塊(SColoc 和 SCoexp)來(lái)進(jìn)一步分析 CellTrek 結(jié)果。通過(guò)重建蜂窩空間圖洲胖,CellTrek 提供了幾個(gè)優(yōu)勢(shì)济榨。首先,它提供了一種靈活的方法來(lái)以空間方式研究單個(gè)細(xì)胞的任何特征(例如绿映,細(xì)胞類型/狀態(tài)擒滑、偽時(shí)間),而大多數(shù) ST 解卷積方法只能將SPOT分解為細(xì)胞類型叉弦,無(wú)法實(shí)現(xiàn)單細(xì)胞級(jí)特征映射.其次丐一,CellTrek 非常靈活,可以將任何細(xì)胞位置概率/相似性矩陣作為輸入來(lái)重建細(xì)胞圖淹冰,從而實(shí)現(xiàn)進(jìn)一步的下游分析库车。第三,通過(guò)利用度量學(xué)習(xí)方法和非線性插值樱拴,CellTrek 允許以更高的空間分辨率進(jìn)行更準(zhǔn)確的細(xì)胞繪圖柠衍。最后洋满,隨著更高空間分辨率測(cè)序技術(shù)的發(fā)展,CellTrek 完全能夠?qū)蝹€(gè)細(xì)胞繪制到其他空間測(cè)序數(shù)據(jù)拧略,以提供更高的空間粒度芦岂。

首先使用模擬和原位數(shù)據(jù)集對(duì) CellTrek 性能進(jìn)行基準(zhǔn)測(cè)試,然后評(píng)估不同數(shù)據(jù)條件下的準(zhǔn)確性和穩(wěn)健性垫蛆。 通過(guò)將 CellTrek 工具包應(yīng)用于來(lái)自小鼠大腦和腎臟的兩個(gè)“完善”的數(shù)據(jù)集禽最,我們展示了其恢復(fù)不同細(xì)胞類型拓?fù)浣Y(jié)構(gòu)的能力。 進(jìn)一步表明袱饭,CellTrek 可以通過(guò)將分類(即細(xì)胞狀態(tài))和連續(xù)特征(即偽時(shí)間)映射到組織切片來(lái)識(shí)別高分辨率子結(jié)構(gòu)川无。 SColoc 還可以將不同細(xì)胞類型的空間關(guān)系重建為圖形,可進(jìn)一步用于細(xì)胞間通訊分析虑乖。 此外懦趋,SCoexp 可以檢測(cè)多種細(xì)胞類型內(nèi)的空間共表達(dá)模塊,顯示組織切片中的拓?fù)淠J健?/p>

在研究中疹味,我們對(duì)兩個(gè) DCIS 樣本進(jìn)行了匹配的 scRNA-seq 和 ST 實(shí)驗(yàn)仅叫,并應(yīng)用 CellTrek 工具包來(lái)描繪不同導(dǎo)管區(qū)域中腫瘤亞克隆的空間分布和腫瘤免疫微環(huán)境的拓?fù)浣M織。 在 DCIS1 中糙捺,我們發(fā)現(xiàn)三個(gè)腫瘤亞克隆定位于具有不同克隆多樣性水平的不同導(dǎo)管诫咱。 盡管先前已經(jīng)觀察到形態(tài)學(xué)和基因組腫瘤內(nèi)異質(zhì)性,但在這里我們報(bào)告了 DCIS 組織中導(dǎo)管網(wǎng)絡(luò)內(nèi)的空間異質(zhì)性洪灯。 在 DCIS2 中坎缭,CellTrek 準(zhǔn)確映射了腫瘤和免疫細(xì)胞,并表明在 DCIS 區(qū)域附近存在富含免疫細(xì)胞的 TLS签钩。 T 細(xì)胞和骨髓細(xì)胞的進(jìn)一步分析揭示了它們相對(duì)于腫瘤細(xì)胞的空間定位掏呼。 這些發(fā)現(xiàn)使用 RNAscope 進(jìn)行了正交驗(yàn)證。

雖然 CellTrek 是分析 scRNA-seq 和 ST 數(shù)據(jù)的強(qiáng)大工具铅檩,但它有幾個(gè)顯著的局限性憎夷。 首先,正如我們?cè)谀M數(shù)據(jù)中顯示的那樣昧旨,CellTrek 可以在某些組織區(qū)域進(jìn)行稀疏細(xì)胞映射岭接。 為了克服這個(gè)問(wèn)題,人們可以 1) 收集細(xì)胞密度較高的組織進(jìn)行 ST 分析臼予; 2)對(duì)更多細(xì)胞進(jìn)行測(cè)序或整合多個(gè)scRNA-seq數(shù)據(jù)集鸣戴。 其次,CellTrek 根據(jù)稀疏圖將細(xì)胞映射到它們最相似的spot粘拾,這需要具有相對(duì)較高細(xì)胞純度的 ST spot窄锅。 增加空間隨機(jī)性(降低 ST spot純度)的模擬表明,CellTrek 可能會(huì)過(guò)度簡(jiǎn)化“組織較少”的組織結(jié)構(gòu)的空間復(fù)雜性。 最后入偷,僅基于 CellTrek 存在過(guò)度解釋數(shù)據(jù)的風(fēng)險(xiǎn)追驴,因?yàn)樗且环N計(jì)算推理工具。 盡管使用相對(duì)嚴(yán)格的參數(shù)作為默認(rèn)值來(lái)控制假陽(yáng)性疏之,但建議使用正交驗(yàn)證來(lái)確認(rèn)生物學(xué)發(fā)現(xiàn)殿雪。

In the future, CellTrek could be improved by including image recognition or deep learning approaches for cell segmentation and identification. Additionally, epigenetic regulation is of great interest in developmental biology and cancer research. Therefore, another future direction is to adapt CellTrek for epigenome data (e.g., scATAC-seq) to understand spatial epigenetic regulation in the tissue sections. Overall, we expect that CellTrek will have a multitude of applications for studying basic biology and human disease in spatial context, as applying scRNA-seq and ST experiments to the same tissues is becoming ever more commonplace.

Method

CellTrek toolkit

圖片.png
圖片.png

示例代碼

options(stringsAsFactors = F)
library("CellTrek")
library("akima")
library("randomForestSRC")
library("packcircles")
library("dplyr")
library("magrittr")
library("dbscan")
library("pheatmap")
library("spatstat")
library("Seurat")
library("SeuratData")
library("reshape2")
library("visNetwork")
library("shiny")
library("plotly")
library("viridis")
library("RColorBrewer")
library("ConsensusClusterPlus")
library("philentropy")

示例數(shù)據(jù)

brain_st_cortex <- readRDS("brain_st_cortex.rds")
brain_sc <- readRDS("brain_sc.rds")
## Visualize the ST data
SpatialDimPlot(brain_st_cortex)
圖片.png
## Visualize the scRNA-seq data
DimPlot(brain_sc, label = T, label.size = 4.5)
圖片.png

Cell charting using CellTrek

We first co-embed ST and scRNA-seq datasets using traint
brain_traint <- CellTrek::traint(st_data=brain_st_cortex, sc_data=brain_sc, sc_assay='RNA', cell_names='cell_type')
## We can check the co-embedding result to see if there is overlap between these two data modalities
DimPlot(brain_traint, group.by = "type") 
圖片.png
After coembedding, we can chart single cells to their spatial locations. Here, we use the non-linear interpolation (intp = T, intp_lin=F) approach to augment the ST spots.
brain_celltrek <- CellTrek::celltrek(st_sc_int=brain_traint, int_assay='traint', sc_data=brain_sc, sc_assay = 'RNA', 
                                   reduction='pca', intp=T, intp_pnt=5000, intp_lin=F, nPCs=30, ntree=1000, 
                                   dist_thresh=0.55, top_spot=5, spot_n=5, repel_r=20, repel_iter=20, keep_model=T)$celltrek
After cell charting, we can interactively visualize the CellTrek result using celltrek_vis
brain_celltrek$cell_type <- factor(brain_celltrek$cell_type, levels=sort(unique(brain_celltrek$cell_type)))

CellTrek::celltrek_vis(brain_celltrek@meta.data %>% dplyr::select(coord_x, coord_y, cell_type:id_new),
                       brain_celltrek@images$anterior1@image, brain_celltrek@images$anterior1@scale.factors$lowres)

Cell colocalization analysis

Based on the CellTrek result, we can summarize the colocalization patterns between different cell types using SColoc module. Here, we are using glutamatergic neuron cell types as an example. We first subset the glutamatergic neuron cell types from our charting result.
glut_cell <- c('L2/3 IT', 'L4', 'L5 IT', 'L5 PT', 'NP', 'L6 IT', 'L6 CT',  'L6b')
names(glut_cell) <- make.names(glut_cell)
brain_celltrek_glut <- subset(brain_celltrek, subset=cell_type %in% glut_cell)
brain_celltrek_glut$cell_type %<>% factor(., levels=glut_cell)
Then we can use scoloc module to perform colocalization analysis.
brain_sgraph_KL <- CellTrek::scoloc(brain_celltrek_glut, col_cell='cell_type', cell_min=15, use_method='KL', eps=1e-50)
## We extract the minimum spanning tree (MST) result from the graph
brain_sgraph_KL_mst_cons <- brain_sgraph_KL$mst_cons
rownames(brain_sgraph_KL_mst_cons) <- colnames(brain_sgraph_KL_mst_cons) <- glut_cell[colnames(brain_sgraph_KL_mst_cons)]
brain_cell_class <- brain_celltrek@meta.data %>% dplyr::select(id=cell_type, class=class) %>% unique
CellTrek::scoloc_vis(brain_sgraph_KL_mst_cons, meta_data=brain_cell_class)
圖片.png

Spatial-weighted gene co-expression analysis within the cell type of interest

Based on the CellTrek result, we can further investigate the co-expression patterns within the cell type of interest using SCoexp module. Here, we will take L5 IT cells as an example using consensus clustering (CC) method. L5 IT cells first are extracted from the charting result.
brain_celltrek_l5 <- subset(brain_celltrek, subset=cell_type=='L5 IT')
brain_celltrek_l5@assays$RNA@scale.data <- matrix(NA, 1, 1)
brain_celltrek_l5$cluster <- gsub('L5 IT VISp ', '', brain_celltrek_l5$cluster)
DimPlot(brain_celltrek_l5, group.by = 'cluster')
圖片.png
We select top 2000 variable genes (exclude mitochondrial, ribosomal and high-zero genes)
brain_celltrek_l5 <- FindVariableFeatures(brain_celltrek_l5)
vst_df <- brain_celltrek_l5@assays$RNA@meta.features %>% data.frame %>% mutate(id=rownames(.))
nz_test <- apply(as.matrix(brain_celltrek_l5[['RNA']]@data), 1, function(x) mean(x!=0)*100)
hz_gene <- names(nz_test)[nz_test<20]
mt_gene <- grep('^Mt-', rownames(brain_celltrek_l5), value=T)
rp_gene <- grep('^Rpl|^Rps', rownames(brain_celltrek_l5), value=T)
vst_df <- vst_df %>% dplyr::filter(!(id %in% c(mt_gene, rp_gene, hz_gene))) %>% arrange(., -vst.variance.standardized)
feature_temp <- vst_df$id[1:2000]
We use scoexp to do the spatial-weighted gene co-expression analysis.
brain_celltrek_l5_scoexp_res_cc <- CellTrek::scoexp(celltrek_inp=brain_celltrek_l5, assay='RNA', approach='cc', gene_select = feature_temp, sigm=140, avg_cor_min=.4, zero_cutoff=3, min_gen=40, max_gen=400)
We can visualize the co-expression modules using heatmap.
brain_celltrek_l5_k <- rbind(data.frame(gene=c(brain_celltrek_l5_scoexp_res_cc$gs[[1]]), G='K1'), 
                           data.frame(gene=c(brain_celltrek_l5_scoexp_res_cc$gs[[2]]), G='K2')) %>% 
                           set_rownames(.$gene) %>% dplyr::select(-1)
pheatmap::pheatmap(brain_celltrek_l5_scoexp_res_cc$wcor[rownames(brain_celltrek_l5_k), rownames(brain_celltrek_l5_k)], 
                   clustering_method='ward.D2', annotation_row=brain_celltrek_l5_k, show_rownames=F, show_colnames=F, 
                   treeheight_row=10, treeheight_col=10, annotation_legend = T, fontsize=8,
                   color=viridis(10), main='L5 IT spatial co-expression')
圖片.png
We identified two distinct modules. Based on our identified co-expression modules, we can calculated the module scores.
brain_celltrek_l5 <- AddModuleScore(brain_celltrek_l5, features=brain_celltrek_l5_scoexp_res_cc$gs, name='CC_', nbin=10, ctrl=50, seed=42)
## First we look into the coexpression module based on the scRNA-seq embedding
FeaturePlot(brain_celltrek_l5, grep('CC_', colnames(brain_celltrek_l5@meta.data), value=T))
圖片.png
Next we investigate the module scores at the spatial level.
SpatialFeaturePlot(brain_celltrek_l5, grep('CC_', colnames(brain_celltrek_l5@meta.data), value=T))

生活很好,有你更好

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末锋爪,一起剝皮案震驚了整個(gè)濱河市丙曙,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌其骄,老刑警劉巖亏镰,帶你破解...
    沈念sama閱讀 206,013評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異拯爽,居然都是意外死亡索抓,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門毯炮,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)逼肯,“玉大人,你說(shuō)我怎么就攤上這事桃煎『嚎螅” “怎么了?”我有些...
    開(kāi)封第一講書人閱讀 152,370評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵备禀,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我奈揍,道長(zhǎng)曲尸,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書人閱讀 55,168評(píng)論 1 278
  • 正文 為了忘掉前任男翰,我火速辦了婚禮另患,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘蛾绎。我一直安慰自己昆箕,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,153評(píng)論 5 371
  • 文/花漫 我一把揭開(kāi)白布租冠。 她就那樣靜靜地躺著鹏倘,像睡著了一般。 火紅的嫁衣襯著肌膚如雪顽爹。 梳的紋絲不亂的頭發(fā)上纤泵,一...
    開(kāi)封第一講書人閱讀 48,954評(píng)論 1 283
  • 那天,我揣著相機(jī)與錄音镜粤,去河邊找鬼捏题。 笑死玻褪,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的公荧。 我是一名探鬼主播带射,決...
    沈念sama閱讀 38,271評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼循狰!你這毒婦竟也來(lái)了窟社?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書人閱讀 36,916評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤晤揣,失蹤者是張志新(化名)和其女友劉穎桥爽,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體昧识,經(jīng)...
    沈念sama閱讀 43,382評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡钠四,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,877評(píng)論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了跪楞。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片缀去。...
    茶點(diǎn)故事閱讀 37,989評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡一汽,死狀恐怖欢搜,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情灼捂,我是刑警寧澤池户,帶...
    沈念sama閱讀 33,624評(píng)論 4 322
  • 正文 年R本政府宣布咏雌,位于F島的核電站,受9級(jí)特大地震影響校焦,放射性物質(zhì)發(fā)生泄漏赊抖。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,209評(píng)論 3 307
  • 文/蒙蒙 一寨典、第九天 我趴在偏房一處隱蔽的房頂上張望氛雪。 院中可真熱鬧,春花似錦耸成、人聲如沸报亩。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 30,199評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)弦追。三九已至,卻和暖如春花竞,著一層夾襖步出監(jiān)牢的瞬間骗卜,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 31,418評(píng)論 1 260
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留寇仓,地道東北人举户。 一個(gè)月前我還...
    沈念sama閱讀 45,401評(píng)論 2 352
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像遍烦,于是被迫代替她去往敵國(guó)和親俭嘁。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,700評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容