hello剑勾,又是一周床估,周二了弯囊,最近事情很多,所以祝大家生活快樂(lè)胶果,我們來(lái)繼續(xù)看一下10X單細(xì)胞空間聯(lián)合分析的內(nèi)容匾嘱,參考文獻(xiàn)在Benchmarking spatial and single-cell transcriptomics integration methods for transcript distribution prediction and cell type deconvolution,于2022年5月16日在線發(fā)表于國(guó)際知名學(xué)術(shù)期刊Nature Methods,文中系統(tǒng)性評(píng)估了16種空間轉(zhuǎn)錄組和單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)整合算法在預(yù)測(cè)基因或細(xì)胞類型空間分布方面的性能。
大家也可以參考我之前的一篇文章10X單細(xì)胞空間聯(lián)合分析方法匯總及算法總結(jié)
細(xì)胞在組織器官內(nèi)所處的空間位置對(duì)于它發(fā)揮特異性功能至關(guān)重要早抠。近年來(lái)霎烙,研究者開(kāi)發(fā)了多種空間轉(zhuǎn)錄組技術(shù)可以在保留細(xì)胞精確空間定位的同時(shí),檢測(cè)細(xì)胞內(nèi)全轉(zhuǎn)錄組的表達(dá)蕊连,以此來(lái)研究在發(fā)育或疾病發(fā)生發(fā)展過(guò)程中起關(guān)鍵性作用的細(xì)胞亞群及其分子機(jī)制悬垃。然而,現(xiàn)有的空間轉(zhuǎn)錄組學(xué)技術(shù)存在兩個(gè)不足:1.基于測(cè)序的空間轉(zhuǎn)錄組技術(shù)無(wú)法實(shí)現(xiàn)真正意義上的單細(xì)胞分辨率甘苍;2.基于成像空間轉(zhuǎn)錄組的技術(shù)能檢測(cè)到的基因通量有限尝蠕。為了突破技術(shù)的局限性,生物信息學(xué)家設(shè)計(jì)了多種算法整合空間轉(zhuǎn)錄組與單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)载庭,預(yù)測(cè)細(xì)胞類型的空間分布和/或單個(gè)細(xì)胞的完整轉(zhuǎn)錄組信息看彼。這些算法大大加深了我們對(duì)空間轉(zhuǎn)錄組學(xué)數(shù)據(jù)及相關(guān)生物學(xué)和病理過(guò)程的理解。然而囚聚,由于不同算法的工作原理和適用范圍存在顯著差異靖榕,使得研究者很難選擇最佳算法用來(lái)預(yù)測(cè)細(xì)胞類型和基因表達(dá)的空間分布。
瞿昆教授課題組長(zhǎng)期致力于開(kāi)發(fā)生物大數(shù)據(jù)分析算法和軟件顽铸。在此項(xiàng)研究中茁计,課題組收集了45對(duì)同一組織來(lái)源的空間轉(zhuǎn)錄組與單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)集,和32個(gè)模擬數(shù)據(jù)集谓松,并設(shè)計(jì)了多種指標(biāo)星压,從準(zhǔn)確性、魯棒性鬼譬、計(jì)算資源耗時(shí)等多維度系統(tǒng)性評(píng)估了16種整合算法的性能租幕。
結(jié)果顯示,Cell2location拧簸、SpatialDWLS和RCTD算法能更加準(zhǔn)確的預(yù)測(cè)細(xì)胞類型的空間分布劲绪;Tangram、gimVI和SpaGE算法是預(yù)測(cè)基因表達(dá)空間分布的最佳算法盆赤。Tangram贾富、Seurat和LIGER計(jì)算效率相對(duì)較高,適合處理大規(guī)模數(shù)據(jù)集牺六。該研究工作總結(jié)了每種算法的屬性颤枪、性能和適用性,總結(jié)了高效算法的優(yōu)勢(shì)淑际,為研究人員進(jìn)一步提升算法性能提供了參考畏纲;并在github上提供了整合空間轉(zhuǎn)錄組和單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)的分析流程扇住,以幫助研究人員為處理自己的數(shù)據(jù)選擇最佳的分析工具。
單細(xì)胞空間聯(lián)合的方法(這些整合方法使研究人員能夠預(yù)測(cè)未檢測(cè)到的轉(zhuǎn)錄本的空間分布)
聯(lián)合方法 | 特點(diǎn) |
---|---|
gimVI | employs a deep generative model to infer the likely spatial distribution of undetected transcripts |
SpaGE | uses the domain adaptation algorithm PRECISE and k-nearest-neighbor regression to predict the spatial distribution of undetected transcripts |
Tangram | uses non-convex optimization and a deep learning framework to learn a spatial alignment for scRNA-seq data |
Seurat | applies canonical correlation analysis to embed spatial and scRNA-seq data into a common latent space, and projects cells from scRNA-seq data to the spots of the spatial transcriptomics data |
LIGER | uses both integrative non-negative matrix factorization and shared factor neighborhood graphs to predict gene expression levels in space |
novoSpaRc and SpaOTsc | use optimal transport methods to construct spatial metrics of cells on the basis of scRNA-seq data |
stPlus | ombines the auto-encoder and weighted k-nearest-neighbor methods to predict spatial gene expression |
此外盗胀,Seurat艘蹋、Tangram、novoSpaRc 和 SpaOTsc 能夠?qū)?scRNA-seq 數(shù)據(jù)中的細(xì)胞分配到組織切片中的空間位置票灰;這對(duì)于提高使用空間轉(zhuǎn)錄組學(xué)方法(如 ST 或 10X Visium)生成的空間轉(zhuǎn)錄組學(xué)數(shù)據(jù)的分辨率非常有用女阀。
聯(lián)合方法 | 特點(diǎn) |
---|---|
Cell2location | uses the gene expression signature of the cell subpopulations in scRNA-seq data to estimate the abundance of each cell type at each spot |
RCTD | applies cell type profiles learned from scRNA-seq data and supervised learning to decompose cell type mixtures |
SpatialDWLS | adopts the weighted-least-squares approach to infer cell type composition |
Stereoscope | leverages the model-based probabilistic method and scRNA-seq data to deconvolve the cell mixtures in spatial data |
SPOTlight | applies the seeded non-negative matrix factorization for the deconvolution of spots |
DSTG | deconvolutes spatial transcriptomics data using graph-based convolutional networks |
STRIDE | uses the topic profiles trained from scRNA-seq data to decompose cell types from spatial mixtures |
DestVI | adopts the variational inference and latent variable models to delineate cell type proportions |
這些整合方法使研究人員能夠預(yù)測(cè)組織切片中spot的細(xì)胞類型組成
這些整合方法的出現(xiàn)無(wú)疑加深了對(duì)空間轉(zhuǎn)錄組學(xué)數(shù)據(jù)及相關(guān)生物學(xué)和病理過(guò)程的理解。然而屑迂,沒(méi)有獨(dú)立研究全面比較這些整合方法在預(yù)測(cè)轉(zhuǎn)錄物空間分布或組織切片中斑點(diǎn)的細(xì)胞類型去卷積方面的性能浸策。在這里,使用多個(gè)指標(biāo)系統(tǒng)地對(duì) 16 種集成方法的性能進(jìn)行基準(zhǔn)測(cè)試惹盼,這些方法可以預(yù)測(cè)未檢測(cè)到的轉(zhuǎn)錄物的空間分布庸汗,或組織切片中斑點(diǎn)的細(xì)胞類型組成,基于對(duì)包含空間轉(zhuǎn)錄組學(xué)數(shù)據(jù)的 45 個(gè)配對(duì)數(shù)據(jù)集的處理和 scRNA-seq 數(shù)據(jù)和 32 個(gè)模擬數(shù)據(jù)集手报。評(píng)估了每種整合方法在預(yù)測(cè)轉(zhuǎn)錄本空間分布方面的準(zhǔn)確性蚯舱,包括從原始數(shù)據(jù)集中下采樣的稀疏空間轉(zhuǎn)錄組學(xué)數(shù)據(jù)。還根據(jù)數(shù)據(jù)集的模擬評(píng)估了組織切片中斑點(diǎn)的細(xì)胞類型去卷積的整合方法的準(zhǔn)確性昧诱,其中每個(gè)斑點(diǎn)可以包含多個(gè)不同類型的細(xì)胞。最后所袁,評(píng)估了每種集成方法消耗的計(jì)算資源盏档。研究結(jié)果可以幫助研究人員為他們的數(shù)據(jù)集選擇合適的集成方法,并且他們提出了一些有趣的問(wèn)題燥爷,即各種處理和數(shù)據(jù)集特定屬性如何影響這些工具在空間轉(zhuǎn)錄組學(xué)研究中的集成性能蜈亩。
生活很好,有你更好