空間轉(zhuǎn)錄組學(xué)是一個(gè)迅速發(fā)展的領(lǐng)域算芯,有望以單細(xì)胞或亞細(xì)胞分辨率全面表征組織結(jié)構(gòu)。計(jì)算方法的發(fā)展對(duì)從原始數(shù)據(jù)中提取生物信號(hào)起著重要作用;下游分析工具將空間組織和細(xì)胞間通信描述為可量化屬性,并提供算法來(lái)推導(dǎo)此類屬性叉存;集成管道進(jìn)一步將多個(gè)工具組合在一個(gè)包中,使生物學(xué)家能夠方便地從頭到尾分析數(shù)據(jù)度帮。
近日歼捏,來(lái)自美國(guó)的研究人員在《Genome Research》發(fā)表Perspective,總結(jié)了空間轉(zhuǎn)錄組數(shù)據(jù)分析方法和管道的最新進(jìn)展笨篷,并討論了它們?nèi)绾卧诓煌募夹g(shù)平臺(tái)上運(yùn)作瞳秽。
注:不同于綜述文章,Perspective中的描述和觀點(diǎn)會(huì)相對(duì)主觀率翅,如有不同意見(jiàn)建議與作者交流Corresponding authors: rdries@bu.edu, guo-cheng.yuan@mssm.edu练俐。
無(wú)論目前空間轉(zhuǎn)錄組技術(shù)的差異如何,空間轉(zhuǎn)錄組分析的共同目標(biāo)是連接和整合來(lái)自基因表達(dá)和細(xì)胞或轉(zhuǎn)錄位置的信息冕臭。這對(duì)于提取有用的生物信息腺晾、與細(xì)胞形態(tài)聯(lián)系以及產(chǎn)生新的假設(shè)至關(guān)重要。
從空間轉(zhuǎn)錄組數(shù)據(jù)中識(shí)別細(xì)胞類型
細(xì)胞類型識(shí)別和定位可能是空間轉(zhuǎn)錄組數(shù)據(jù)分析的最基本任務(wù)辜贵。
如果數(shù)據(jù)具有單細(xì)胞分辨率悯蝉,例如在multiplexed FISH方法中,無(wú)監(jiān)督聚類與手動(dòng)或自動(dòng)注釋相結(jié)合是以無(wú)偏方式識(shí)別細(xì)胞類型的常用方法托慨。由于細(xì)胞類型識(shí)別不需要空間信息鼻由,因此該任務(wù)與scRNA-seq分析非常相似,已經(jīng)為其開(kāi)發(fā)了許多方法厚棵,例如Louvain蕉世、Leiden clustering是細(xì)胞類型識(shí)別的常用選擇,其中聚類結(jié)果被用作初始指導(dǎo)婆硬,隨后通常是繁瑣的手工注釋或自動(dòng)分析流程狠轻。
當(dāng)數(shù)據(jù)不足以以無(wú)偏的方式發(fā)現(xiàn)未知細(xì)胞類型時(shí),研究人員通常會(huì)利用額外的scRNA-seq分析對(duì)基因特征已知的細(xì)胞類型進(jìn)行注釋彬犯。雖然最簡(jiǎn)單的方法是確定基因特征具有最高相關(guān)性的細(xì)胞類型向楼,但缺點(diǎn)是它不能將細(xì)胞類型標(biāo)記基因與轉(zhuǎn)錄組背景區(qū)分開(kāi)來(lái)。為了優(yōu)化精度躏嚎,已經(jīng)開(kāi)發(fā)了許多計(jì)算方法,例如一種方法是基于scRNA-seq數(shù)據(jù)建立一個(gè)支持向量機(jī)分類器菩貌,但只使用來(lái)自seqFISH中也被分析的基因子集的信息卢佣。也可以使用似然比檢驗(yàn)。重要的是箭阶,需要跨平臺(tái)歸一化來(lái)校準(zhǔn)從不同技術(shù)檢測(cè)到的信號(hào)虚茶。更普遍的是戈鲁,可以估計(jì)和減少平臺(tái)特有的技術(shù)變化。此外嘹叫,已經(jīng)開(kāi)發(fā)了貝葉斯模型婆殿,以考慮細(xì)胞分割不確定性對(duì)細(xì)胞類型注釋的影響。
商用的基于陣列的空間轉(zhuǎn)錄組技術(shù)(如10x Genomics Visium和NanoString GeoMx)通常沒(méi)有單細(xì)胞分辨率罩扇。由于基因表達(dá)譜的變化可能與細(xì)胞類型組成的變化相關(guān)婆芦,而不是與新的細(xì)胞類型相關(guān),因此不適合將聚類算法直接應(yīng)用于此類數(shù)據(jù)并將產(chǎn)生的聚類解釋為細(xì)胞類型喂饥。此外消约,只有在已知潛在基因表達(dá)特征的情況下,才有可能估計(jì)細(xì)胞類型組成员帮。有兩種估計(jì)細(xì)胞類型組成的一般方法:第一種方法是評(píng)估細(xì)胞類型特異性標(biāo)志物在每個(gè)點(diǎn)的表達(dá)基因中的富集程度或粮;第二種方法去卷積,旨在定量地估計(jì)每個(gè)位置不同細(xì)胞類型的比例捞高。許多去卷積方法已經(jīng)被開(kāi)發(fā)出來(lái)氯材,并為RNA-seq數(shù)據(jù)分析提供了基準(zhǔn)。原則上硝岗,這些工具也可用于空間轉(zhuǎn)錄組分析氢哮,但考慮到空間轉(zhuǎn)錄組數(shù)據(jù)具有某些獨(dú)特的性質(zhì)。因此辈讶,使用為空間轉(zhuǎn)錄組分析量身定制的方法通常更準(zhǔn)確命浴,例如RCTD、stereoscope贱除、Cell2location生闲、SpatialDWLS、SPOTlight等月幌。
研究細(xì)胞類型定位的一種補(bǔ)充方法是使用scRNA-seq數(shù)據(jù)作為起點(diǎn)碍讯,然后基于與空間表達(dá)譜的相似性重構(gòu)空間信息。隨著空間轉(zhuǎn)錄組技術(shù)在過(guò)去幾年中的快速發(fā)展扯躺,現(xiàn)在可以直接測(cè)量空間信息捉兴,并進(jìn)一步與scRNA-seq數(shù)據(jù)集成以進(jìn)行進(jìn)一步完善。因此录语,較新的方法以更平衡的方式集成scRNA-seq和空間轉(zhuǎn)錄組數(shù)據(jù)倍啥,例如一個(gè)平臺(tái)無(wú)關(guān)的相互最近鄰算法(MNN)已被用于對(duì)齊這些數(shù)據(jù)類型,從而形成細(xì)胞位置映射澎埠;DEEPsc使用人工神經(jīng)網(wǎng)絡(luò)來(lái)預(yù)測(cè)空間位置虽缕;GLUER結(jié)合NMF、MNN算法和深度神經(jīng)網(wǎng)絡(luò)來(lái)對(duì)齊數(shù)據(jù)蒲稳,Tangram對(duì)齊scRNA-seq和空間轉(zhuǎn)錄組數(shù)據(jù)集氮趋,同時(shí)優(yōu)化scRNA-seq數(shù)據(jù)和空間數(shù)據(jù)中每個(gè)基因的空間相關(guān)性(類似的方法還有NovaSparc和D-CE)伍派,Tangram對(duì)齊的確定性模式也可以作為一種去卷積方法。
表征轉(zhuǎn)錄組譜的空間模式
空間轉(zhuǎn)錄組分析的關(guān)鍵貢獻(xiàn)不僅在于描述細(xì)胞類型剩胁,還在于描述它們的空間組織方式诉植。這對(duì)于研究組織結(jié)構(gòu)和細(xì)胞-細(xì)胞相互作用的影響至關(guān)重要£枪郏可以使用成對(duì)富集分析(pair-wise enrichment analysis)來(lái)識(shí)別可能相鄰的細(xì)胞類型對(duì)晾腔。細(xì)胞領(lǐng)域模式分析可識(shí)別多細(xì)胞類型鄰域的重復(fù)模式。另一種識(shí)別富集模式的方法是使用topic models索昂。此外建车,細(xì)胞狀態(tài)的連續(xù)性可以被納入隱馬爾科夫隨機(jī)場(chǎng)(HMRF)模型,以識(shí)別連貫的空間域椒惨。BayesSpace使用來(lái)自空間鄰域的信息來(lái)增強(qiáng)空間轉(zhuǎn)錄組數(shù)據(jù)的分辨率并進(jìn)行聚類分析缤至。而SPICEMIX將HMRF與NMF相結(jié)合。staNMF將NMF與穩(wěn)定性準(zhǔn)則研究相結(jié)合康谆,識(shí)別空間模式领斥。
許多工具根據(jù)預(yù)先定義的過(guò)程對(duì)基因表達(dá)的空間模式進(jìn)行建模,例如spatialDE沃暗、SOMDE月洛、Trendsceek、SPARK孽锥、binSpect等嚼黔。其中,作為一個(gè)具體的例子惜辑,binSpect被用來(lái)識(shí)別MERFISH冠狀腦切片數(shù)據(jù)中具有空間一致性模式的基因唬涧,排名靠前的基因顯示上圖F。
亞細(xì)胞結(jié)構(gòu)分析
隨著新技術(shù)的進(jìn)步盛撑,現(xiàn)在可以實(shí)現(xiàn)亞細(xì)胞轉(zhuǎn)錄物的研究碎节。除了基于FISH的方法(眾所周知這些方法具有單分子分辨率),ISS方法也提供非常高的分辨率抵卫。此外狮荔,高密度陣列或基于珠子的技術(shù)還實(shí)現(xiàn)了亞細(xì)胞分辨率。
已經(jīng)開(kāi)發(fā)了許多方法來(lái)使用亞細(xì)胞基因表達(dá)模式來(lái)規(guī)避細(xì)胞分割介粘,例如SSAM殖氏、stLearn、Spage2vec等姻采⊙挪桑基于已知細(xì)胞類型特異性特征的監(jiān)督細(xì)胞類型映射策略已經(jīng)開(kāi)發(fā)出來(lái),例如使用樸素貝葉斯模型為HDST數(shù)據(jù)分配細(xì)胞類型。亞細(xì)胞基因表達(dá)模式反過(guò)來(lái)可以用來(lái)改善細(xì)胞分割总滩,例如Baysor、Sparcle巡雨、JTSA等闰渔。
對(duì)基因表達(dá)的亞細(xì)胞模式的分析也可以提供新的生物學(xué)見(jiàn)解。例如已經(jīng)開(kāi)發(fā)了一種原位RNA速度方法铐望,以使用亞細(xì)胞RNA定位信息來(lái)推斷轉(zhuǎn)錄率冈涧。
此外,通過(guò)使用過(guò)氧化物酶APEX2(一種稱為APEX-seq的方法)對(duì)RNA進(jìn)行直接鄰近標(biāo)記正蛙,可以高分辨率地識(shí)別細(xì)胞質(zhì)中的共定位mRNA物種督弓。此外,在核位置富集的mRNAs傾向于編碼在核斑點(diǎn)和核質(zhì)中富集的蛋白質(zhì)乒验∮匏恚或者,也可以通過(guò)ATLAS-seq檢測(cè)亞細(xì)胞RNA共定位锻全。
了解細(xì)胞如何與組織環(huán)境溝通?
空間轉(zhuǎn)錄組分析的一個(gè)重要目標(biāo)是研究細(xì)胞如何與組織環(huán)境通信狂塘。Giotto引入了一種雙向比較方法,通過(guò)比較同一細(xì)胞類型內(nèi)但被不同相鄰細(xì)胞包圍的細(xì)胞亞群之間的基因表達(dá)模式來(lái)識(shí)別相互作用改變的基因鳄厌。值得注意的是荞胡,與單獨(dú)使用基因表達(dá)信息相比,使用空間信息可以顯著減少假陽(yáng)性配體-受體活性預(yù)測(cè)的數(shù)量了嚎。CellPhoneDB v3.0中使用了類似的方法泪漂。為了克服空間轉(zhuǎn)錄組數(shù)據(jù)沒(méi)有單細(xì)胞分辨率這一挑戰(zhàn),研究人員應(yīng)用Cell2location來(lái)推斷不同細(xì)胞類型的位置歪泳,然后比較與不同細(xì)胞鄰域相關(guān)的基因表達(dá)模式萝勤。其他方法也被用來(lái)量化相鄰細(xì)胞類型的影響,包括convolutional neural networks夹囚、optimal transport和multioutput regression纵刘。另一種方法是將基因表達(dá)譜明確分解為空間和非空間成分,然后利用鄰域的細(xì)胞類型組成來(lái)估計(jì)空間成分荸哟。配體-受體相互作用的分析也被擴(kuò)展到包括多單位蛋白復(fù)合物中輔助因子的影響假哎,以提高預(yù)測(cè)的準(zhǔn)確性。值得注意的是鞍历,還開(kāi)發(fā)了從細(xì)胞-細(xì)胞相互作用模式重建空間位置的算法舵抹。
用于空間數(shù)據(jù)分析和可視化的綜合探索性工具?
生物學(xué)家將受益于集成和交互式管道,允許他們執(zhí)行各種分析步驟劣砍,從原始數(shù)據(jù)導(dǎo)入到圖像分析惧蛹,然后生成最終分析結(jié)果和可視化圖像,這些操作最好是在個(gè)人計(jì)算機(jī)上完成。目前香嗓,有許多綜合工具包可用迅腔,例如Giotto、Seurat靠娱、Squidpy等沧烈。
這些軟件包或工具箱大多是由獨(dú)立的實(shí)驗(yàn)室開(kāi)發(fā)的,這就導(dǎo)致了多個(gè)不同的數(shù)據(jù)結(jié)構(gòu)不一定共享相同的數(shù)據(jù)格式像云。為了克服其中的一些挑戰(zhàn)锌雀,R/Bioconductor社區(qū)正致力于精心設(shè)計(jì)普遍適用的數(shù)據(jù)結(jié)構(gòu),并在最近發(fā)布了spatialExperiment類的第一個(gè)版本迅诬。這是一個(gè)新的S4類腋逆,擴(kuò)展了流行的singleCellExperiment類,旨在與幾種類型的空間轉(zhuǎn)錄組數(shù)據(jù)集一起操作侈贷,包括多細(xì)胞和亞細(xì)胞分辨率惩歉。已經(jīng)有幾個(gè)空間R包使用這種數(shù)據(jù)結(jié)構(gòu),如SpatialLIBD和Spaniel俏蛮,它們都擅長(zhǎng)于創(chuàng)建交互式R/Shiny應(yīng)用程序來(lái)可視化空間轉(zhuǎn)錄組數(shù)據(jù)集柬泽。
近年來(lái)空間組學(xué)領(lǐng)域取得了很多進(jìn)展。新的方法已經(jīng)被開(kāi)發(fā)出來(lái)以應(yīng)對(duì)各種特定的空間轉(zhuǎn)錄組挑戰(zhàn)嫁蛇。綜合性的軟件包使生物學(xué)家能夠輕松地從頭到尾分析他們自己的數(shù)據(jù)锨并,并通過(guò)交互式可視化對(duì)數(shù)據(jù)進(jìn)行互動(dòng)探索。這些工具在使空間轉(zhuǎn)錄組技術(shù)廣泛適用方面發(fā)揮了重要作用睬棚。
近年來(lái)第煮,出現(xiàn)了一種范式的轉(zhuǎn)變,即根據(jù)轉(zhuǎn)錄組圖譜對(duì)細(xì)胞類型進(jìn)行分類抑党,有時(shí)還輔以其他分子模式包警。由于ST技術(shù)的快速發(fā)展,現(xiàn)在可以對(duì)同一細(xì)胞同時(shí)進(jìn)行轉(zhuǎn)錄組分析和形態(tài)學(xué)分析底靠,從而為系統(tǒng)研究這兩種根本不同的方法之間的關(guān)系提供了很好的機(jī)會(huì)害晦。
一個(gè)令人興奮的新方向是空間多元組學(xué)。新技術(shù)的發(fā)展使得在保存蛋白質(zhì)和RNA暑中、內(nèi)含子和成熟mRNA壹瘟、DNA和RNA等信息的同時(shí),可以分析同一細(xì)胞中的多種形態(tài)信息鳄逾。這些技術(shù)使分析不同分子模式之間的相關(guān)性成為可能稻轨,并提供了機(jī)理上的見(jiàn)解。分析這些數(shù)據(jù)需要開(kāi)發(fā)新的計(jì)算方法和工具包雕凹。
【來(lái)自小編的插播】歡迎訂閱或收藏???時(shí)空組/空間組學(xué)專題(點(diǎn)擊可直接訪問(wèn))殴俱,及時(shí)查收最新研究進(jìn)展政冻。
首發(fā)公號(hào):國(guó)家基因庫(kù)大數(shù)據(jù)平臺(tái)
參考文獻(xiàn)
Dries R, Chen J, Del Rossi N, et al. Advances in spatial transcriptomic data analysis[J]. Genome Research, 2021, 31(10): 1706-1718.
圖片均來(lái)源于參考文獻(xiàn),如有侵權(quán)請(qǐng)聯(lián)系刪除线欲。