作者仁烹,Evil Genius
國慶第一天耸弄,我們不搞新的,來一篇大盤點卓缰,盤點的內(nèi)容包括以下的幾點计呈,包括應(yīng)用與技術(shù),大家也要隨時進行總結(jié)征唬。
之前總結(jié)過兩篇捌显,放在這里,希望大家一起學(xué)習(xí)总寒,多多交流
10X空間轉(zhuǎn)錄組重點分析合集2
10X空間轉(zhuǎn)錄組重點分析合集
這一篇合集包括的內(nèi)容如下:一些內(nèi)容是總結(jié)扶歪,另外一些是運用場景。
- 空間轉(zhuǎn)錄組數(shù)據(jù)分析方法最新進展
- 空間轉(zhuǎn)錄組技術(shù)在腫瘤免疫治療中的應(yīng)用潛力
- 空間高變基因
- 空間轉(zhuǎn)錄組聚類方法討論(重點在BayesSpace)
- 利用空間轉(zhuǎn)錄組技術(shù)探索組織結(jié)構(gòu)
- 單細(xì)胞空間聯(lián)合分析合集(重點介紹國產(chǎn)軟件STRIDE & DSTG & SpatialDWLS & stereoscope)
- 空間轉(zhuǎn)錄組數(shù)據(jù)集分析轉(zhuǎn)座因子表達(dá)
第一章摄闸,空間轉(zhuǎn)錄組數(shù)據(jù)分析方法最新進展
空間轉(zhuǎn)錄組學(xué)是一個迅速發(fā)展的領(lǐng)域善镰,有望以單細(xì)胞或亞細(xì)胞分辨率全面表征組織結(jié)構(gòu)。計算方法的發(fā)展對從原始數(shù)據(jù)中提取生物信號起著重要作用年枕;下游分析工具將空間組織和細(xì)胞間通信描述為可量化屬性炫欺,并提供算法來推導(dǎo)此類屬性;集成管道進一步將多個工具組合在一個包中熏兄,使生物學(xué)家能夠方便地從頭到尾分析數(shù)據(jù)品洛。
近日树姨,來自美國的研究人員在《Genome Research》發(fā)表Perspective,總結(jié)了空間轉(zhuǎn)錄組數(shù)據(jù)分析方法和管道的最新進展毫别,并討論了它們?nèi)绾卧诓煌募夹g(shù)平臺上運作。
- 注:不同于綜述文章典格,Perspective中的描述和觀點會相對主觀岛宦。
無論目前空間轉(zhuǎn)錄組技術(shù)的差異如何,空間轉(zhuǎn)錄組分析的共同目標(biāo)是連接和整合來自基因表達(dá)和細(xì)胞或轉(zhuǎn)錄位置的信息耍缴。這對于提取有用的生物信息砾肺、與細(xì)胞形態(tài)聯(lián)系以及產(chǎn)生新的假設(shè)至關(guān)重要。
空間轉(zhuǎn)錄組學(xué)分析方法概述
從空間轉(zhuǎn)錄組數(shù)據(jù)中識別細(xì)胞類型
細(xì)胞類型識別和定位可能是空間轉(zhuǎn)錄組數(shù)據(jù)分析的最基本任務(wù)防嗡。
利用空間轉(zhuǎn)錄組數(shù)據(jù)進行細(xì)胞類型鑒定的策略
如果數(shù)據(jù)具有單細(xì)胞分辨率变汪,例如在multiplexed FISH方法中,無監(jiān)督聚類與手動或自動注釋相結(jié)合是以無偏方式識別細(xì)胞類型的常用方法蚁趁。由于細(xì)胞類型識別不需要空間信息裙盾,因此該任務(wù)與scRNA-seq分析非常相似,已經(jīng)為其開發(fā)了許多方法他嫡,例如Louvain番官、Leiden clustering是細(xì)胞類型識別的常用選擇,其中聚類結(jié)果被用作初始指導(dǎo)钢属,隨后通常是繁瑣的手工注釋或自動分析流程徘熔。
當(dāng)數(shù)據(jù)不足以以無偏的方式發(fā)現(xiàn)未知細(xì)胞類型時,研究人員通常會利用額外的scRNA-seq分析對基因特征已知的細(xì)胞類型進行注釋淆党。雖然最簡單的方法是確定基因特征具有最高相關(guān)性的細(xì)胞類型酷师,但缺點是它不能將細(xì)胞類型標(biāo)記基因與轉(zhuǎn)錄組背景區(qū)分開來。為了優(yōu)化精度染乌,已經(jīng)開發(fā)了許多計算方法山孔,例如一種方法是基于scRNA-seq數(shù)據(jù)建立一個支持向量機分類器,但只使用來自seqFISH中也被分析的基因子集的信息荷憋。也可以使用似然比檢驗饱须。重要的是,需要跨平臺歸一化來校準(zhǔn)從不同技術(shù)檢測到的信號台谊。更普遍的是蓉媳,可以估計和減少平臺特有的技術(shù)變化。此外锅铅,已經(jīng)開發(fā)了貝葉斯模型酪呻,以考慮細(xì)胞分割不確定性對細(xì)胞類型注釋的影響鄙皇。
商用的基于陣列的空間轉(zhuǎn)錄組技術(shù)(如10x Genomics Visium和NanoString GeoMx)通常沒有單細(xì)胞分辨率鸭廷。由于基因表達(dá)譜的變化可能與細(xì)胞類型組成的變化相關(guān)柄错,而不是與新的細(xì)胞類型相關(guān),因此不適合將聚類算法直接應(yīng)用于此類數(shù)據(jù)并將產(chǎn)生的聚類解釋為細(xì)胞類型缓溅。此外,只有在已知潛在基因表達(dá)特征的情況下润绵,才有可能估計細(xì)胞類型組成葫慎。有兩種估計細(xì)胞類型組成的一般方法:第一種方法是評估細(xì)胞類型特異性標(biāo)志物在每個點的表達(dá)基因中的富集程度;第二種方法去卷積女坑,旨在定量地估計每個位置不同細(xì)胞類型的比例填具。許多去卷積方法已經(jīng)被開發(fā)出來,并為RNA-seq數(shù)據(jù)分析提供了基準(zhǔn)匆骗。原則上劳景,這些工具也可用于空間轉(zhuǎn)錄組分析,但考慮到空間轉(zhuǎn)錄組數(shù)據(jù)具有某些獨特的性質(zhì)碉就。因此盟广,使用為空間轉(zhuǎn)錄組分析量身定制的方法通常更準(zhǔn)確,例如RCTD瓮钥、stereoscope筋量、Cell2location、SpatialDWLS碉熄、SPOTlight等毛甲。
研究細(xì)胞類型定位的一種補充方法是使用scRNA-seq數(shù)據(jù)作為起點,然后基于與空間表達(dá)譜的相似性重構(gòu)空間信息具被。隨著空間轉(zhuǎn)錄組技術(shù)在過去幾年中的快速發(fā)展玻募,現(xiàn)在可以直接測量空間信息,并進一步與scRNA-seq數(shù)據(jù)集成以進行進一步完善一姿。因此七咧,較新的方法以更平衡的方式集成scRNA-seq和空間轉(zhuǎn)錄組數(shù)據(jù),例如一個平臺無關(guān)的相互最近鄰算法(MNN)已被用于對齊這些數(shù)據(jù)類型叮叹,從而形成細(xì)胞位置映射艾栋;DEEPsc使用人工神經(jīng)網(wǎng)絡(luò)來預(yù)測空間位置;GLUER結(jié)合NMF蛉顽、MNN算法和深度神經(jīng)網(wǎng)絡(luò)來對齊數(shù)據(jù)蝗砾,Tangram對齊scRNA-seq和空間轉(zhuǎn)錄組數(shù)據(jù)集,同時優(yōu)化scRNA-seq數(shù)據(jù)和空間數(shù)據(jù)中每個基因的空間相關(guān)性(類似的方法還有NovaSparc和D-CE)携冤,Tangram對齊的確定性模式也可以作為一種去卷積方法悼粮。
表征轉(zhuǎn)錄組譜的空間模式
空間模式分析
空間轉(zhuǎn)錄組分析的關(guān)鍵貢獻不僅在于描述細(xì)胞類型,還在于描述它們的空間組織方式曾棕。這對于研究組織結(jié)構(gòu)和細(xì)胞-細(xì)胞相互作用的影響至關(guān)重要扣猫。可以使用成對富集分析(pair-wise enrichment analysis)來識別可能相鄰的細(xì)胞類型對翘地。細(xì)胞領(lǐng)域模式分析可識別多細(xì)胞類型鄰域的重復(fù)模式申尤。另一種識別富集模式的方法是使用topic models癌幕。此外,細(xì)胞狀態(tài)的連續(xù)性可以被納入隱馬爾科夫隨機場(HMRF)模型昧穿,以識別連貫的空間域勺远。BayesSpace使用來自空間鄰域的信息來增強空間轉(zhuǎn)錄組數(shù)據(jù)的分辨率并進行聚類分析。而SPICEMIX將HMRF與NMF相結(jié)合时鸵。staNMF將NMF與穩(wěn)定性準(zhǔn)則研究相結(jié)合胶逢,識別空間模式。
許多工具根據(jù)預(yù)先定義的過程對基因表達(dá)的空間模式進行建模寥枝,例如spatialDE宪塔、SOMDE磁奖、Trendsceek囊拜、SPARK、binSpect等比搭。其中冠跷,作為一個具體的例子,binSpect被用來識別MERFISH冠狀腦切片數(shù)據(jù)中具有空間一致性模式的基因身诺,排名靠前的基因顯示上圖F蜜托。
亞細(xì)胞結(jié)構(gòu)分析
隨著新技術(shù)的進步,現(xiàn)在可以實現(xiàn)亞細(xì)胞轉(zhuǎn)錄物的研究霉赡。除了基于FISH的方法(眾所周知這些方法具有單分子分辨率)橄务,ISS方法也提供非常高的分辨率。此外穴亏,高密度陣列或基于珠子的技術(shù)還實現(xiàn)了亞細(xì)胞分辨率蜂挪。
已經(jīng)開發(fā)了許多方法來使用亞細(xì)胞基因表達(dá)模式來規(guī)避細(xì)胞分割,例如SSAM嗓化、stLearn棠涮、Spage2vec等〈谈玻基于已知細(xì)胞類型特異性特征的監(jiān)督細(xì)胞類型映射策略已經(jīng)開發(fā)出來严肪,例如使用樸素貝葉斯模型為HDST數(shù)據(jù)分配細(xì)胞類型。亞細(xì)胞基因表達(dá)模式反過來可以用來改善細(xì)胞分割谦屑,例如Baysor驳糯、Sparcle、JTSA等氢橙。
對基因表達(dá)的亞細(xì)胞模式的分析也可以提供新的生物學(xué)見解结窘。例如已經(jīng)開發(fā)了一種原位RNA速度方法,以使用亞細(xì)胞RNA定位信息來推斷轉(zhuǎn)錄率充蓝。
此外隧枫,通過使用過氧化物酶APEX2(一種稱為APEX-seq的方法)對RNA進行直接鄰近標(biāo)記喉磁,可以高分辨率地識別細(xì)胞質(zhì)中的共定位mRNA物種。此外官脓,在核位置富集的mRNAs傾向于編碼在核斑點和核質(zhì)中富集的蛋白質(zhì)协怒。或者卑笨,也可以通過ATLAS-seq檢測亞細(xì)胞RNA共定位孕暇。
了解細(xì)胞如何與組織環(huán)境溝通
從配體-受體相互作用推斷的細(xì)胞通訊
空間轉(zhuǎn)錄組分析的一個重要目標(biāo)是研究細(xì)胞如何與組織環(huán)境通信。Giotto引入了一種雙向比較方法赤兴,通過比較同一細(xì)胞類型內(nèi)但被不同相鄰細(xì)胞包圍的細(xì)胞亞群之間的基因表達(dá)模式來識別相互作用改變的基因妖滔。值得注意的是,與單獨使用基因表達(dá)信息相比桶良,使用空間信息可以顯著減少假陽性配體-受體活性預(yù)測的數(shù)量座舍。CellPhoneDB v3.0中使用了類似的方法。為了克服空間轉(zhuǎn)錄組數(shù)據(jù)沒有單細(xì)胞分辨率這一挑戰(zhàn)陨帆,研究人員應(yīng)用Cell2location來推斷不同細(xì)胞類型的位置曲秉,然后比較與不同細(xì)胞鄰域相關(guān)的基因表達(dá)模式。其他方法也被用來量化相鄰細(xì)胞類型的影響疲牵,包括convolutional neural networks承二、optimal transport和multioutput regression。另一種方法是將基因表達(dá)譜明確分解為空間和非空間成分纲爸,然后利用鄰域的細(xì)胞類型組成來估計空間成分亥鸠。配體-受體相互作用的分析也被擴展到包括多單位蛋白復(fù)合物中輔助因子的影響,以提高預(yù)測的準(zhǔn)確性识啦。值得注意的是负蚊,還開發(fā)了從細(xì)胞-細(xì)胞相互作用模式重建空間位置的算法。
用于空間數(shù)據(jù)分析和可視化的綜合探索性工具
交互式探索性分析管道的概述
生物學(xué)家將受益于集成和交互式管道袁滥,允許他們執(zhí)行各種分析步驟盖桥,從原始數(shù)據(jù)導(dǎo)入到圖像分析,然后生成最終分析結(jié)果和可視化圖像题翻,這些操作最好是在個人計算機上完成揩徊。目前,有許多綜合工具包可用嵌赠,例如Giotto塑荒、Seurat、Squidpy等姜挺。
這些軟件包或工具箱大多是由獨立的實驗室開發(fā)的齿税,這就導(dǎo)致了多個不同的數(shù)據(jù)結(jié)構(gòu)不一定共享相同的數(shù)據(jù)格式。為了克服其中的一些挑戰(zhàn)炊豪,R/Bioconductor社區(qū)正致力于精心設(shè)計普遍適用的數(shù)據(jù)結(jié)構(gòu)凌箕,并在最近發(fā)布了spatialExperiment類的第一個版本拧篮。這是一個新的S4類,擴展了流行的singleCellExperiment類牵舱,旨在與幾種類型的空間轉(zhuǎn)錄組數(shù)據(jù)集一起操作串绩,包括多細(xì)胞和亞細(xì)胞分辨率。已經(jīng)有幾個空間R包使用這種數(shù)據(jù)結(jié)構(gòu)芜壁,如SpatialLIBD和Spaniel礁凡,它們都擅長于創(chuàng)建交互式R/Shiny應(yīng)用程序來可視化空間轉(zhuǎn)錄組數(shù)據(jù)集。
近年來空間組學(xué)領(lǐng)域取得了很多進展慧妄。新的方法已經(jīng)被開發(fā)出來以應(yīng)對各種特定的空間轉(zhuǎn)錄組挑戰(zhàn)顷牌。綜合性的軟件包使生物學(xué)家能夠輕松地從頭到尾分析他們自己的數(shù)據(jù),并通過交互式可視化對數(shù)據(jù)進行互動探索塞淹。這些工具在使空間轉(zhuǎn)錄組技術(shù)廣泛適用方面發(fā)揮了重要作用窟蓝。
近年來,出現(xiàn)了一種范式的轉(zhuǎn)變窖铡,即根據(jù)轉(zhuǎn)錄組圖譜對細(xì)胞類型進行分類疗锐,有時還輔以其他分子模式坊谁。由于ST技術(shù)的快速發(fā)展费彼,現(xiàn)在可以對同一細(xì)胞同時進行轉(zhuǎn)錄組分析和形態(tài)學(xué)分析,從而為系統(tǒng)研究這兩種根本不同的方法之間的關(guān)系提供了很好的機會口芍。
一個研究的新方向是空間多元組學(xué)箍铲。新技術(shù)的發(fā)展使得在保存蛋白質(zhì)和RNA、內(nèi)含子和成熟mRNA鬓椭、DNA和RNA等信息的同時颠猴,可以分析同一細(xì)胞中的多種形態(tài)信息。這些技術(shù)使分析不同分子模式之間的相關(guān)性成為可能小染,并提供了機理上的見解翘瓮。分析這些數(shù)據(jù)需要開發(fā)新的計算方法和工具包。
第二章裤翩,空間轉(zhuǎn)錄組技術(shù)在腫瘤免疫治療中的應(yīng)用潛力
腫瘤內(nèi)異質(zhì)性對癌癥患者的準(zhǔn)確診斷和個性化治療策略的制定提出了重大挑戰(zhàn)资盅。此外,這種異質(zhì)性可能是治療耐藥性踊赠、疾病進展和癌癥復(fù)發(fā)的基礎(chǔ)呵扛。雖然免疫療法可以獲得很高的成功率,但選擇壓力加上腫瘤內(nèi)部的動態(tài)進化推動耐藥克隆的出現(xiàn)筐带,使腫瘤在某些患者中持續(xù)存在今穿。為了提高免疫療法的療效,研究人員已經(jīng)使用空間轉(zhuǎn)錄組技術(shù)來識別并隨后阻斷腫瘤異質(zhì)性的來源伦籍。
原位雜交
原位雜交(ISH)是一種使細(xì)胞或組織中特定DNA或RNA分子可視化的分子技術(shù)蓝晒。ISH是基于DNA/DNA或DNA/RNA雙鏈的互補性腮出,將標(biāo)記的核酸探針原位雜交到目標(biāo)上。通過這種方式芝薇,我們可以獲得有用的空間信息利诺。
熒光原位雜交
FISH是檢測微生物、診斷實體瘤和血液瘤以及指導(dǎo)癌癥治療的有效臨床工具剩燥。例如慢逾,F(xiàn)ISH通常用于檢測慢性髓系白血病中的BCR-ABL1 t(9;22)易位和各種癌癥中的許多融合基因灭红。FISH還被用于確認(rèn)乳腺癌中HER2基因的擴增侣滩,從而確定最有可能受益于曲妥珠單抗(一種抗HER2的單克隆抗體)治療的患者。另一個重要的例子是在非小細(xì)胞肺癌中檢測EML4-ALK融合基因变擒。隨著越來越多的免疫療法被開發(fā)和批準(zhǔn)君珠,研究人員試圖用FISH來預(yù)測癌癥免疫治療的反應(yīng)性。為了擴大FISH的有效性娇斑,可以將FISH與IHC或IF結(jié)合起來策添,同時檢測不同細(xì)胞類型的RNA和蛋白質(zhì),以更好地表征腫瘤微環(huán)境(TME)毫缆。
smFISH和RNAscope
為了解決傳統(tǒng)FISH的局限性唯竹,研究人員從研究DNA轉(zhuǎn)移到研究單分子RNA,并采用高通量的方法苦丁,由此產(chǎn)生了smFISH技術(shù)浸颓,其能夠可視化和量化單個mRNA分子,并表征內(nèi)源性基因表達(dá)的空間模式旺拉。通過靶向細(xì)胞mRNA而不是DNA分子产上,smFISH已經(jīng)成為評估腫瘤內(nèi)轉(zhuǎn)錄異質(zhì)性的有力工具。
RNAscope是一種商業(yè)化的基于ISH的技術(shù)蛾狗,可以檢測多達(dá)12個不同的RNA靶點晋涣,并且可以方便地與IHC和/或IF結(jié)合苔咪,以自動化的方式同時研究RNA和蛋白質(zhì)漫玄。相對于其他基于FISH的技術(shù),RNAscope已經(jīng)設(shè)計了13000個以上的RNA探針份企,并通過商業(yè)化的流程進行驗證蒲牧。因此撇贺,它是一種用于基礎(chǔ)研究和臨床實驗的省時和友好的方法。RNAscope已經(jīng)廣泛應(yīng)用于各個學(xué)科冰抢,包括傳染病松嘶、癌癥、免疫治療挎扰、炎癥和神經(jīng)科學(xué)翠订。特別是巢音,它是IHC的一種強有力的替代方法,可以評估各種實體瘤中免疫檢查點的表達(dá)尽超,如PD-L1官撼。通過檢測特定RNA,RNAscope闡明了TME似谁、免疫逃逸機制以及新的預(yù)測和預(yù)后癌癥生物標(biāo)志物傲绣。
在免疫療法的背景下,RNAscope在理解CAR-T細(xì)胞療法方面發(fā)揮了寶貴的作用巩踏。RNAscope已被用于評估靶基因表達(dá)的特異性秃诵,并跟蹤CAR-T細(xì)胞在異種移植小鼠模型中的分布。擴展到人類樣本塞琼,已有研究驗證了BCMA的表達(dá)是多發(fā)性骨髓瘤CAR-T細(xì)胞免疫治療的靶點菠净。
Multiplexed smFISH
盡管可以從RNAscope等技術(shù)中獲得更高的靈敏度和特異性,但最終需要基于FISH的技術(shù)彪杉,允許進行高通量轉(zhuǎn)錄組分析毅往,以更好地表征顯示獨特基因表達(dá)譜的稀有細(xì)胞群和細(xì)胞類型。MERFISH和seqFISH派近,不僅提供了改進的RNA定量攀唯、信號放大和檢測,而且提供了基于圖像的轉(zhuǎn)錄組分析构哺。
MERFISH從smFISH改良而來革答,采用了基于條形碼的組合標(biāo)記方法战坤,然后進行多輪雜交曙强,以確保熒光信號的高亮度和一次可檢測到的大量RNA。
MERFISH原理
seqFISH是另一種基于連續(xù)幾輪條形碼雜交標(biāo)記的Multiplexed smFISH技術(shù)途茫。例如碟嘴,seqFISH被用來對小鼠胚胎干細(xì)胞和腦組織中>10000種mRNA進行成像,具有較高的準(zhǔn)確性和分辨率囊卜。相關(guān)研究已證明seqFISH是研究和獲得T細(xì)胞成熟過程中調(diào)控基因表達(dá)動態(tài)的有力工具娜扇。另一項研究將微流體技術(shù)與Multiplexed smFISH技術(shù)結(jié)合起來研究乳腺癌中的腫瘤異質(zhì)性證明,Multiplexed smFISH可以從不同角度進一步優(yōu)化栅组。
盡管smFISH技術(shù)前景廣闊雀瓢,但由于探針設(shè)計、驗證玉掸、圖像分析和解碼的復(fù)雜性刃麸,基于smFISH的復(fù)合技術(shù)尚未廣泛應(yīng)用于轉(zhuǎn)化研究或臨床應(yīng)用。使用非多重FISH司浪、定量PCR泊业、IHC和IF在mRNA或蛋白質(zhì)水平上研究單個基因的表達(dá)通常更為方便把沼,尤其是當(dāng)研究的基因數(shù)量較少時,如一組預(yù)后標(biāo)志物吁伺。另一個限制是饮睬,由于序列雜交的性質(zhì),總成像時間加起來至少為18小時篮奄,還不包括最初的36~48h的探針雜交時間捆愁,因此與其他技術(shù)相比(如DSP和Visium),總體通量較低窟却。此外牙瓢,Multiplexed smFISH技術(shù)只能評估新鮮冷凍組織中一種類型的分析物,如RNA间校。新興的技術(shù)如DSP矾克,可以評估新鮮冷凍組織和病理學(xué)常規(guī)使用的標(biāo)準(zhǔn)福爾馬林固定石蠟包埋(FFPE)組織中的蛋白質(zhì)和RNA。
不同成像方式的概述和比較
DSP
DSP是一種高復(fù)雜度的空間分析方法憔足,其克服了Multiplexed smFISH技術(shù)的主要限制胁附。DSP使用寡核苷酸檢測技術(shù)來量化FFPE組織樣本中的蛋白質(zhì)或RNA。
用于RNA靶標(biāo)檢測的DSP原理
與順序雜交技術(shù)(如MERFISH)不同滓彰,DSP提供了更高效的工作流程控妻,可在48小時內(nèi)從10~20個組織切片或多達(dá)384個目標(biāo)區(qū)域產(chǎn)生結(jié)果。此外揭绑,與只分析RNA的Multiplexed smFISH相比弓候,DSP可以同時檢測96種蛋白質(zhì)或1400個mRNA。這一特征與癌癥免疫治療特別相關(guān)他匪,因為mRNA和蛋白質(zhì)表達(dá)模式的差異可用于闡明轉(zhuǎn)錄后調(diào)控和翻譯后修飾菇存,從而導(dǎo)致蛋白質(zhì)不穩(wěn)定,影響預(yù)后和治療反應(yīng)邦蜜。同時依鸥,DSP還保存了組織樣本的完整性,可以儲存珍貴的樣本悼沈,并用于將來的進一步分析贱迟。
DSP在免疫治療領(lǐng)域有著廣泛的應(yīng)用,例如已有研究用DSP評價了接受化學(xué)免疫治療的彌漫性大B細(xì)胞淋巴瘤患者的免疫微環(huán)境絮供;DSP在免疫檢查點阻斷治療方面也有研究衣吠,包括抗PD-L1和抗PD-1治療。DSP可以作為一種輔助診斷工具壤靶,對TME中空間定義的區(qū)域內(nèi)PD-L1蛋白表達(dá)進行標(biāo)準(zhǔn)化缚俏、定量和客觀評估。在另一項研究中,DSP成功地識別了20種以上的生物標(biāo)志物袍榆,這些標(biāo)志物可以預(yù)測黑色素瘤患者對免疫治療的反應(yīng)胀屿。
空間轉(zhuǎn)錄組技術(shù)(ST)
在單細(xì)胞RNA測序過程中,由于組織通常被均質(zhì)化以獲得轉(zhuǎn)錄組的平均概況包雀,造成空間信息丟失宿崭。最近,空間轉(zhuǎn)錄組技術(shù)(Spatial Transcriptomics)被開發(fā)才写,該技術(shù)利用空間條形碼寡脫氧胸腺嘧啶微陣列實現(xiàn)完整組織切片中的轉(zhuǎn)錄組定量可視化和分析葡兑。
這項新技術(shù)首先在小鼠嗅球上得到證實,并遵循如下標(biāo)準(zhǔn)工作流程:組織切片赞草、固定讹堤、蘇木精和伊紅(H&E)染色、亮視野成像厨疙、組織滲透洲守、cDNA合成、組織切除沾凄、探針釋放梗醇、文庫制備、測序撒蟀、數(shù)據(jù)處理叙谨、數(shù)據(jù)可視化和分析。
通過ST對乳腺癌保屯、前列腺癌和皮膚惡性黑色素瘤活檢的數(shù)據(jù)分析顯示手负,腫瘤內(nèi)和腫瘤間的異質(zhì)性達(dá)到了前所未有的水平,以及通過RNA測序分析和/或標(biāo)準(zhǔn)形態(tài)學(xué)注釋姑尺,注釋腫瘤區(qū)域和外周之間的基因表達(dá)譜存在明顯差異竟终。此外,利用這種技術(shù)進行的體內(nèi)實驗已經(jīng)發(fā)現(xiàn)了通過重新增殖小膠質(zhì)細(xì)胞誘導(dǎo)IL-6信號股缸,這在治療方面可能有價值衡楞。
為了利用ST的潛力,研究人員最近開發(fā)了一種稱為MIA的分析方法敦姻,其整合了單細(xì)胞RNA測序和ST技術(shù)產(chǎn)生的數(shù)據(jù)集,將細(xì)胞定位到組織上特定的區(qū)域歧杏。作為概念證明镰惦,MIA是在胰腺導(dǎo)管腺癌的數(shù)據(jù)集上進行的,并且揭示了特定的細(xì)胞類型和亞群在空間限制區(qū)域的富集犬绒,這些區(qū)域以前是未知或不可檢測的旺入。
基于空間轉(zhuǎn)錄學(xué)的概念,10× Genomics發(fā)布了Visum空間基因表達(dá)解決方案,與ST技術(shù)的第一次迭代相比茵瘾,它具有更高的分辨率和更高的靈敏度礼华。其被用于深入研究與組織結(jié)構(gòu)和功能相關(guān)的疾病,除了用于癌癥免疫治療外拗秘,還可以用于神經(jīng)系統(tǒng)疾病圣絮。
Visium空間基因表達(dá)解決方案原理
盡管轉(zhuǎn)錄空間分析技術(shù)相對較新,但在腫瘤免疫治療中已被廣泛探索雕旨。FISH和RNAscope是診斷和預(yù)測實體瘤和血液瘤的有效臨床工具扮匠。較新的技術(shù),如MERFISH和Visium凡涩,通過前所未有的分辨率和靈敏度實現(xiàn)批量轉(zhuǎn)錄組分析棒搜。這類技術(shù)的可獲得性不斷增加,能夠發(fā)現(xiàn)新的生物標(biāo)記物活箕,用于預(yù)測免疫治療的反應(yīng)力麸,并允許基于其獨特TME的異質(zhì)性的個性化治療方法。這些空間分析技術(shù)還可能與降維技術(shù)相結(jié)合育韩,例如UMAP用于可視化TME的免疫景觀末盔。
顯示組織樣本中UMAP和缺氧梯度的示意圖
展望未來,DSP提供了mRNA表達(dá)的空間分析和數(shù)字表征座慰,但仍然受到可同時研究的基因靶點數(shù)量的限制陨舱。盡管Visium在市場上相對較新,但其在短時間內(nèi)不斷改進版仔,在疾病病理學(xué)和臨床轉(zhuǎn)化研究方面有著巨大的潛力游盲。
研究人員可利用各種不斷發(fā)展的空間轉(zhuǎn)錄組技術(shù),重要的是既要考慮技術(shù)特征蛮粮,包括空間分辨率益缎、敏感性、特異性和組織類型然想,又要考慮實際因素莺奔,如成本,與可用資源的兼容性和周轉(zhuǎn)時間变泄。研究人員必須仔細(xì)考慮其研究問題令哟,并選擇一種與其研究和臨床目標(biāo)密切相關(guān)的適當(dāng)技術(shù)。
第三章妨蛹,空間高變基因
空間轉(zhuǎn)錄組研究中的一項關(guān)鍵任務(wù)是識別跨空間位置具有不同空間表達(dá)模式的空間變異基因(SVG)屏富。識別SVG為系統(tǒng)分析特定位置的細(xì)胞狀態(tài)、推斷細(xì)胞間的通訊以及確定生物體中重要的表型和功能提供了機會蛙卤。此前《Molecular Therapy-Nucleic Acids》發(fā)表綜述文章狠半,對目前可用于SVG分析的最先進的計算方法和工具進行了最新的系統(tǒng)性概述噩死。該研究將指導(dǎo)醫(yī)學(xué)和生命科學(xué)家尋找專用資源和更有效的工具來表征基因表達(dá)的空間模式。
空間轉(zhuǎn)錄組的數(shù)據(jù)存儲庫
空間轉(zhuǎn)錄組的資源和數(shù)據(jù)庫概述
SpatialDB(https://www.spatialomics.org/SpatialDB/):是一個手動管理的空間轉(zhuǎn)錄組資源神年,供研究人員有效研究和重復(fù)使用已發(fā)布的數(shù)據(jù)已维。當(dāng)前版本的SpatialDB包括5個物種(人類、小鼠已日、果蠅垛耳、秀麗隱桿線蟲和斑馬魚)的24個空間轉(zhuǎn)錄組數(shù)據(jù)集。此外捂敌,SpatialDB展示了SpatialDE和trendsceek識別的SVG艾扮,以及數(shù)據(jù)可視化、比較占婉、GO和KEEG富集分析泡嘴。
Single Cell Portal (https://singlecell.broadinstitute.org/single_cell):是一個不斷發(fā)展的綜合性單細(xì)胞數(shù)據(jù)庫,該數(shù)據(jù)庫收集并整合了來自400項研究(包括空間轉(zhuǎn)錄組的研究和數(shù)據(jù)集)的17640076個細(xì)胞逆济;其中大部分來自Broad研究所開發(fā)的空間轉(zhuǎn)錄組技術(shù)酌予。
SVG識別的計算方法
在過去的幾年里,已經(jīng)開發(fā)了許多計算方法/工具來幫助闡明基因表達(dá)的空間變異奖慌。根據(jù)內(nèi)在原理可分為三類:(1)基于統(tǒng)計建模的方法抛虫;(2) 基于機器學(xué)習(xí)的方法;(3)基于空間網(wǎng)格的方法简僧。
SVG識別的計算工具和方法綜述
基于統(tǒng)計建模的方法
基于統(tǒng)計建模方法的工作流程示意圖
基于已知細(xì)胞空間坐標(biāo)及其基因表達(dá)水平的統(tǒng)計建模方法為闡明空間基因表達(dá)異質(zhì)性提供了統(tǒng)計框架建椰。其一般工作流程:首先,輸入基因表達(dá)譜和細(xì)胞位置信息岛马。根據(jù)輸入的信息棉姐,構(gòu)建統(tǒng)計框架來闡明基因表達(dá)值與細(xì)胞空間位置之間的相關(guān)性。隨后啦逆,通過不同的統(tǒng)計方法確定顯著SVG伞矩。
trendsceek使用標(biāo)記點過程來模擬基因表達(dá)和細(xì)胞坐標(biāo)之間的關(guān)聯(lián);SpatialDE是一種基于高斯過程回歸的方法夏志;與SpatialDE相比乃坤,SPARK做了一些具體的改進碗脊,其基于具有多個空間核的空間廣義線性混合模型識別SVG朝聋,直接對空間計數(shù)數(shù)據(jù)建模跛璧;SPARK-X基于非參數(shù)建模宙彪,有效地減少了內(nèi)存需求和計算時間,同時保持了可靠模型的有效性锥余;GPcounts利用高斯過程回歸方法宴倍,通過負(fù)二項似然模型對空間轉(zhuǎn)錄組數(shù)據(jù)進行建模直奋,在處理計數(shù)數(shù)據(jù)時實現(xiàn)了比高斯似然函數(shù)更好的擬合宇色;BayesSpace是一種完全貝葉斯統(tǒng)計方法,它使用來自空間鄰域的信息來增強空間轉(zhuǎn)錄組數(shù)據(jù)的分辨率并進行聚類分析。
基于機器學(xué)習(xí)的方法
基于機器學(xué)習(xí)策略的工作流程示意圖
基于光譜的方法已經(jīng)成為一種根據(jù)特征和基礎(chǔ)結(jié)構(gòu)之間一致性程度進行無監(jiān)督特征選擇的方式宣蠕。
RayleighSelection擴展了基于圖的Laplacian方法例隆,使用了一個簡單的復(fù)合體,顯著簡化了數(shù)據(jù)之間的關(guān)聯(lián)抢蚀,并對具有復(fù)雜組合結(jié)構(gòu)的特征進行了特征選擇镀层。
由于輸入數(shù)據(jù)的特征豐富且結(jié)構(gòu)良好,神經(jīng)網(wǎng)絡(luò)作為機器學(xué)習(xí)的另一個重要分支皿曲,已被廣泛用于分析scRNA-seq和空間轉(zhuǎn)錄組數(shù)據(jù)唱逢。
SOMDE使用自組織映射(SOM),在保持原始空間信息的前提下屋休,根據(jù)輸入數(shù)據(jù)的密度和拓?fù)浣Y(jié)構(gòu)構(gòu)造一個節(jié)點數(shù)較少的壓縮映射坞古,然后用高斯過程(GP)檢測SVG;SPADE使用成像數(shù)據(jù)和空間轉(zhuǎn)錄組數(shù)據(jù)作為輸入劫樟,通過卷積神經(jīng)網(wǎng)絡(luò)提取每個點周圍的形態(tài)特征痪枫,并將其與基因表達(dá)數(shù)據(jù)相結(jié)合,以識別與空間和形態(tài)異質(zhì)性相關(guān)的關(guān)鍵基因叠艳。此外奶陈,可以基于這些關(guān)鍵基因進行功能分析,以進一步闡明負(fù)責(zé)不同形態(tài)特征的生物過程附较。
基于空間網(wǎng)格的方法
基于空間網(wǎng)格方法的工作流程示意圖
這類方法旨在將空間劃分為多個網(wǎng)格吃粒,并對不同細(xì)胞之間的空間關(guān)系進行編碼或推斷細(xì)胞的分布,然后應(yīng)用后續(xù)步驟拒课,例如對細(xì)胞的空間相鄰關(guān)系或基因表達(dá)水平進行二值化以識別SVG徐勃。
SingleCellHaystack將空間劃分為網(wǎng)格,并根據(jù)細(xì)胞的密度確定該網(wǎng)格上的多個網(wǎng)格點捕发。對于每個基因疏旨,SingleCellHaystack通過閾值將所有細(xì)胞聚成兩類(檢測到該基因的細(xì)胞和未檢測到該基因的細(xì)胞)。然后扎酷,SingleCellHaystack計算這兩類細(xì)胞的分布檐涝,并將它們與空間中細(xì)胞的隨機分布進行比較。Kullback-Leibler散度用于計算每個基因的DKL分?jǐn)?shù)作為變異程度法挨,并識別在多維空間中不均勻表達(dá)的基因谁榜。基于這個分?jǐn)?shù)凡纳,可以評估基因的空間變異性窃植。Merungue通過三角剖分算法(Delaunay)將空間轉(zhuǎn)錄組數(shù)據(jù)中的每個細(xì)胞視為一個鄰域,然后根據(jù)這些鄰域確定每個細(xì)胞對是否相鄰荐糜,并應(yīng)用二進制鄰接權(quán)重矩陣來表示這種關(guān)系巷怜。根據(jù)構(gòu)建的鄰接矩陣和基因表達(dá)矩陣葛超,Merungue計算出空間自相關(guān)統(tǒng)計量,即Moran's I延塑,以獲得重要的空間基因绣张。此外,Merungue通過空間交叉相關(guān)指數(shù)关带,將確定的空間基因分類為多種空間表達(dá)模式侥涵。Giotto已被開發(fā)為分析和可視化空間轉(zhuǎn)錄組數(shù)據(jù)的工具箱,并結(jié)合了四種識別空間基因的方法宋雏,包括trendsceek芜飘、SpatialDE、SPARK和BinSpect磨总。BinSpect首先使用Delaunay創(chuàng)建一個空間網(wǎng)格來表示細(xì)胞之間的關(guān)聯(lián)嗦明。對于每個被輸入的基因,BinSpect將通過K-means聚類或等級閾值對基因表達(dá)值進行二值化舍败,并根據(jù)這些二值化的表達(dá)值計算出相鄰細(xì)胞之間的或然率表招狸。通過統(tǒng)計學(xué)上的富集測試,如果一個基因在相鄰細(xì)胞中的表達(dá)量很高邻薯,這個基因?qū)⒈灰暈镾VG裙戏。作為一種基于圖的模型,隱馬爾科夫隨機場模型(HMRFs)利用空間基因和空間鄰域網(wǎng)絡(luò)來總結(jié)主要的空間域厕诡。
空間分辨率轉(zhuǎn)錄組數(shù)據(jù)的下游分析方法
由于識別基因的空間表達(dá)模式以及它們在不同組織中的變化是空間轉(zhuǎn)錄組學(xué)的一個關(guān)鍵目標(biāo)累榜,因此許多專門用于分析這種數(shù)據(jù)的工具旨在識別空間變異基因(SVG)×橄樱基于scRNA-Seq分析中高度可變基因的概念壹罚,SVG的表達(dá)模式取決于其在組織中的位置,并能深入了解生物功能寿羞。分析這些空間轉(zhuǎn)錄組學(xué)數(shù)據(jù)集的一個復(fù)雜問題是準(zhǔn)確地解釋樣本之間的空間相關(guān)性猖凛。目前各種軟件包主要是用R或Python開發(fā)的,可用于識別空間轉(zhuǎn)錄組數(shù)據(jù)集中的SVG绪穆。
識別SVG
SpatialDE是一個基于高斯過程(GP)回歸的流行軟件包辨泳,它可以清楚地識別含有時間和/或空間注釋的數(shù)據(jù)集的局部基因表達(dá)模式。SpatialDE可以通過創(chuàng)建一個包含兩個不同項(空間和非空間)的模型來識別SVG玖院,這兩個項反映了數(shù)據(jù)集中存在的不同差異菠红。SpatialDE的另一個功能是,它可以實現(xiàn)一種建立在高斯混合模型上的無監(jiān)督學(xué)習(xí)技術(shù)难菌,以應(yīng)用自動表達(dá)組織學(xué)(AEH)试溯,通過使用從數(shù)據(jù)中學(xué)習(xí)到的隱藏模式,根據(jù)SVG的空間表達(dá)模式將SVG分組郊酒。SpatialDE可能通過將低表達(dá)水平的基因標(biāo)記為SVG而引入假陽性的觀察結(jié)果遇绞,這是一個需要進一步研究的領(lǐng)域键袱,并且可以在未來版本的軟件包中加以改進。
與SpatialDE具有相同目標(biāo)的軟件包是SPARK试读,該軟件包使用具有不同空間核的廣義線性空間模型(GLSM)來識別SVG杠纵。雖然SpatialDE和SPARK共同使用參數(shù)測試統(tǒng)計荠耽,但這兩個軟件包之間有一些關(guān)鍵的區(qū)別钩骇。SPARK不對歸一化數(shù)據(jù)進行建模,而SpatialDE只能對p值進行近似計算铝量,SpatialDE計算一個精確的p值倘屹,一旦獲得初始的有統(tǒng)計學(xué)意義的基因集,就進行額外的分析以確定其p值慢叨。當(dāng)對多個數(shù)據(jù)集進行驗證時纽匙,SPARK的表現(xiàn)與SpatialDE和Trendsceek一樣甚至更好。在計算效率方面拍谐,當(dāng)用10個并行的CPU線程運行時烛缔,SPARK的計算效率高于在單線程SpatialDE上運行的相同分析(盡管在參考文獻例子中差異很小)轩拨,而Trendsceek践瓷,其單線程性能在4個不同大小的數(shù)據(jù)集上的效率始終低于SpatialDE。
Trendsceek是較早開發(fā)的軟件包之一亡蓉,用于使用非參數(shù)方法識別SVG晕翠。Trendsceek單獨評估每個基因,并通過log10轉(zhuǎn)換將其表達(dá)歸一砍濒。Trendsceek與SpatialDE和SPARK的一個關(guān)鍵區(qū)別在于其非參數(shù)測試統(tǒng)計的計算淋肾,這意味著它缺乏一個基礎(chǔ)生成模型。Trendsceek針對模擬數(shù)據(jù)集進行測試爸邢,如果數(shù)據(jù)集中不到5%的細(xì)胞具有不同的表達(dá)水平樊卓,則當(dāng)SVG存在時,其識別SVG的能力非常低杠河。即隨著SRT數(shù)據(jù)集的不斷擴大碌尔,Trendsceek將無法區(qū)分組織內(nèi)非常小的細(xì)胞子集中存在的SVG。與SpatialDE和SPARK相比感猛,Trendsceek在兩個空間轉(zhuǎn)錄組學(xué)數(shù)據(jù)集上識別的SVG較少(數(shù)量幾乎比其他軟件包低10倍)七扰。
每一個新開發(fā)的軟件包都旨在解決已出版軟件包的缺點,例如BOOST-GP陪白,其提出了一個新的貝葉斯層次模型颈走,旨在解釋空間數(shù)據(jù)集中存在的相當(dāng)數(shù)量的zero-counts,而到目前為止發(fā)表的其他軟件包都忽略了這一點咱士。與其他軟件包的一個關(guān)鍵區(qū)別是立由,BOOST-GP在建立計數(shù)數(shù)據(jù)模型時采用了負(fù)二項分布轧钓。當(dāng)數(shù)據(jù)中存在false zeros時,BOOST-GP的性能高于SpatialDE锐膜、SPARK和Trendsceek毕箍。根據(jù)基因表達(dá)的空間模式,BOOST-GP的準(zhǔn)確性可能略有不同道盏。在對人類乳腺癌數(shù)據(jù)的分析中而柑,BOOST-GP識別的SVG比SPARK少,但其能夠在GO分析中發(fā)現(xiàn)新的荷逞、生物相關(guān)功能媒咳,增加了它在空間轉(zhuǎn)錄組學(xué)數(shù)據(jù)分析中的價值。
隨著更大的數(shù)據(jù)集變得越來越普遍种远,必須創(chuàng)建軟件包來有效分析空間轉(zhuǎn)錄組學(xué)實驗產(chǎn)生的大量數(shù)據(jù)涩澡。其中一個較新的軟件包是SOMDE,其在python中構(gòu)建坠敷,通過使用自組織地圖(SOM)神經(jīng)網(wǎng)絡(luò)和高斯過程對數(shù)據(jù)進行建模妙同,它可以比SpatialDE、SPARK或Trendsceek更快地在大數(shù)據(jù)集中識別SVG膝迎。與Giotto和SpatialDE相比粥帚,SOMDE在用于驗證的三個不同大小的數(shù)據(jù)集上的運行時間更快。在模擬數(shù)據(jù)集上弄抬,將SOMDE性能與scGCO和SpatialDE進行比較時茎辐,SOMDE的性能始終優(yōu)于scGCO,但只有在將高dropout rate納入數(shù)據(jù)集時掂恕,其性能才優(yōu)于SpatialDE拖陆。在實際數(shù)據(jù)集上進行性能測試時,SOMDE識別的大多數(shù)SVG與scGCO懊亡、SPARK和SpatialDE等識別的SVG重疊依啰。
還有其他已開發(fā)的軟件,比如在python包中實現(xiàn)的scGCO店枣,其采用了圖形切割算法來識別空間基因速警。與SpatialDE非常相似,scGCO使用高斯混合模型鸯两,但使用它對每個基因的表達(dá)進行分類闷旧,以確保基于它們的基因表達(dá)更準(zhǔn)確地分類細(xì)胞類型钧唐。scGCO在小鼠嗅球忙灼、乳腺癌活檢等數(shù)據(jù)中表現(xiàn)出穩(wěn)定的性能。
識別SVG及其他目標(biāo)
以上回顧的軟件包證明GPs是分析空間轉(zhuǎn)錄組學(xué)數(shù)據(jù)的流行方法,因為它們可以建立其空間依賴性模型该园。為此酸舍,隨著新軟件包的開發(fā),許多軟件包都是建立在替代的GP回歸模型上里初,如GPcounts啃勉,可用于建立空間或時間的大規(guī)模scRNA-Seq數(shù)據(jù)模型,通過使用負(fù)二項式(NB)似然對計數(shù)數(shù)據(jù)進行建模双妨。與高斯似然模型相比淮阐,NB似然模型應(yīng)更準(zhǔn)確地捕捉基因表達(dá)數(shù)據(jù)的分布,因為它考慮到了可能的異方差噪聲和許多zero-counts的存在斥难,但需要應(yīng)用UMI規(guī)范化枝嘶。GPcounts的主要目的不是識別SVG,它還能夠識別差異表達(dá)基因哑诊,執(zhí)行偽時間推斷,然后識別分支基因并發(fā)現(xiàn)時間軌跡及刻,與大多數(shù)軟件包相比镀裤,它的范圍更廣。以SpatialDE為基準(zhǔn)缴饭,GPcounts建立在SpatialDE實施的許多步驟之上暑劝,并對其進行了修改。這適用于從用于確定SVG和差異表達(dá)基因P值的測試程序到應(yīng)用于數(shù)據(jù)的歸一化類型颗搂。GPcounts還實施了額外的步驟担猛,在其核函數(shù)超參數(shù)估計期間進行內(nèi)置檢查,以最大限度地減少卡在局部最優(yōu)的問題丢氢,在懷疑有這種情況時重新啟動優(yōu)化傅联。這是迄今為止唯一的基于優(yōu)化的方法之一,它實現(xiàn)了這種自我檢查疚察,使GPcounts在準(zhǔn)確識別SVG方面具有明顯的優(yōu)勢蒸走。在真實的小鼠嗅球數(shù)據(jù)集測試中,GPcounts在所有軟件包中識別了最多的SVG貌嫡,絕大部分識別的SVG與SpatialDE和SPARK識別的SVG重疊比驻;GPcounts識別的獨特SVG空間模式與Allen Brain Atlas描述一致,說明這些發(fā)現(xiàn)具有高可信度岛抄;GPcounts還識別了數(shù)據(jù)集中表達(dá)的90%的生物學(xué)上重要的標(biāo)記基因(vs SPARK80% vs SpatialDE 30%)别惦。
某些框架的開發(fā)考慮到了特定的SRT技術(shù),并結(jié)合解決開發(fā)者認(rèn)為缺乏的數(shù)據(jù)分析領(lǐng)域夫椭。其中之一是用R語言創(chuàng)建的STUtility(? 了解詳情)工作流程掸掸,它是基于Seurat分析工具而建立的。
第四章益楼,空間轉(zhuǎn)錄組聚類方法討論(重點在BayesSpace)
新興的空間轉(zhuǎn)錄組(ST)領(lǐng)域的技術(shù)發(fā)展開辟了一個未經(jīng)探索的領(lǐng)域猾漫,將轉(zhuǎn)錄信息置于空間環(huán)境中点晴。聚類通常是分析這類數(shù)據(jù)的核心組成部分。
ClusterMap
ClusterMap是一個無監(jiān)督和無注釋的計算工具悯周,其基于兩個關(guān)鍵的生物學(xué)現(xiàn)象:首先粒督,細(xì)胞內(nèi)RNA分子的密度高于細(xì)胞外没讲;其次皆撩,不同基因編碼的細(xì)胞RNA在不同的亞細(xì)胞位置、細(xì)胞類型和組織區(qū)域富集烤芦。因此闰挡,開發(fā)團隊推斷锐墙,通過對RNA的物理密度和基因身份進行聯(lián)合聚類,可以直接從原位轉(zhuǎn)錄組數(shù)據(jù)中確定有生物學(xué)意義的模式和結(jié)構(gòu)长酗。隨后溪北,根據(jù)基因身份和空間尺度對空間聚類進行解析,以表示亞細(xì)胞定位夺脾、細(xì)胞分割和區(qū)域識別之拨。
性能評估:與此前的方法相比,ClusterMap在模擬數(shù)據(jù)集和生物數(shù)據(jù)集中均表現(xiàn)出穩(wěn)定的高性能咧叭。此外蚀乔,ClusterMap廣泛適用于各種實驗方法,包括但不限于STARmap菲茬、MERFISH吉挣、ISS和osmFISH。實驗結(jié)果表明ClusterMap從不同組織樣本的原位轉(zhuǎn)錄組數(shù)據(jù)中準(zhǔn)確地創(chuàng)建了RNA注釋的亞細(xì)胞和細(xì)胞圖譜婉弹,這些組織樣本具有不同的RNA定位睬魂、細(xì)胞密度、形態(tài)和連接马胧。
工具獲群郝颉:
https://github.com/wanglab-broad/ClusterMap
https://github.com/LiuLab-Bioelectronics-Harvard/ClusterMap
CoSTA
CoSTA是一種通過卷積神經(jīng)網(wǎng)絡(luò)(ConvNet)聚類學(xué)習(xí)基因表達(dá)矩陣之間空間相似性的新方法。CoSTA方法使用ConvNet聚類結(jié)構(gòu)佩脊,重復(fù)(1)通過ConvNet生成特征蛙粘,(2)通過GMM聚類生成軟分配,以及(3)使用軟分配來更新ConvNet威彰。一旦完成訓(xùn)練出牧,只保留訓(xùn)練好的ConvNet用于特征提取。由于ConvNet主要由卷積層組成歇盼,ConvNet提取的每個基因的最終向量應(yīng)該是一個空間表示舔痕。利用這個空間表示可以在一個空間轉(zhuǎn)錄組數(shù)據(jù)集中量化任何兩個基因之間的關(guān)系,利用UMAP將這個數(shù)據(jù)集中的所有SE基因可視化,并通過常見的聚類算法分配模式伯复。
性能評估:通過分析模擬和此前發(fā)表的空間轉(zhuǎn)錄組數(shù)據(jù)慨代,研究團隊證明CoSTA學(xué)習(xí)基因之間的空間關(guān)系的方式是強調(diào)更廣泛的空間模式而不是pixels級的相關(guān)性。CoSTA為每對基因之間的表達(dá)模式相似性提供了一個定量的衡量標(biāo)準(zhǔn)啸如,而不僅僅是將基因歸類侍匙。與其他方法相比,CoSTA識別的范圍更窄叮雳,但在生物學(xué)上是顯著相關(guān)的基因集想暗。CoSTA可以成功地實現(xiàn)從計算機視覺的深度學(xué)習(xí)思想來推斷空間基因表達(dá)關(guān)系,其可以應(yīng)用于任何為每個基因輸出基因表達(dá)信息的圖像類型矩陣的技術(shù)帘不,不僅包括性能測試中探討的Slide-seq和MERFISH说莫,還包括STARmap、10×Visium和HDST寞焙。
工具獲却⑾痢:
https://doi.org/10.5281/zenodo.3948711
BayesSpace
BayesSpace是一種完全貝葉斯統(tǒng)計方法,它使用來自空間鄰域的信息來增強空間轉(zhuǎn)錄組數(shù)據(jù)的分辨率并進行聚類分析棺弊。BayesSpace是一種基于空間轉(zhuǎn)錄組模型的聚類方法晶密,通過對基因表達(dá)矩陣的低維表示進行建模并通過空間先驗鼓勵相鄰點屬于同一簇來實現(xiàn)空間聚類。與以前的方法相比模她,BayesSpace允許對聚類結(jié)構(gòu)和錯誤項進行更靈活的規(guī)范。BayeSpace通過廣泛使用的Bioconductor SingleCellExperiment數(shù)據(jù)結(jié)構(gòu)將預(yù)處理數(shù)據(jù)作為輸入懂牧,無縫集成到空間轉(zhuǎn)錄組分析工作流中侈净,輸出同樣存儲在SingleCellExperiment對象中,該對象可用于下游分析僧凤。這些方法都實現(xiàn)為一個R包畜侦,可以在Bioconductor上公開訪問(http://www.bioconductor.org/packages/release/bioc/html/BayesSpace.html)。
性能評估:研究人員將BayesSpace與現(xiàn)有的空間和非空間聚類方法進行基準(zhǔn)測試躯保,結(jié)果表明其改善了從大腦旋膳、黑色素瘤、浸潤性導(dǎo)管癌和卵巢腺癌樣本中識別不同的組織內(nèi)轉(zhuǎn)錄譜的能力途事。通過使用免疫組化和一個由scRNA-seq數(shù)據(jù)構(gòu)建的模擬數(shù)據(jù)集验懊,研究人員發(fā)現(xiàn)解析了在原始分辨率下無法檢測到的組織結(jié)構(gòu),并識別了組織學(xué)分析無法識別的轉(zhuǎn)錄異質(zhì)性尸变。這些結(jié)果說明了BayesSpace在促進從空間轉(zhuǎn)錄組數(shù)據(jù)中發(fā)現(xiàn)生物學(xué)洞見方面的實用性义图。
工具獲取:
http://www.bioconductor.org/packages/release/bioc/html/BayesSpace.html
https://github.com/edward130603/BayesSpace
FICT
FICT是一種在分配細(xì)胞類型時結(jié)合了表達(dá)和鄰域信息的新方法召烂。FICT最大化了聯(lián)合概率似然函數(shù)碱工,該函數(shù)考慮了每個細(xì)胞中基因的表達(dá)和細(xì)胞類型的聯(lián)合多變量空間分布。其首先定義了一個生成混合模型:每個細(xì)胞根據(jù)其鄰域分配一個細(xì)胞類型,然后從細(xì)胞類型的特定分布中提取基因表達(dá)水平的降維表示怕篷。接下來通過最大化基因表達(dá)和細(xì)胞位置的聯(lián)合可能性來學(xué)習(xí)這個生成模型的參數(shù)历筝。然后通過這個生成模型的后驗分布推斷出細(xì)胞類型,并給出基因表達(dá)水平和細(xì)胞位置廊谓。
性能評估:使用模擬數(shù)據(jù)FICT可以正確地確定每個細(xì)胞的表達(dá)和提供相鄰細(xì)胞類型分布信息的參數(shù)梳猪,改進了僅依靠表達(dá)水平的生成和鑒別方法,以及沒有考慮到每個細(xì)胞完整鄰域的方法蹂析。對于真實的數(shù)據(jù)舔示,研究表明FICT對不同動物的相同組織所學(xué)到的模型有很好的一致性,它確實可以利用空間信息來糾正表達(dá)值中的噪聲所造成的錯誤电抚,而且即使在表達(dá)譜相似的情況下惕稻,它也可以用來識別空間上不同的細(xì)胞亞型。
工具獲闰选:
https://github.com/haotianteng/FICT
SpatialCPie
SpatialCPie是一個易于使用的R包俺祠,可以讓用戶直觀地了解ST數(shù)據(jù)中的“簇”是如何相互關(guān)聯(lián)的,以及二維ST陣列上的每個區(qū)域與每個“簇”的關(guān)聯(lián)程度借帘。SpatialCPie被設(shè)計成R工作流的一部分蜘渣,使用戶可以高度靈活地定制和快速迭代他們的分析。數(shù)據(jù)在多種分辨率下進行聚類--即采用不同數(shù)量的聚類或超參數(shù)設(shè)置--從而避免了為分析預(yù)先指定單一的超參數(shù)集肺然,用戶可以自由定義使用哪種聚類算法蔫缸。結(jié)果以兩種方式可視化:用聚類圖顯示不同分辨率之間的聚類重疊情況;用二維數(shù)組圖际起,其中每個點用餅圖表示拾碌,表示其與不同聚類中心點的相似度。SpatialCPie的用戶界面是用Shiny實現(xiàn)的街望。該界面主要由兩部分組成:Cluster graph和Array plot校翔。
性能評估:SpatialCPie可以用來分析任何具有空間分布的計數(shù)數(shù)據(jù)的數(shù)據(jù)集,開發(fā)團隊展示了其在三個公開的ST數(shù)據(jù)集(發(fā)育中的人類心臟灾前、原位乳腺癌和黑色素瘤)上的實用性防症,在此之前所有數(shù)據(jù)均使用Seurat進行了歸一化。
工具獲劝ゼ住:
https://github.com/jbergenstrahle/SpatialCPie
重點介紹蔫敲,BayesSpace(實現(xiàn)更高分辨率的空間轉(zhuǎn)錄組分析)
空間基因表達(dá)技術(shù)能夠在保留空間背景信息的同時,全面測量轉(zhuǎn)錄組譜烧给。然而燕偶,現(xiàn)有的分析方法并沒有解決技術(shù)分辨率有限或有效利用空間信息的問題。
來自美國的科研團隊開發(fā)了BayesSpace础嫡,這是一種完全貝葉斯統(tǒng)計方法指么,它使用來自空間鄰域的信息來增強空間轉(zhuǎn)錄組數(shù)據(jù)的分辨率并進行聚類分析酝惧。基準(zhǔn)測試證明BayesSpace在識別具有相似表達(dá)譜的空間簇和提高空間轉(zhuǎn)錄組學(xué)分辨率方面的效用,其既克服了有效利用空間信息進行表達(dá)數(shù)據(jù)聚類的挑戰(zhàn)伯诬,又克服了目前空間轉(zhuǎn)錄組技術(shù)分辨率有限的問題晚唇。
BayesSpace是什么?
BayesSpace是一種基于空間轉(zhuǎn)錄組模型的聚類方法盗似,通過對基因表達(dá)矩陣的低維表示進行建模并通過空間先驗鼓勵相鄰點屬于同一簇來實現(xiàn)空間聚類哩陕。與以前的方法相比,BayesSpace允許對聚類結(jié)構(gòu)和錯誤項進行更靈活的規(guī)范赫舒。BayeSpace通過廣泛使用的Bioconductor SingleCellExperiment數(shù)據(jù)結(jié)構(gòu)將預(yù)處理數(shù)據(jù)作為輸入悍及,無縫集成到空間轉(zhuǎn)錄組分析工作流中,輸出同樣存儲在SingleCellExperiment對象中接癌,該對象可用于下游分析心赶。這些方法都實現(xiàn)為一個R包,可以在Bioconductor上公開訪問(http://www.bioconductor.org/packages/release/bioc/html/BayesSpace.html)缺猛。
BayesSpace工作流程
BayesSpace的基準(zhǔn)測試
研究人員將BayesSpace與現(xiàn)有的空間和非空間聚類方法進行基準(zhǔn)測試缨叫,結(jié)果表明其改善了從大腦、黑色素瘤荔燎、浸潤性導(dǎo)管癌和卵巢腺癌樣本中識別不同的組織內(nèi)轉(zhuǎn)錄譜的能力耻姥。通過使用免疫組化和一個由scRNA-seq數(shù)據(jù)構(gòu)建的模擬數(shù)據(jù)集,研究人員發(fā)現(xiàn)解析了在原始分辨率下無法檢測到的組織結(jié)構(gòu)有咨,并識別了組織學(xué)分析無法識別的轉(zhuǎn)錄異質(zhì)性琐簇。這些結(jié)果說明了BayesSpace在促進從空間轉(zhuǎn)錄組數(shù)據(jù)中發(fā)現(xiàn)生物學(xué)洞見方面的實用性。
BayesSpace可在如下鏈接獲取Bioconductor軟件包:http://www.bioconductor.org/packages/release/bioc/html/BayesSpace.html
原代碼是公開的座享,可通過如下鏈接獲雀肷:https://github.com/edward130603/BayesSpace.
第五章,利用空間轉(zhuǎn)錄組技術(shù)探索組織結(jié)構(gòu)
高通量測序和成像方法的技術(shù)進步確立了空間轉(zhuǎn)錄組學(xué)在整個組織空間系統(tǒng)地檢測所有或大多數(shù)基因表達(dá)水平的能力征讲。近日,來自美國的科研團隊在《Nature》發(fā)表綜述文章橡娄,回顧了常見的空間轉(zhuǎn)錄組技術(shù)诗箍,討論了這些方法產(chǎn)生的數(shù)據(jù)的探索原則,檢查了空間轉(zhuǎn)錄組在不同的實驗設(shè)計中的效用挽唉,并強調(diào)了該技術(shù)通過與其他模式的整合實現(xiàn)生物學(xué)洞察的前景滤祖。
空間轉(zhuǎn)錄組技術(shù)
本文回顧的方法側(cè)重于能夠跨組織區(qū)域進行轉(zhuǎn)錄組水平檢測的技術(shù)∑孔眩空間轉(zhuǎn)錄組學(xué)技術(shù)主要分為:(1)基于NGS的技術(shù)匠童,在NGS前將位置信息編碼到轉(zhuǎn)錄本上;以及(2)基于成像的方法塑顺,包括基于原位測序(ISS)的方法--轉(zhuǎn)錄本在組織中被擴增和測序汤求,以及基于ISH的方法--成像探針在組織中被連續(xù)雜交俏险。這些不同的技術(shù)可以被看作是匯聚在一個基因表達(dá)矩陣上,該矩陣捕獲了每個點(即一個像素扬绪、一個細(xì)胞或一組細(xì)胞)的轉(zhuǎn)錄組竖独。
空間轉(zhuǎn)錄組學(xué)技術(shù)提供了基因表達(dá)矩陣
本篇對選擇空間轉(zhuǎn)錄組學(xué)方法的考慮因素做了如下總結(jié):
> 基因通量。
基于NGS的方法是無偏向性的挤牛,因為它們捕獲所有多聚腺苷酸化的轉(zhuǎn)錄本莹痢,因此非常適合探索新的系統(tǒng)。相比之下墓赴,ISH和大多數(shù)基于ISS的方法(FISSEQ和ExSeq除外)是有針對性的竞膳,需要對感興趣的基因有先驗知識。盡管如此诫硕,這些方法的通量近年來有所增加坦辟,達(dá)到了10000個基因。靶向的空間轉(zhuǎn)錄組學(xué)方法也可以與scRNA-seq結(jié)合使用痘括,這樣就可以更精確地定位已經(jīng)識別的感興趣的基因长窄。此外,非多聚腺苷酸化轉(zhuǎn)錄物的探針可用于查詢其他RNA纲菌,如成熟的microRNA和tRNA挠日。
> 序列信息
基于NGS和ISS的方法能夠檢測融合轉(zhuǎn)錄物、剪接異構(gòu)體和單核苷酸變體及點突變翰舌。當(dāng)與基因表達(dá)矩陣結(jié)合時嚣潜,這些數(shù)據(jù)可以通過RNA速度或譜系追蹤幫助重建時間過程。
> 靈敏度
基于ISH的方法具有很高的靈敏度椅贱,與金標(biāo)準(zhǔn)單分子熒光ISH(smFISH)相比懂算,最近達(dá)到了80%的檢測效率”勇螅基于NGS的方法的靈敏度明顯較低计技,仍低于scRNA-seq,但正在迅速提高到約100個獨特轉(zhuǎn)錄本/μm2山橄。一般來說垮媒,靈敏度和基因通量之間存在一種權(quán)衡,這可以從基于ISS的靶向方法相對于無偏向方法的更高靈敏度中看出航棱。
> 分辨率
原位方法的分辨率僅受光學(xué)衍射極限的限制睡雇,在擴張顯微鏡下,分辨率已達(dá)到100 nm左右饮醇。因此它抱,這些方法非常適用于有關(guān)亞細(xì)胞組織的問題∑蛹瑁基于NGS的方法受限于斑點的直徑观蓄,但其分辨率自最初的方法以來迅速提高混移,最近達(dá)到約1μm。
> 尺寸范圍
盡管在組織大小和成像時間之間存在權(quán)衡蜘腌,但原位方法可以跨越廣泛的尺寸范圍沫屡。相比之下,基于NGS的方法是標(biāo)準(zhǔn)化的撮珠,陣列大小約為10 mm2(目前商用的10X Genomics Visium為6 mm2)沮脖,這可能不適用于較小或較大的樣本。
> 可行性
盡管這些技術(shù)非常強大芯急,但它們的廣泛應(yīng)用仍存在障礙勺届,包括獲得用于原位方法的單分子成像,以及用于基于NGS方法的捕獲陣列的制造娶耍。商業(yè)化在某些情況下促進了這些技術(shù)的應(yīng)用免姿,如10X Genomics Visium。
對發(fā)育榕酒、生理和疾病的洞察
由于空間轉(zhuǎn)錄組技術(shù)提供了一個無偏向的空間組成圖胚膊,已被用于生成組織圖譜。
在神經(jīng)生物學(xué)方面:基于空間轉(zhuǎn)錄組學(xué)的方法已經(jīng)建立了整個小鼠大腦或特定區(qū)域的詳細(xì)圖譜想鹰,如視覺皮層紊婉、初級運動皮層、中顳回辑舷、下丘腦視前區(qū)喻犁、海馬和小腦。相關(guān)研究在對背外側(cè)前額葉皮質(zhì)的分析中確定了已知精神分裂癥和孤獨癥相關(guān)基因的空間模式何缓,從而提出了精神分裂癥遺傳易感性的機制肢础。
在發(fā)育生物學(xué)中:時間分辨的空間轉(zhuǎn)錄組圖譜有助于闡明心臟發(fā)育、精子發(fā)生和腸道發(fā)育的空間動力學(xué)碌廓。同樣传轰,對人類子宮內(nèi)膜在月經(jīng)周期的增殖期和分泌期的全面研究發(fā)現(xiàn)了WNT和Notch信號在調(diào)節(jié)向纖毛或分泌型上皮細(xì)胞分化中的作用。這些圖譜一直是合作項目協(xié)調(diào)努力的重點谷婆,為研究界提供有效資源路召,并得到Human Cell Atlas項目和Allen Institute for Brain Science的支持。
除了正常的發(fā)育和生理之外波材,空間轉(zhuǎn)錄組學(xué)很適合研究疾病中的組織結(jié)構(gòu)紊亂。空間轉(zhuǎn)錄組學(xué)能夠識別在癌癥中起作用的機制身隐,即正常生理功能的組織結(jié)構(gòu)發(fā)生改變廷区。隨著人們對腫瘤微環(huán)境重要性的日益認(rèn)識撮竿,空間轉(zhuǎn)錄組學(xué)已被用于研究其與不同狀態(tài)癌細(xì)胞的關(guān)系摊求。特別是,空間轉(zhuǎn)錄組學(xué)能夠研究癌癥和正常組織之間的分子特征瞳购。例如,在皮膚鱗狀細(xì)胞癌中發(fā)現(xiàn)了免疫調(diào)節(jié)性癌細(xì)胞狀態(tài)玖绿×泊桑空間轉(zhuǎn)錄組學(xué)還為神經(jīng)退行性疾病(包括阿爾茨海默病和肌萎縮側(cè)索硬化癥)斑匪、感染和炎癥過程(如麻風(fēng)病呐籽、流感和敗血癥)以及風(fēng)濕病(包括類風(fēng)濕性關(guān)節(jié)炎和脊柱關(guān)節(jié)炎)中組織失調(diào)機制提供了見解蚀瘸。
探索性數(shù)據(jù)分析
空間轉(zhuǎn)錄組技術(shù)產(chǎn)生了一個基因表達(dá)矩陣狡蝶,對其進行分析既可以檢驗現(xiàn)有的假設(shè),也可以通過探索性分析產(chǎn)生新的觀察結(jié)果贮勃。鑒于空間轉(zhuǎn)錄組數(shù)據(jù)集的復(fù)雜性和高維度贪惹,采用一種開放的思維方式,通過數(shù)據(jù)分析找到意想不到的關(guān)系寂嘉,可以產(chǎn)生新的見解奏瞬。
分析空間轉(zhuǎn)錄組數(shù)據(jù)通常需要排除低質(zhì)量數(shù)據(jù)和基因表達(dá)矩陣上的初始轉(zhuǎn)換,以提高信噪比泉孩,這可以使用分析軟件包(如Giotto硼端、Seurat、STutility和stLearn)執(zhí)行棵譬。平滑算法可應(yīng)用于數(shù)據(jù)显蝌,以提高靈敏度,并消除技術(shù)和生物變化的不必要來源订咸÷穑基于相鄰點之間可以共享信息的前提,沿空間坐標(biāo)在移動窗口中平均物理相鄰點之間的基因表達(dá)可以減少噪聲脏嚷。為了比較基因在不同點上的表達(dá)骆撇,轉(zhuǎn)錄組通常通過除以轉(zhuǎn)錄總數(shù)量(百萬分轉(zhuǎn)錄本(TPM))或使用正則化負(fù)二項回歸進行標(biāo)準(zhǔn)化。類似地父叙,通過調(diào)整數(shù)據(jù)比例神郊,使數(shù)據(jù)在不同點上具有相同的平均值和方差(z-score),可以幫助進行基因間的比較趾唱。
利用空間轉(zhuǎn)錄組數(shù)據(jù)集進行探索性數(shù)據(jù)分析
用于研究空間轉(zhuǎn)錄組數(shù)據(jù)的五類操作
> Cluster:聚類操作揭示了數(shù)據(jù)中的結(jié)構(gòu)涌乳,最基本的定義是具有相似轉(zhuǎn)錄組的點集,或者正交地甜癞,識別在點之間具有相似表達(dá)模式的基因夕晓。點之間的相似性可以用相關(guān)或歐氏距離直接在轉(zhuǎn)錄組之間計算,或在降維后計算悠咱,如PCA蒸辆、t-SNE和UMAP征炼。然后,這些相似性被用于聚類--例如躬贡,使用K-means谆奥、Louvain或分層聚類。這些聚類可能對應(yīng)于研究組織中的不同區(qū)域或細(xì)胞類型拂玻,然后可以對其進行注釋酸些。基因聚類使用相同的方法纺讲,可以識別與細(xì)胞類型或細(xì)胞狀態(tài)相對應(yīng)的共表達(dá)基因模塊擂仍。目前正在開發(fā)諸如BayesSpace之類的聚類方法,這些方法側(cè)重于空間轉(zhuǎn)錄組學(xué)的特定特征熬甚。
> Select:典型的空間轉(zhuǎn)錄組數(shù)據(jù)集包含的生物信息比任何單一分析都有意義逢渔。因此,通常應(yīng)該選擇一個感興趣的區(qū)域乡括,例如大腦的一個特定層肃廓,或腫瘤和微環(huán)境之間的界面』迕冢基因選擇方法比比皆是盲赊,那些專門針對空間轉(zhuǎn)錄組數(shù)據(jù)的方法試圖識別具有高變異性的基因,其表達(dá)在整個組織中不是隨機的敷扫“ⅲ可以根據(jù)基因的空間自相關(guān)性(使用Moran's I或Geary's C)、鄰近富集(如在BinSpect中)或函數(shù)(如在Haystack中)對基因進行評分葵第。Trendsceek使用標(biāo)記點處理方法绘迁,能夠識別表達(dá)的熱點和梯度等。SpatialDE使用高斯過程回歸將給定基因的表達(dá)變異性分解為空間和非空間成分卒密,并在SPARK中擴展了類似的方法缀台。
> Score:雖然基因和斑點是空間轉(zhuǎn)錄組學(xué)的主要觀察數(shù)據(jù),但基礎(chǔ)生物學(xué)意味著基因作為模塊共同表達(dá)哮奇,斑點轉(zhuǎn)錄組反映有限的細(xì)胞類型和狀態(tài)膛腐。這是評分函數(shù)的前提,評分函數(shù)用于將一組相似的點總結(jié)為單一基因表達(dá)譜鼎俘,或正交地將一組連貫的基因總結(jié)為單一模式哲身,以這種方式總結(jié)數(shù)據(jù)可以識別功能特性。評分可以簡單地通過對集合的值求平均值來完成贸伐,或者根據(jù)Seurat工作流中實現(xiàn)的空模型對表達(dá)式進行評分律罢。
> Characterize:通過對空間轉(zhuǎn)錄組數(shù)據(jù)的操作所確定的對象--斑點群和基因組--必須為生物學(xué)理解和解釋提供特征。當(dāng)一組斑點與組織學(xué)區(qū)域相匹配時,可以手動對其進行表征误辑,如在MERFISH中對大腦中的單個細(xì)胞類型進行注釋等。聚類也可以通過識別一組標(biāo)記基因并對其進行表征來間接注釋歌逢。具體而言巾钉,可以通過量化其與注釋基因集的重疊來表征基因集。這是多模式交叉分析(MIA)和基因集富集分析(GSEA)的基礎(chǔ)秘案,該分析可以從GO砰苍、KEGG、Hallmark 和其他數(shù)據(jù)庫中查詢獲得阱高。
> Relate:鑒于其系統(tǒng)性赚导,空間轉(zhuǎn)錄組學(xué)很適合識別基因群和組織區(qū)域之間的相似性、差異和關(guān)系赤惊。通過查詢表達(dá)基因吼旧、空間重疊或發(fā)育或功能關(guān)系,可以關(guān)聯(lián)斑點簇未舟。例如RNA velocity利用未切片的轉(zhuǎn)錄本來推斷斑點在時間上是如何相互關(guān)聯(lián)的圈暗,并被應(yīng)用于皮層來繪制神經(jīng)發(fā)育的動力學(xué)圖譜≡0颍基于RNA-seq的拷貝數(shù)變異推斷識別染色體非整倍體员串,可用于區(qū)分惡性斑點和非惡性斑點,并識別不同的亞克隆昼扛。當(dāng)兩組點在空間上相鄰時寸齐,可以通過使用已知數(shù)據(jù)庫(如CellPhoneDB或NicheNet)檢查它們的成對受體和配體來提出細(xì)胞之間的潛在相互作用模式。
假設(shè)生成與檢驗
健康或疾病組織的空間轉(zhuǎn)錄組學(xué)圖譜自然有助于無偏見的探索和假設(shè)生成抄谐。即使是那些設(shè)計用于研究特定生物過程的空間轉(zhuǎn)錄組數(shù)據(jù)集渺鹦,如時間進程研究或微擾實驗,也可以探索以揭示意想不到的變化并提出新的假說斯稳。此外海铆,空間轉(zhuǎn)錄組數(shù)據(jù)可以被納入經(jīng)典的假設(shè)驅(qū)動的實驗設(shè)計中,使用充分有力的實驗來檢驗一個定義明確的預(yù)測挣惰。事實上卧斟,隨著空間轉(zhuǎn)錄技術(shù)變得更加容易,它已經(jīng)準(zhǔn)備好作為一種常規(guī)的檢測方法憎茂,與流式細(xì)胞儀或RNA測序相提并論珍语。在實驗設(shè)計的指導(dǎo)下,空間轉(zhuǎn)錄組學(xué)在作為擾動或時間歷程實驗的讀數(shù)時可以證實或證偽一個假設(shè)竖幔。每個樣本都可以由一個單獨的數(shù)據(jù)點進行匯總板乙,并在不同的重復(fù)和條件下進行比較,因此需要收集足夠數(shù)量的數(shù)據(jù),以確保統(tǒng)計的嚴(yán)謹(jǐn)性和有效性募逞。研究可能在同一樣本的多個切片上納入空間轉(zhuǎn)錄組學(xué)蛋铆,以解釋技術(shù)變異性,或每個條件下的多個生物重復(fù)放接。該假設(shè)可在模型系統(tǒng)刺啦、體外或體內(nèi)或臨床數(shù)據(jù)中進一步驗證。
利用空間轉(zhuǎn)錄組學(xué)的假設(shè)生成和檢驗
與其他模式的融合
隨著空間轉(zhuǎn)錄組學(xué)技術(shù)的分辨率和靈敏度的提高纠脾,與其他數(shù)據(jù)模式的集成可以提供更好的組織表征的機會玛瘸。雖然目前常常未得到充分利用,但組織圖像本身可用于提取高分辨率信息苟蹈,尤其是當(dāng)結(jié)合組織病理學(xué)領(lǐng)域獲得的大量知識來手動識別和注釋區(qū)域時糊渊。組織中檢測到的形態(tài)特征,如細(xì)胞形狀或細(xì)胞核大小慧脱,可直接納入分析渺绒。深度學(xué)習(xí)也被用于從基因表達(dá)和組織學(xué)預(yù)測細(xì)胞類型注釋,優(yōu)于單獨從兩種模式預(yù)測的注釋芒篷。隨著可用于訓(xùn)練的轉(zhuǎn)錄組數(shù)據(jù)的增加,機器學(xué)習(xí)算法也被用于從組織病理學(xué)圖像預(yù)測基因表達(dá)篡帕。這些算法不依賴于預(yù)定義的形態(tài)特征,而是通過將整個圖像分解來提高性能怔鳖。將空間轉(zhuǎn)錄組學(xué)與這種機器學(xué)習(xí)方法相結(jié)合,可以提高組織病理學(xué)的可解釋性及其在臨床決策中的應(yīng)用献幔,以指導(dǎo)治療和告知預(yù)后。
在亞細(xì)胞分辨率下郑兴,染色質(zhì)的空間組織可能為不同環(huán)境下基因表達(dá)的調(diào)控提供線索闪水。將空間轉(zhuǎn)錄組數(shù)據(jù)集與基因組原位高通量成像朽肥、組織內(nèi)組蛋白標(biāo)記的空間分布相結(jié)合將是非常有價值的篱昔。最近州刽,利用完整組織內(nèi)的同步DNA測序?qū)蚪M組織進行空間定位已成為可能。這表明將空間基因組測序與原位轉(zhuǎn)錄組分析相結(jié)合的目標(biāo)有望實現(xiàn)匹表,從而加深我們對基因組組織和功能編碼方式的理解。
用蛋白質(zhì)聯(lián)合檢測等補充方式來增強基因表達(dá)數(shù)據(jù)苇羡,也可以闡明空間轉(zhuǎn)錄組學(xué)沒有捕捉到的過程设江,如蛋白質(zhì)的翻譯后修飾和亞細(xì)胞定位及其在疾病中的失調(diào)。靶向蛋白聯(lián)合檢測可與空間轉(zhuǎn)錄組學(xué)同時進行鹉胖,在同一組織切片上使用免疫染色挠铲,如Visium所支持的那樣。DBiT-seq使用抗體衍生的DNA標(biāo)簽實現(xiàn)組織中mRNA和蛋白質(zhì)的共映射瓢棒。用于蛋白質(zhì)檢測的高通量空間方法,如MIBI连霉、CODEX、t-cyCIF和自動質(zhì)譜分析歉井,為組織切片內(nèi)的蛋白質(zhì)組提供了無與倫比的快照。將這些高通量蛋白質(zhì)組學(xué)方法與空間轉(zhuǎn)錄組學(xué)相結(jié)合的技術(shù)進步將極大地提高我們研究組織復(fù)雜性的能力憨募。
空間轉(zhuǎn)錄組學(xué)領(lǐng)域正以指數(shù)級的速度增長菜谣。目前空間轉(zhuǎn)錄組學(xué)方法所面臨的挑戰(zhàn)--包括對分辨率和靈敏度的限制,以及通量和可及性--正在被迅速克服冈敛∧乎澹空間轉(zhuǎn)錄組學(xué)方法正在與石蠟包埋組織兼容仰泻,為回顧性分析幾十年來收集的生物樣本打開大門。隨著未來的創(chuàng)新棠枉,有可能對更大的組織區(qū)域進行系統(tǒng)化檢測,以重建三維器官或生物體層面的圖譜,并將轉(zhuǎn)錄組范圍內(nèi)的基因表達(dá)變化隨著時間的推移進行可視化稚新。除了克服這些技術(shù)挑戰(zhàn)之外,未來的工作還需要開發(fā)新的計算工具和創(chuàng)造性的分析思維屯阀。這將使數(shù)據(jù)探索能夠識別空間模式(空間轉(zhuǎn)錄組數(shù)據(jù)集的核心特征),并揭示潛在生物學(xué)的深刻見解盖袭。
當(dāng)我們推測該領(lǐng)域未來的里程碑時,人類基因組計劃可能是一個有用的平行項目拙已。人類基因組初稿于2001年發(fā)表倍踪,為研究遺傳變異的來源和結(jié)果提供了參考笙瑟。然而,基因組不同區(qū)域的功能和調(diào)控仍在積極研究中错洁。在空間轉(zhuǎn)錄組學(xué)中屯碴,未來的項目可能同樣受益于研究不同條件的參考。然而今艺,繪制每個基因在空間的表達(dá)水平圖譜只是闡明組織生物學(xué)的組織原則的第一步。正是這些高分辨率細(xì)胞圖譜與無假設(shè)查詢的耦合实牡,將有助于獲得新的見解并揭示生理學(xué)和疾病中組織結(jié)構(gòu)的顯著特征。
該領(lǐng)域的一個關(guān)鍵挑戰(zhàn)將是迭代構(gòu)建一個模型摆霉,說明多細(xì)胞空間模式如何從細(xì)胞水平屬性中產(chǎn)生。獨立于空間轉(zhuǎn)錄組學(xué)技術(shù)婉支,實施一個簡單的原則蝌以,即每個細(xì)胞總體上與其相鄰細(xì)胞最相似跟畅,這足以恢復(fù)果蠅胚胎中復(fù)雜的空間模式∈郏基于這一理念,對空間轉(zhuǎn)錄組數(shù)據(jù)集的探索將使我們能夠揭示指導(dǎo)組織水平空間組織建模的基本原則新思,并將有助于研究這些模式的機制基礎(chǔ)及其結(jié)果。這些更深層次的生物學(xué)洞察將把對簡單組織的理解擴展到更復(fù)雜的結(jié)構(gòu),包括發(fā)育中的生物體和患病組織蛔翅,使我們更接近于征服空間前沿。
第六章笋轨,單細(xì)胞空間聯(lián)合分析合集(重點介紹國產(chǎn)軟件STRIDE & DSTG & SpatialDWLS & stereoscope)
軟件 | 發(fā)表文獻、雜志及影響因子 | 參考文章 |
---|---|---|
Seurat | 沒有專門針對單細(xì)胞空間聯(lián)合的文章钾挟,但有高分文章引用 | 人鱗狀細(xì)胞癌成分和空間結(jié)構(gòu)的多峰分析(空間轉(zhuǎn)錄組與單細(xì)胞文章)徽千、10X空間轉(zhuǎn)錄組和10X單細(xì)胞數(shù)據(jù)聯(lián)合分析方法匯總 |
cell2location | Cell2location maps fine-grained cell types in spatial transcriptomics(Nature Biotechnology双抽,IF 55分) | 10X單細(xì)胞和空間聯(lián)合分析的方法---cell2location、10X單細(xì)胞空間聯(lián)合分析之再次解讀cell2location柑贞、10X單細(xì)胞空間聯(lián)合分析之cell2location的詳細(xì)梳理 |
SPOTlight | SPOTlight: seeded NMF regression to deconvolute spatial transcriptomics spots with single-cell transcriptomes(Nucleic acids research,IF 17分) | 10X單細(xì)胞空間分析回顧之SPOTlight、10X單細(xì)胞空間聯(lián)合分析之三----Spotlight |
RCTD | Robust decomposition of cell type mixtures in spatial transcriptomics(nature biotechnology有决、IF 55分) | 10X單細(xì)胞空間聯(lián)合分析之十(RCTD) |
STdeconvolve | Reference-free cell-type deconvolution of pixel-resolution spatially resolved transcriptomics data(biorxiv) | 10X空間轉(zhuǎn)錄組數(shù)據(jù)分析之空間注釋(解卷積,STdeconvolve) |
Stereoscope | Multi-resolution deconvolution of spatial transcriptomics data reveals continuous patterns of inflammation(biorxiv) | Multi-resolution deconvolution of spatial transcriptomics data reveals continuous patterns of inflammation |
DSTG | DSTG: Deconvoluting Spatial Transcriptomics Data through Graph-based Artificial Intelligence(Briefings in Bioinformatics、IF 11分) | 10X單細(xì)胞空間聯(lián)合分析之四----DSTG |
spatialDWLS | SpatialDWLS: accurate deconvolution of spatial transcriptomic data(biorxiv) | 10X單細(xì)胞空間聯(lián)合分析之五----spatialDWLS |
Tangram | Deep learning and alignment of spatially resolved single-cell transcriptomes with Tangram(Nature Methods, IF 28.5) | 10X單細(xì)胞空間聯(lián)合分析之六(依據(jù)每個spot的細(xì)胞數(shù)量進行單細(xì)胞空間聯(lián)合分析----Tangram) |
CellDART | CellDART: Cell type inference by domain adaptation of single-cell and spatial transcriptomic data(biorxiv) | 10X單細(xì)胞-10X空間轉(zhuǎn)錄組聯(lián)合分析之七----CellDART |
STRIDE | STRIDE: accurately decomposing and integrating spatial transcriptomics using single cell RNA sequencing(biorxiv) | 10X單細(xì)胞-10X空間轉(zhuǎn)錄組聯(lián)合分析之八----STRIDE(三維重構(gòu)) |
Adroit | AdRoit: an accurate and robust method to infer complex transcriptome composition(Communications Biology,designed for bulk RNA-seq data苟呐, IF 5分) | 10X空間轉(zhuǎn)錄組和10X單細(xì)胞數(shù)據(jù)聯(lián)合分析方法匯總 |
scanpy | 沒有專門針對單細(xì)胞空間聯(lián)合的文章 | Integrating spatial data with scRNA-seq using scanorama、10X單細(xì)胞(10X空間轉(zhuǎn)錄組)批次去除(整合)分析之Scanorama |
細(xì)胞類型組成的評估
識別SVG是最初開發(fā)的軟件包的主要重點,但需要注意的是赠幕,具有其他目的的軟件包正在越來越多地被公布。例如局冰,SpatialDWLS的創(chuàng)建是為了改善數(shù)據(jù)集中不具備單細(xì)胞分辨率的位置的不同細(xì)胞類型的識別康二,即細(xì)胞類型去卷積挨约。SpatialDWLS可以概括為兩個步驟,第一個步驟使用細(xì)胞類型富集分析方法來確定哪些類型的細(xì)胞在每個位置具有較高的概率夕土,第二個步驟使用阻尼加權(quán)最小二乘法(DWLS)的擴展來確定指定位置的細(xì)胞類型的精確組成。對一個模擬的空間轉(zhuǎn)錄組學(xué)數(shù)據(jù)集進行評估時篮撑,SpatialDWLS在具有較低的均方根誤差(RMSE)和計算時間方面優(yōu)于RCTD和stereoscope赢笨。然而,當(dāng)它的性能針對真實的小鼠大腦Visium數(shù)據(jù)集進行測試時,SpatialDWLS的性能沒有與其他三個軟件包進行比對又碌,因此它在真實數(shù)據(jù)上的性能并不清楚。盡管如此皂岔,作者報告說剖毯,SpatialDWLS分配的細(xì)胞類型的空間位置與Allen Mouse Brain Atlas中的報告一致。SpatialDWLS這個軟件的一個有趣的應(yīng)用是確定在整個胚胎心臟發(fā)育過程中細(xì)胞類型組織在空間和時間上的變化胶滋。
將細(xì)胞類型分配給空間轉(zhuǎn)錄組學(xué)數(shù)據(jù)集的方法不止一種。通過將先驗知識納入概率似然函數(shù)部宿,FICT可以混合表達(dá)和空間信息窟赏,將細(xì)胞類型分配給空間轉(zhuǎn)錄組學(xué)數(shù)據(jù)集。使用三個模擬和真實數(shù)據(jù)集對FICT進行了驗證拷况,并將其與GMM、scanpy起意、Seurat和smfishHmrf的結(jié)果進行了比較:在所有三個模擬數(shù)據(jù)集中,F(xiàn)ICT的中位精度最高亲善,在其中一個模擬數(shù)據(jù)集中達(dá)到了約0.89;在真實的MERFISH小鼠下丘腦數(shù)據(jù)集中渣蜗,F(xiàn)ICT在分配細(xì)胞類型聚類方面的性能更優(yōu)越知染,其有潛力在數(shù)據(jù)集中識別新的子群。FICT在應(yīng)用于更大的數(shù)據(jù)集時具有更高的準(zhǔn)確性,但其在這些情況下的運行時間仍然可以改進咬摇。
RCTD是另一個軟件包,其最終目的是識別空間轉(zhuǎn)錄組學(xué)數(shù)據(jù)集中的細(xì)胞類型档痪。RCTD利用注釋的scRNA-Seq數(shù)據(jù)創(chuàng)建數(shù)據(jù)中預(yù)期細(xì)胞群的細(xì)胞類型概況愿汰,然后使用監(jiān)督學(xué)習(xí)方法用細(xì)胞類型標(biāo)記空間轉(zhuǎn)錄組pixels。由于這一分析的主要障礙之一是目前的空間轉(zhuǎn)錄組學(xué)數(shù)據(jù)集可能在一個pixel內(nèi)包含多種細(xì)胞類型吗跋,RCTD還可以擬合一個統(tǒng)計模型跌宛,以確定一個pixel內(nèi)存在的多種細(xì)胞類型本缠,并將scRNA-Seq和SRT數(shù)據(jù)集之間的平臺效應(yīng)歸一化稀颁。使用這種方法棱烂,RCTD能夠跨平臺對細(xì)胞進行分類,準(zhǔn)確率接近90%衬鱼。與其他監(jiān)督學(xué)習(xí)方法一樣,使用該工具可以檢測的細(xì)胞類型受限于參考數(shù)據(jù)集的準(zhǔn)確和完整注釋抛蚤。
點到點聚類
空間轉(zhuǎn)錄組將轉(zhuǎn)錄信息置于空間環(huán)境中。聚類通常是分析這類數(shù)據(jù)的核心組成部分蒿偎。然而诉位,在這些類型的分析中,選擇適當(dāng)?shù)某瑓?shù)岳瞭,例如使用正確數(shù)量的聚類,是一個挑戰(zhàn)姚炕。為了解決這些問題些椒,相關(guān)研究團隊開發(fā)了一個名為SpatialCPie的R包,可以讓用戶直觀地了解空間轉(zhuǎn)錄組數(shù)據(jù)中的“簇”是如何相互關(guān)聯(lián)的石窑,以及二維空間轉(zhuǎn)錄組陣列上的每個區(qū)域與每個“簇”的關(guān)聯(lián)程度。
Pipelines
隨著空間轉(zhuǎn)錄組學(xué)領(lǐng)域的不斷擴大棺棵,綜合分析管道將變得更加普遍。第一批用R語言編寫的管道之一:Giotto是一個可以用于轉(zhuǎn)錄組學(xué)和蛋白質(zhì)組學(xué)數(shù)據(jù)的平臺缚柏;它分為數(shù)據(jù)分析和可視化模塊。由于注重用戶友好和可重復(fù)性杀餐,Giotto確實提供了使用HMRF模型進行更復(fù)雜空間分析的機會。作為一個基礎(chǔ)琼讽,Gioto創(chuàng)建了一個用于下游分析的細(xì)胞和空間網(wǎng)格的鄰域網(wǎng)絡(luò),包括配體受體識別问欠、基因表達(dá)模式分析和確定優(yōu)先細(xì)胞鄰接。Giotto提供了三種不同的識別標(biāo)記基因的算法(Gini滚澜、Scran设捐、Mast),每種算法的靈敏度和特異性在不同的細(xì)胞群體中略有不同槐沼。Giotto也有專門為低分辨率空間轉(zhuǎn)錄組學(xué)數(shù)據(jù)集設(shè)計的分析管道。多個算法的可用性使得需要不同輸入的Giotto能夠靈活地應(yīng)用到許多不同的數(shù)據(jù)集兼吓。
Squidpy開發(fā)了一個新框架,用于結(jié)合和涵蓋空間組學(xué)技術(shù)分析的所有方面浑娜。雖然不是專門為分析空間轉(zhuǎn)錄組學(xué)數(shù)據(jù)而建立的,但用Python開發(fā)的Squidpy框架為任何空間組學(xué)數(shù)據(jù)帶來了通用的分析和可視化工具宛畦,并利用可用的附加信息來改善探索。Squidpy提供了一種比Giotto更廣泛踏施、更模塊化的方法养距,其他軟件包可以輕松地集成到其預(yù)先存在的框架中棍厌,以擴展其功能。Squidpy將圖像數(shù)據(jù)存儲在一個圖像容器中束析,并創(chuàng)建一個空間坐標(biāo)的鄰接圖,這樣它就可以在各種技術(shù)上使用丁恭。Squidpy的一個特點是其內(nèi)置的圖像分析工具,雖然到目前為止討論的軟件包都需要圖像作為分析輸入的一部分第献,但沒有一個軟件包能像Squidpy那樣讓用戶對該圖像中的數(shù)據(jù)進行分析,這是Squidpy與Giotto的最大區(qū)別飒赃。
單細(xì)胞空間聯(lián)合分析
空間分辨轉(zhuǎn)錄組學(xué)實驗分析的關(guān)鍵步驟之一是確定細(xì)胞類型。細(xì)胞類型去卷積蔫慧,是用于估計混合物(數(shù)據(jù)點)中每種細(xì)胞類型的比例以及每個細(xì)胞的基因表達(dá)水平(在同一數(shù)據(jù)點內(nèi))的算法睡扬。
SPOTlight
SPOTlight能夠?qū)⒖臻g轉(zhuǎn)錄組與scRNA-seq數(shù)據(jù)集成,從而推斷復(fù)雜組織中細(xì)胞類型和狀態(tài)的位置马靠。其基于一個種子的非負(fù)矩陣因子分解回歸(Seeded NMF regression )如孝,使用細(xì)胞類型標(biāo)記基因和非負(fù)最小二乘(NNLS)初始化锁孟,隨后去卷積空間轉(zhuǎn)錄組數(shù)據(jù)捕獲位置(spot)。
性能評估:通過模擬不同的參考數(shù)量和質(zhì)量數(shù)據(jù)證實SPOTlight在低深度測序或小規(guī)模的scRNA-seq參考數(shù)據(jù)集中也具有較高的預(yù)測精度圆恤;小鼠大腦的SPOTlight去卷積正確地映射了皮質(zhì)層的細(xì)微神經(jīng)元細(xì)胞狀態(tài)和海馬的特定結(jié)構(gòu);作為概念驗證淡喜,開發(fā)團隊將SPOTlight應(yīng)用于胰腺癌(PDAC)數(shù)據(jù),并確定了腫瘤微環(huán)境中臨床相關(guān)的免疫細(xì)胞狀態(tài)的空間組織瘟芝。
工具獲饶O痢:
https://github.com/MarcElosua/SPOTlight
SpatialDWLS
SpatialDWLS可以概括為兩個步驟贩汉,第一個步驟使用細(xì)胞類型富集分析方法來確定哪些類型的細(xì)胞在每個位置具有較高的概率,第二個步驟使用阻尼加權(quán)最小二乘法(DWLS)的擴展來確定指定位置的細(xì)胞類型的精確組成赐稽。與現(xiàn)有的去卷積方法相比,關(guān)鍵區(qū)別在于SpatialDWLS包含額外的過濾步驟括丁,以去除不相關(guān)的細(xì)胞類型,從而增強特異性构资。
性能評估:對一個模擬的空間轉(zhuǎn)錄組學(xué)數(shù)據(jù)集進行評估時,SpatialDWLS在具有較低的均方根誤差(RMSE)和計算時間方面優(yōu)于RCTD和stereoscope拦赠;開發(fā)團隊?wèi)?yīng)用SpatialDWLS分析了10X Genomics Visium數(shù)據(jù)集,該數(shù)據(jù)集映射了小鼠大腦中的空間轉(zhuǎn)錄組譜允乐;此外,SpatialDWLS還被應(yīng)用于確定在整個胚胎心臟發(fā)育過程中細(xì)胞類型組織在空間和時間上的變化鳞陨。
工具獲仍摇:在Giotto中可以輕松訪問SpatialDWLS方法享怀,這是一個用戶友好的軟件包,包含大量用于空間轉(zhuǎn)錄組數(shù)據(jù)分析和可視化的計算工具鳞贷。
https://github.com/RubD/Giotto
RCTD
RCTD利用注釋的scRNA-Seq數(shù)據(jù)創(chuàng)建數(shù)據(jù)中預(yù)期細(xì)胞群的細(xì)胞類型概況,然后使用監(jiān)督學(xué)習(xí)方法用細(xì)胞類型標(biāo)記空間轉(zhuǎn)錄組pixels庶近。由于這一分析的主要障礙之一是目前的空間轉(zhuǎn)錄組學(xué)數(shù)據(jù)集可能在一個pixel內(nèi)包含多種細(xì)胞類型反番,RCTD還可以擬合一個統(tǒng)計模型罢缸,以確定一個pixel內(nèi)存在的多種細(xì)胞類型,并將scRNA-Seq和SRT數(shù)據(jù)集之間的平臺效應(yīng)歸一化息楔。使用這種方法,RCTD能夠跨平臺對細(xì)胞進行分類愿险,準(zhǔn)確率接近90%风秤。與其他監(jiān)督學(xué)習(xí)方法一樣,使用該工具可以檢測的細(xì)胞類型受限于參考數(shù)據(jù)集的準(zhǔn)確和完整注釋甸鸟。
性能評估:RCTD可以準(zhǔn)確地發(fā)現(xiàn)模擬和真實空間轉(zhuǎn)錄組數(shù)據(jù)中細(xì)胞類型的定位。此外刻恭,RCTD還可以檢測細(xì)微的轉(zhuǎn)錄組差異,從而在空間上映射細(xì)胞亞型骑科。最后,開發(fā)團隊使用RCTD計算預(yù)期的細(xì)胞類型特異性基因表達(dá)斗埂,從而能夠根據(jù)細(xì)胞的空間環(huán)境檢測基因表達(dá)的變化。
工具獲妊 :
https://github.com/dmcable/RCTD
DSTG
DSTG是一種新的基于圖形的人工智能方法,其通過基于圖形的卷積網(wǎng)絡(luò)對空間轉(zhuǎn)錄組數(shù)據(jù)(ST)進行去卷積缕贡,可利用scRNA-seq數(shù)據(jù)揭示ST數(shù)據(jù)中的細(xì)胞混合物收擦。首先,DSTG從scRNA-seq數(shù)據(jù)構(gòu)建合成pseudo-ST數(shù)據(jù)宴猾。DSTG使用共享鄰近算法學(xué)習(xí)pseudo-ST數(shù)據(jù)和real-ST數(shù)據(jù)的spot映射鏈接圖,鏈接圖捕獲spot之間的內(nèi)在拓?fù)湎嗨菩远锾蓿seudo-ST和real-ST數(shù)據(jù)合并到同一個圖中進行學(xué)習(xí)。然后由捎,基于鏈接圖邻奠,使用半監(jiān)督圖卷積網(wǎng)絡(luò)(GCN)學(xué)習(xí)局部圖結(jié)構(gòu)和基因表達(dá)模式的潛在表示杀狡,以解釋spot的各種細(xì)胞組成。
性能評估:DSTG不僅在不同技術(shù)生成的合成空間數(shù)據(jù)上表現(xiàn)出優(yōu)異的性能恭陡,而且還有效地識別了小鼠皮層、海馬切片和胰腺腫瘤組織中細(xì)胞的空間組成:通過對從外周血單核細(xì)胞(PBMC)和其他組織生成的合成數(shù)據(jù)進行基準(zhǔn)評估拴疤,DSTG在預(yù)測的細(xì)胞混合和實際的細(xì)胞組成之間顯示了良好的準(zhǔn)確性苔埋;同時,DSTG在復(fù)雜組織(包括小鼠皮層晨炕、海馬和人胰腺腫瘤切片)的ST數(shù)據(jù)上也顯示出與H&E染色觀察高度一致的結(jié)果。
工具獲确鸭椤:
https://github.com/Su-informatics-lab/DSTG
stereoscope
stereoscope首先使用單細(xì)胞數(shù)據(jù)來描述每個細(xì)胞類型的表達(dá)譜,然后在每個捕獲位置內(nèi)找到這些類型的組合缨历,以最好地解釋空間數(shù)據(jù)。該模型框架利用單細(xì)胞數(shù)據(jù)推斷空間數(shù)據(jù)中每個捕獲位置的每個細(xì)胞類型的比例估計魄缚,從而消除了對空間數(shù)據(jù)分析時對要素或簇等抽象實體的任何解釋或注釋的必要性。
性能評估:為了證明stereoscope的實用性嚼隘,研究團隊使用來自不同實驗平臺的數(shù)據(jù)须肆,并對來自小鼠大腦和發(fā)育期心臟的細(xì)胞類型進行了空間映射,其排列方式與預(yù)期一致拒贱;為了說明stereoscope如何與其他空間技術(shù)結(jié)合使用,研究團隊分析了海馬和小腦的Slide-seq數(shù)據(jù)斜做,這些數(shù)據(jù)成功地再現(xiàn)了該技術(shù)最初發(fā)表的結(jié)果;此外霸旗,研究團隊設(shè)計了一個程序從真實的單細(xì)胞數(shù)據(jù)中收集類似于從空間技術(shù)獲得的合成數(shù)據(jù),將stereoscope與兩種最近發(fā)表的方法(DWLS和deconvSeq)進行比較精居,結(jié)果證實stereoscope的實現(xiàn)優(yōu)于其他兩種方法。
工具獲瓤詹隆:
https://github.com/almaan/stereoscope
重點介紹1坝疼、DSTG
最近發(fā)展的空間轉(zhuǎn)錄組學(xué)(ST)能夠?qū)⒔M織切片中不同點的空間信息與每個spots內(nèi)細(xì)胞的RNA豐度聯(lián)系起來仪芒,這對了解組織細(xì)胞結(jié)構(gòu)和功能尤為重要据沈。然而,對于這樣的ST數(shù)據(jù)孔祸,由于一個spot通常比單個細(xì)胞大,在每個spot測量的基因表達(dá)是來自具有異質(zhì)細(xì)胞類型的混合細(xì)胞惶室。因此,需要對每個spot的ST數(shù)據(jù)進行拆分鹅士,以揭示該空間spot的細(xì)胞組成。
DSTG是什么趾痘?
研究團隊提出了一種新的基于圖形的人工智能方法即DSTG,通過基于圖形的卷積網(wǎng)絡(luò)對ST數(shù)據(jù)進行去卷積侣集。DSTG可利用scRNA-seq數(shù)據(jù)揭示ST數(shù)據(jù)中的細(xì)胞混合物。
研究團隊假設(shè)在一個spot上捕獲的基因表達(dá)是由位于該spot上的細(xì)胞混合物貢獻的踪央。其策略是使用scRNA-seq衍生的合成ST數(shù)據(jù)畅蹂,稱為 "pseudo-ST",通過半監(jiān)督學(xué)習(xí)預(yù)測real-ST數(shù)據(jù)中的細(xì)胞組成旗唁。
首先祷嘶,DSTG從scRNA-seq數(shù)據(jù)構(gòu)建合成pseudo-ST數(shù)據(jù)烛谊。DSTG使用共享鄰近算法學(xué)習(xí)pseudo-ST數(shù)據(jù)和real-ST數(shù)據(jù)的spot映射鏈接圖,鏈接圖捕獲spot之間的內(nèi)在拓?fù)湎嗨菩运幔seudo-ST和real-ST數(shù)據(jù)合并到同一個圖中進行學(xué)習(xí)。然后村斟,基于鏈接圖,使用半監(jiān)督圖卷積網(wǎng)絡(luò)(GCN)學(xué)習(xí)局部圖結(jié)構(gòu)和基因表達(dá)模式的潛在表示日缨,以解釋spot的各種細(xì)胞組成。
DSTG的性能評估
DSTG不僅在不同技術(shù)生成的合成空間數(shù)據(jù)上表現(xiàn)出優(yōu)異的性能,而且還有效地識別了小鼠皮層尸红、海馬切片和胰腺腫瘤組織中細(xì)胞的空間組成:通過對從外周血單核細(xì)胞(PBMC)和其他組織生成的合成數(shù)據(jù)進行基準(zhǔn)評估,DSTG在預(yù)測的細(xì)胞混合和實際的細(xì)胞組成之間顯示了良好的準(zhǔn)確性盅蝗;同時,DSTG在復(fù)雜組織(包括小鼠皮層狂秦、海馬和人胰腺腫瘤切片)的ST數(shù)據(jù)上也顯示出與H&E染色觀察高度一致的結(jié)果。
DSTG在基準(zhǔn)測試數(shù)據(jù)集上的性能:研究團隊將DSTG和SPOTlight應(yīng)用于10個PBMC合成數(shù)據(jù)進行比較,結(jié)果表明與SPOTlight相比戴甩,DSTG的JSD值較低(平均JSD=0.12),說明在不同技術(shù)平臺生成的PBMC數(shù)據(jù)集上缴川,DSTG的精確度高于SPOTlight。除PBMC外恋日,為了檢查DSTG在其他不同組織上的性能誓竿,研究團隊納入了來自不同組織和技術(shù)的八個其他scRNA-seq數(shù)據(jù),以生成基準(zhǔn)合成數(shù)據(jù)毙死。根據(jù)這八個額外scRNA-seq數(shù)據(jù)的合成數(shù)據(jù),將DSTG與SPOTlight進行比較唉锌,使用JSD評估指標(biāo),DSTG的預(yù)測結(jié)果仍然優(yōu)于SPOTlight绿语。
此外,研究團隊還利用不同spot數(shù)量匹耕、庫大小和可變基因的離散合成數(shù)據(jù)驗證了DSTG的穩(wěn)定性。
***** JSD是一種度量兩個概率分布之間相似性的距離指標(biāo)。JSD值越小嘱蛋,表示兩個分布之間的相似性越高龄恋,因此表示跨點估計的細(xì)胞類型組成的準(zhǔn)確性越高荆萤。
利用scRNA-seq數(shù)據(jù)偏竟,DSTG對ST數(shù)據(jù)的空間去卷積準(zhǔn)確地重建了小鼠大腦皮層的結(jié)構(gòu)。每個定位點的識別的異質(zhì)細(xì)胞比例由各點的餅狀圖顯示,這些異質(zhì)細(xì)胞在皮層區(qū)域的存在得到證實睦疫,表明DSTG的預(yù)測具有很高的準(zhǔn)確性和敏感性。
DSTG對ST數(shù)據(jù)的空間分解準(zhǔn)確地識別了海馬切片內(nèi)的不同細(xì)胞類型瓦糕;DSTG還準(zhǔn)確預(yù)測了細(xì)胞類型特異性基因的表達(dá)。
在胰腺導(dǎo)管腺癌(PDAC)數(shù)據(jù)集上,DSTG的結(jié)果與獨立的組織學(xué)注釋一致灾而,證明了其從腫瘤組織的ST數(shù)據(jù)中準(zhǔn)確識別細(xì)胞成分的能力。
DSTG為推斷異質(zhì)細(xì)胞亞群之間的功能關(guān)系鋪平了道路橙困,其依據(jù)是它們在組織spots中的組成和共定位。這包括跨越相鄰spots的細(xì)胞間交流夏跷,這為未來以空間分辨率的方式研究完整的相互作用組提供了可能性。此外猫态,由于組織的精確組成可能因病人個體而異,未來細(xì)胞亞群的空間組成對病人有預(yù)后價值义辕。研究團隊預(yù)計,使用DSTG的空間去卷積將有助于未來病人的預(yù)后和病理評估周崭。
文中提到的所有函數(shù)都是作為Python軟件實現(xiàn),可通過Github獲让健:https://github.com/Su-informatics-lab/DSTG.
重點介紹2、國產(chǎn)空轉(zhuǎn)工具推薦 | STRIDE:使用scRNA-seq對空間轉(zhuǎn)錄組進行精準(zhǔn)的整合分析
2022年3月,來自同濟大學(xué)的科研團隊在《Nucleic acids research》發(fā)表了一種基于主題模型的空間轉(zhuǎn)錄組學(xué)去卷積方法:STRIDE恢暖,通過機器學(xué)習(xí)方法及數(shù)據(jù)整合舆床,將空間轉(zhuǎn)錄組學(xué)數(shù)據(jù)提升至單細(xì)胞精度。
STRIDE是什么坷备?
STRIDE是一種基于主題模型的去卷積方法赌蔑,通過與匹配的scRNA-seq整合用于空間轉(zhuǎn)錄組學(xué)分析娃惯。STRIDE首先通過進行主題建模從注釋的單細(xì)胞轉(zhuǎn)錄組中發(fā)現(xiàn)細(xì)胞類型相關(guān)的主題。然后皿哨,STRIDE應(yīng)用預(yù)先訓(xùn)練好的主題模型來推斷空間轉(zhuǎn)錄組中每個位置的細(xì)胞類型組成。
首先,STRIDE估計來自scRNA-seq的基因-主題分布和主題-細(xì)胞分布澳化。然后通過貝葉斯定理將逐個主題的分布總結(jié)為逐個主題的細(xì)胞類型分布井濒。接下來,應(yīng)用預(yù)訓(xùn)練的主題模型來推斷空間轉(zhuǎn)錄組學(xué)中每個位置的主題分布撞蚕。通過結(jié)合細(xì)胞類型-主題分布和主題-位置分布,可以推斷每個空間位置的細(xì)胞類型比例刀疙。STRIDE還提供多種下游分析功能,包括特征檢測和可視化疚鲤、空間域識別和從同一組織的連續(xù)ST切片重建空間結(jié)構(gòu)。
STRIDE的性能測試
開發(fā)團隊通過使用模擬的空間轉(zhuǎn)錄組數(shù)據(jù)诲宇,驗證了STRIDE預(yù)測細(xì)胞類型比例的高精度和靈敏度。為了證明STRIDE的廣泛效用它掂,開發(fā)團隊將其應(yīng)用于三個不同組織的空間轉(zhuǎn)錄組學(xué)數(shù)據(jù)集,包括小鼠小腦、人類鱗狀細(xì)胞癌(SCC)和人類發(fā)育中的心臟肢簿,證明了STRIDE產(chǎn)生的主題可以準(zhǔn)確地反映每種細(xì)胞類型的空間特征缎讼,提高空間聚類的分辨率血崭,最終有助于在整合多個切片的基礎(chǔ)上重建組織的三維結(jié)構(gòu)。
首先驗證了主題建模發(fā)現(xiàn)細(xì)胞類型特定主題的能力。開發(fā)團隊得出了28個不同的主題月匣,這些主題在不同的細(xì)胞類型中富集(上圖A),表明主題與特定的細(xì)胞類型之間存在關(guān)聯(lián)。
此外粪狼,當(dāng)使用用于訓(xùn)練的相同scRNA-seq數(shù)據(jù)集驗證訓(xùn)練后的主題模型時,STRIDE取得了較高的細(xì)胞類型分配準(zhǔn)確性(87.13%,n = 33043個細(xì)胞)(上圖B)疾就。
接下來,開發(fā)團隊比較了STRIDE與其他已發(fā)布的細(xì)胞類型去卷積工具的性能:STRIDE顯示了預(yù)測與基礎(chǔ)事實之間的最高一致性姑荷,而RCTD和cell2location的一致性稍差(上圖D)添寺;STRIDE實現(xiàn)了靈敏度和特異性之間的平衡,而其他方法以犧牲低靈敏度為代價實現(xiàn)了高特異性(上圖E)薄坏。
上述結(jié)果表明,STRIDE能以較高的精度估計不同類型細(xì)胞的比例,并能兼容空間共定位的細(xì)胞類型分布以及低測序深度闻牡。
STRIDE可以基于潛在主題去卷積空間轉(zhuǎn)錄組學(xué)的細(xì)胞類型組成。另一方面割以,單細(xì)胞和空間轉(zhuǎn)錄組學(xué)的共享主題也可用于將單細(xì)胞映射到空間位置严沥。這樣消玄,單細(xì)胞多組學(xué)數(shù)據(jù)(如scNome-seq和scNMT-se),可以通過scRNA-seq與空間轉(zhuǎn)錄組學(xué)整合丢胚,以揭示空間調(diào)控機制翩瓜。隨著時空轉(zhuǎn)錄組學(xué)和調(diào)控譜的積累嗜桌,STRIDE可以進一步加強相满,以闡明組織發(fā)育或腫瘤發(fā)展過程中的時空多組學(xué)動態(tài)建蹄。此外劲腿,目前大多數(shù)空間技術(shù)都是在二維空間中量化基因表達(dá)和推斷細(xì)胞類型分布花椭。盡管基于主題的多個空間轉(zhuǎn)錄組學(xué)樣本的整合被證明有助于組織結(jié)構(gòu)的三維重建嗦锐,但預(yù)計在成像數(shù)據(jù)和其他方式的數(shù)據(jù)的幫助下,將有可能通過STRIDE建立一個更全面和多尺度的三維組織圖譜。
STRIDE是一個開源python包,其源代碼可以在如下鏈接獲却毡!: https://github.com/wanglabtongji/STRIDE
重點介紹3芝此、stereoscope
空間轉(zhuǎn)錄組技術(shù)正在廣泛應(yīng)用膊升,然而目前一些轉(zhuǎn)錄組的空間分析還達(dá)不到單細(xì)胞的分辨率水平责循。為了達(dá)到將基因表達(dá)置于空間環(huán)境中并劃定組織內(nèi)細(xì)胞類型空間分布的目的歹垫,來自瑞典的科研團隊提出一種基于模型的概率方法:stereoscope胎围,使用單細(xì)胞數(shù)據(jù)來解析空間數(shù)據(jù)中的細(xì)胞混合物。
stereoscope是什么?
該模型框架利用單細(xì)胞數(shù)據(jù)推斷空間數(shù)據(jù)中每個捕獲位置的每個細(xì)胞類型的比例估計,從而消除了對空間數(shù)據(jù)分析時對要素或簇等抽象實體的任何解釋或注釋的必要性。
stereoscope概述:首先使用單細(xì)胞數(shù)據(jù)來描述每個細(xì)胞類型的表達(dá)譜唾那,然后在每個捕獲位置內(nèi)找到這些類型的組合河哑,以最好地解釋空間數(shù)據(jù)。
研究團隊已經(jīng)在代碼中實現(xiàn)了這個方法,并將其作為一個名為stereoscope的開源python包發(fā)布衷模,它可執(zhí)行去卷積過程并對細(xì)胞類型進行空間映射,該過程是無縫的,可通過多種技術(shù)轉(zhuǎn)換,并且不需要對數(shù)據(jù)進行任何預(yù)處理迎瞧。
單側(cè)配對Wilcoxon符號秩檢驗結(jié)果
技術(shù)應(yīng)用
通過設(shè)計捷绑,stereoscope適用于任何類型的空間數(shù)據(jù),其應(yīng)用也十分廣泛:
在癌癥中評估腫瘤浸潤性免疫細(xì)胞的存在和特性,或者描繪出構(gòu)成腫瘤微環(huán)境的細(xì)胞類型蚀浆;
從空間共定位模式推斷出細(xì)胞類型的相互作用;
通過檢查比例值在組織中的分布情況,確定相關(guān)解剖區(qū)域內(nèi)細(xì)胞類型的豐富程度;
有關(guān)細(xì)胞類型的空間分布信息可以作為多種不同分析的基礎(chǔ)晶伦。
stereoscope軟件包可在如下鏈接獲却嘌汀:https://github.com/almaan/stereoscope.
第七章,空間轉(zhuǎn)錄組數(shù)據(jù)集分析轉(zhuǎn)座因子表達(dá)
空間轉(zhuǎn)錄組學(xué)(ST)正在改變我們研究基因表達(dá)的方式捡硅。然而在大量轉(zhuǎn)錄組數(shù)據(jù)中琳拨,轉(zhuǎn)座因子(TE)由于其高度重復(fù)性而未被研究驳棱。近年來合呐,TEs被認(rèn)為是基因表達(dá)的重要調(diào)節(jié)因子。因此老玛,以空間分辨率的方式進行TE表達(dá)分析豹休,可以進一步幫助了解它們在組織內(nèi)基因調(diào)節(jié)中的作用佑淀。
近日较雕,《International journal of molecular science》發(fā)表了一個從ST數(shù)據(jù)集分析TE表達(dá)的工具:SpatialTE笛粘。
SpatialTE是什么?
為了提高ST分析的潛力拱她,科研團隊開發(fā)了SpatialTE,這是一個定量的生物信息學(xué)工具,可以從ST獲得的組織(如大腦、脊髓瞧毙、腎臟等)數(shù)據(jù)集中檢查和分析TE表達(dá)篮迎。
根據(jù)使用的ST技術(shù)镊掖,虛線框?qū)?yīng)于SpatialTE的輸入文件(以文件圖標(biāo)和名稱顯示)匪蝙。綠色框?qū)?yīng)于外部ST分析流程的運行(執(zhí)行每個空間點的基因表達(dá)的讀取對齊和識別)蜡歹,而黃色框?qū)?yīng)于SpatialTE中的關(guān)鍵過程:首先瞻凤,具有至少1個read的TEs被選中;其次砌函,對于這些被選中的TEs計算兩個指標(biāo):覆蓋率和映射分?jǐn)?shù)摧玫;第三,TEs可以通過用戶定義的覆蓋率閾值進行過濾否纬;最后,SpatialTE根據(jù)TEs的映射分?jǐn)?shù)生成兩個輸出文件(TEs按位置和分類)。
SpatialTE的基準(zhǔn)測試和驗證
根據(jù)科研團隊的基準(zhǔn)和驗證實驗表明:SpatialTE可以精確地確定TE表達(dá)的空間位置菲驴。
將SpatialTE應(yīng)用于ALS患病小鼠脊髓的數(shù)據(jù)谤绳,顯示TEs確實在不同的空間位置表達(dá)桐臊。有趣的是砚著,TEs在背角和腹角的表達(dá)比在脊髓的內(nèi)側(cè)或遠(yuǎn)端區(qū)域觀察到的表達(dá)要高餐胀。
根據(jù)LINE、SINE脐嫂、LTR和DNA轉(zhuǎn)座子的類別分析TE表達(dá)顯示:除了DNA轉(zhuǎn)座子外娃善,所有類別都有助于TE的總表達(dá)。這些結(jié)果與證據(jù)一致撤摸,表明一些LTR和non-LTR TE(如LINE和SINE)在疾病中被激活论悴。此項研究結(jié)果揭示了TE類別之間的差異饼记。
研究團隊還將SpatialTE的使用擴展到其他高度異質(zhì)的組織掘猿,如成年小鼠大腦的10×空間轉(zhuǎn)錄組數(shù)據(jù)集,其研究結(jié)果表明在所有的大腦切片中都可以看到TE的表達(dá)丸冕,每一類都顯示出不同的活動模式。這些結(jié)果表明TEs具有不同的空間表達(dá)律想,進一步表明TEs以特定方式對每個大腦區(qū)域的基因調(diào)控網(wǎng)絡(luò)特征作出貢獻屿衅。
最后研究團隊想將SpatialTE應(yīng)用于尚未研究過TEs的樣本疯兼。為此中狂,其使用了成年小鼠腎臟的相應(yīng)冠狀切片惯驼。結(jié)果顯示:TEs在腎臟中確實有不同的表達(dá),而且它們的表達(dá)辆憔,至少對某些TE來說,是受空間控制的帖世;TEs在腎臟的各個區(qū)域(髓質(zhì)與皮質(zhì))發(fā)揮著調(diào)節(jié)作用。
了解TEs在基因調(diào)控中的作用與發(fā)生在大腦或周圍器官的許多其他退行性疾病有關(guān)。未來的研究將從SpatialTE中受益溶褪,并開始揭示TEs表達(dá)差異背后的機制芬萍。重要的是蚜点,闡明TEs是否在以細(xì)胞特異性方式調(diào)節(jié)基因表達(dá)方面發(fā)揮作用。
SpatialTE是作為一個開源的Bash腳本實現(xiàn)的,其詳細(xì)的使用說明可在GitHub存儲庫的README文件中找到:
https://github.com/bvaldebenitom/SpatialTE
參考文獻
Dries R, Chen J, Del Rossi N, et al. Advances in spatial transcriptomic data analysis[J]. Genome Research, 2021, 31(10): 1706-1718.
Nerurkar S N, Goh D, Cheung C C L, et al. Transcriptional Spatial Profiling of Cancer Tissues in the Era of Immunotherapy: The Potential and Promise[J]. Cancers, 2020, 12(9): 2572.
Li K, Yan C, Li C, et al. Computational elucidation of spatial gene expression variation from spatially resolved transcriptomics data[J]. Molecular Therapy-Nucleic Acids, 2021.
He, Y., Tang, X., Huang, J. et al. ClusterMap for multi-scale clustering analysis of spatial gene expression.Nat Commun 12, 5909 (2021).
Xu, Y., McCord, R.P. CoSTA: unsupervised convolutional neural network learning for spatial transcriptomics analysis. BMC Bioinformatics 22, 397 (2021).
Zhao, E., Stone, M.R., Ren, X. et al. Spatial transcriptomics at subspot resolution with BayesSpace. Nat Biotechnol (2021).
Teng H, Yuan Y, Bar-Joseph Z. Clustering spatial transcriptomics data[J]. Bioinformatics, 2021.
Bergenstr?hle J, Bergenstr?hle L, Lundeberg J. SpatialCPie: an R/Bioconductor package for spatial transcriptomics cluster evaluation[J]. BMC bioinformatics, 2020, 21: 1-7.
Rao, A., Barkley, D., Fran?a, G.S. et al. Exploring tissue architecture using spatial transcriptomics. Nature 596, 211–220 (2021).
Zhao, E., Stone, M.R., Ren, X. et al. Spatial transcriptomics at subspot resolution with BayesSpace. Nat Biotechnol (2021).
Song Q, Su J. DSTG: deconvoluting spatial transcriptomics data through graph-based artificial intelligence[J]. Briefings in Bioinformatics, 2021.
Sun D, Liu Z, Li T, et al. STRIDE: accurately decomposing and integrating spatial transcriptomics using single-cell RNA sequencing[J]. Nucleic acids research, 2022, 50(7): e42-e42.
Andersson A, Bergenstr?hle J, Asp M, et al. Single-cell and spatial transcriptomics enables probabilistic inference of cell type topography[J]. Communications biology, 2020, 3(1): 1-8.
Valdebenito-Maturana B, Guatimosim C, Carrasco MA, Tapia JC. Spatially Resolved Expression of Transposable Elements in Disease and Somatic Tissue with SpatialTE. Int J Mol Sci. 2021 Dec 20;22(24):13623.
生活很好胖笛,有你更好