空間轉(zhuǎn)錄組技術(shù)生成具有空間背景的基因表達(dá)譜殴胧,需要空間信息分析工具來完成三個關(guān)鍵任務(wù):空間聚類渗稍、多樣本整合和細(xì)胞類型去卷積。近日团滥,《Nature Communications》發(fā)表了一種圖自我監(jiān)督的對比學(xué)習(xí)方法:GraphST竿屹,其充分利用空間轉(zhuǎn)錄組學(xué)數(shù)據(jù),以優(yōu)于現(xiàn)有方法灸姊。
GraphST是什么拱燃?
GraphST是一種圖自我監(jiān)督對比學(xué)習(xí)方法,它充分利用空間信息和基因表達(dá)譜進(jìn)行空間信息聚類力惯、整合和細(xì)胞類型去卷積碗誉。通過在GraphST中使用自我監(jiān)督對比學(xué)習(xí),發(fā)現(xiàn)它提高了學(xué)習(xí)下游分析的相關(guān)潛在特征的性能父晶。
GraphST包括三個模塊哮缺,每個模塊都具有分別針對三個任務(wù)定制的圖形自我監(jiān)督對比學(xué)習(xí)架構(gòu):空間信息聚類(上圖A)、多個組織切片的垂直和水平批量集成(上圖?B)甲喝,以及通過向ST投影scRNA-seq來進(jìn)行空間細(xì)胞類型去卷積(上圖C)尝苇。在所有三個模塊中,利用空間轉(zhuǎn)錄組學(xué)數(shù)據(jù)集的空間信息來構(gòu)建鄰域圖,其中空間上彼此接近的點(diǎn)被連接起來糠溜。接下來淳玩,構(gòu)建圖卷積網(wǎng)絡(luò)作為編碼器,通過迭代聚集來自相鄰點(diǎn)的基因表達(dá)非竿,將基因表達(dá)譜和空間相似性嵌入潛在表示空間中凯肋。
GraphST的性能測試
開發(fā)團(tuán)隊(duì)利用GraphST在人類和小鼠組織的不同10x Visium、Stereo-seq和Slide-seqV2數(shù)據(jù)集上的三個分析任務(wù)進(jìn)行了廣泛測試汽馋,這些組織包括人腦侮东、人類乳腺癌癥組織、人類淋巴結(jié)豹芯、小鼠乳腺癌癥悄雅、小鼠嗅球、小鼠大腦和小鼠胚胎铁蹈。
聚類測試表明GraphST在識別空間域方面優(yōu)于七種現(xiàn)有方法宽闲。
GraphST聚類改善了人類背外側(cè)前額葉皮層(DLPFC)、小鼠嗅球和小鼠海馬組織中組織結(jié)構(gòu)的識別握牧。
GraphST能夠準(zhǔn)確識別Stereo-seq小鼠胚胎中的不同器官容诬。
對小鼠乳腺癌和小鼠腦數(shù)據(jù)集的聯(lián)合分析表明:GraphST能夠從多個組織切片中準(zhǔn)確識別空間域,同時有效地消除批量效應(yīng)沿腰,而無需明確檢測批量因素览徒。
GraphST 能夠分別對小鼠乳腺癌的 ST 數(shù)據(jù)和小鼠大腦前部和后部數(shù)據(jù)進(jìn)行準(zhǔn)確的垂直和水平整合。
開發(fā)團(tuán)隊(duì)還測試了 GraphST 將 scRNA-seq 數(shù)據(jù)投影到 ST 上以預(yù)測空間點(diǎn)中的細(xì)胞狀態(tài)(細(xì)胞類型和樣本類型)颂龙。計(jì)算出的細(xì)胞點(diǎn)映射矩陣比 cell2location(性能最好的去卷積方法)更準(zhǔn)確地估計(jì)細(xì)胞類型組成习蓬。
比較 GraphST 與TOP去卷積方法 cell2location 在預(yù)測 scRNA-seq 數(shù)據(jù)與模擬數(shù)據(jù)、人類淋巴結(jié)和 DLPFC 切片 151673 的空間分布方面的準(zhǔn)確性措嵌。
GraphST可以將scRNA-seq中提取的樣本表型轉(zhuǎn)移到ST上躲叼。開發(fā)團(tuán)隊(duì)通過描繪腫瘤衍生組織切片中的腫瘤和正常相鄰區(qū)域來證明了這一能力。
GraphST 能夠?qū)θ祟惾橄侔?shù)據(jù)中的 scRNA-seq 數(shù)據(jù)進(jìn)行全面準(zhǔn)確的空間映射企巢。
GraphST工具包的開源Python實(shí)現(xiàn)可從如下鏈接獲确憧丁:?
https://github.com/JinmiaoChenLab/GraphST.??
首發(fā)公號國家基因庫大數(shù)據(jù)平臺
參考文獻(xiàn)
Long, Y., Ang, K.S., Li, M.?et al.?Spatially informed clustering, integration, and deconvolution of spatial transcriptomics with GraphST.?Nat Commun?14, 1155 (2023).