空間轉錄組結合多模態(tài)數(shù)據(jù)進行空間數(shù)據(jù)分析正在成為熱點,包括昨天剛介紹的METI和今天的文章垦藏。
近日梆暖,《Nature Communications》又發(fā)表了一篇關于空間轉錄組分辨率增強的創(chuàng)新性的算法soScope(spatial omics scope),結合了多模態(tài)數(shù)據(jù)來增強不同分子類別的組學剖面掂骏。以往的方法主要增強單一組織模態(tài)的組學剖面轰驳,例如空間位置(BayesSpace)或者圖像(XFuse和iStar),忽視了大多數(shù)空間平臺可用的豐富的多模態(tài)組織信息弟灼,此外级解,這些方法主要針對轉錄組學數(shù)據(jù),其統(tǒng)計假設不適用于其他空間組學類別田绑。那么soScope有哪些特點呢勤哗?
文章信息:
- 雜志,Nature Communications掩驱,IF 14.7
- 標題:Tissue characterization at an enhanced resolution across spatial omics platforms with deep generative model
摘要
近期空間組學領域的進展已經將分析的分子類別擴展到轉錄組學之外芒划。然而冬竟,許多這些技術受到空間分辨率的限制,阻礙了我們深入表征復雜組織結構的能力±白矗現(xiàn)有的計算方法主要關注轉錄組數(shù)據(jù)的分辨率增強诱咏,缺乏適應性來解決新興的空間組學技術。文章介紹了soScope缴挖,這是一個統(tǒng)一的生成框架袋狞,旨在提高從多種空間技術獲得的分子剖面數(shù)據(jù)的質量和空間分辨率。soScope通過分布先驗映屋,結合組學苟鸯、空間關系和圖像的多模態(tài)組織信息,并聯(lián)合推斷具有組學特異性建模的增強分辨率的組學剖面棚点。通過在多種空間組學平臺上進行全面評估早处,包括Visium、Xenium瘫析、spatial-CUT&Tag和slide-DNA/RNA-seq砌梆,soScope提高了識別生物學意義重大的腸道和腎臟結構的性能,揭示了原始分辨率下無法解析的胚胎心臟結構贬循,并糾正了由測序和樣本處理引起的樣本和技術偏差咸包。此外,soScope擴展到空間多組學技術空間-CITE-seq和空間ATAC-RNA-seq杖虾,利用跨組學參考同時增強多組學烂瘫。soScope提供了一個多功能工具,以提高不斷擴展的空間組學技術和資源的利用奇适。
創(chuàng)新點
soScope 同時考慮了分子剖面坟比、空間近鄰、H&E圖像用于空間分辨率增強嚷往,而且適用于非常多的空間技術平臺葛账,以及多組學數(shù)據(jù)。
問題導讀
- 空間多模態(tài)數(shù)據(jù)有哪些间影?
- 如何評估分辨率增強的效果注竿?
算法概述
soScope 是一個統(tǒng)一的生成模型,它整合了來自多種空間組學平臺的分子剖面(X)魂贬、空間鄰接關系(A)和形態(tài)圖像特征(Y)巩割,旨在將每個spot分割成多個subspot(bX)(圖1a、b)付燥。該模型包括三個步驟(圖1c):(1)spot-level特征學習宣谈;(2)subspot-level圖像特征學習:與subspot區(qū)域對應的圖像塊從高分辨率組織圖像中分割出來,并轉化為subspot的形態(tài)特征键科;(3)subspot-level組學剖面推斷闻丑。soScope有效地生成了數(shù)據(jù)噪聲減少和空間分辨率增強的組學剖面漩怎,以更精細地表征組織結構。
主要結果
soScope outperforms enhancement approaches developed for spatial transcriptomics
現(xiàn)有的提高空間組學分辨率的計算方法主要關注轉錄組學嗦嗡。因此勋锤,文章最初在由多種平臺生成的空間轉錄組學(ST)數(shù)據(jù)集上評估了soScope。將soScope與三種已建立的方法進行了比較:iStar和XFuse侥祭,它們利用圖像信息來增強轉錄剖面叁执,以及BayesSpace,它使用空間坐標來推斷高分辨率表達數(shù)據(jù)矮冬。此外谈宛,還包括了一個只使用圖像輸入的soScope變體,稱為圖像soScope胎署,作為參考吆录。由于沒有高分辨率的真實數(shù)據(jù)用于評估,文章提出了通過合并鄰近斑點的轉錄數(shù)據(jù)來模擬“低分辨率”表達剖面琼牧。然后恢筝,文章通過將恢復的表達與原始剖面進行比較,評估了分辨率增強方法的性能(圖2a)巨坊。
首先滋恬,考慮了一個使用Visium平臺生成的人類腸道數(shù)據(jù)集,包含2,649個spot抱究,以及高分辨率的蘇木精和伊紅(H&E)染色圖像。腸道樣本中的層狀結構使其成為展示分辨率增強益處的一個很好的例子(圖2b带斑,H&E圖像放大區(qū)域)鼓寺。按照基準設計,將2,649個斑點合并為369個“低分辨率”斑點勋磕,這些斑點聚合了相應鄰近斑點的基因表達妈候。所有方法都使用了相同的處理過的組學數(shù)據(jù)作為輸入。對于soScope挂滓,圖像特征是從預訓練的Inception-v3模型在對應子斑點區(qū)域的H&E圖像塊中獲得的苦银,并且在增強基因表達的生成建模中使用了負二項(NB)分布。文章檢查了腸道組織中的三個功能區(qū)域:上皮層赶站、肌層和免疫區(qū)域幔虏,并選擇了9個在先前研究中報告的區(qū)域marker用于分辨率增強評估。與原始表達相比贝椿,區(qū)域“合并”剖面大大降低了基因marker的層狀空間模式(圖2c想括,第二列)。從增強分析(圖2c和補充圖2b)來看烙博,僅使用圖像信息的iStar在免疫區(qū)域表現(xiàn)良好瑟蜈;然而烟逊,它未能恢復上皮層和肌層區(qū)域的精細結構。另一種基于圖像的方法铺根,XFuse宪躯,在肌層區(qū)域表現(xiàn)良好;然而位迂,它被區(qū)域間強烈的形態(tài)相似性所誤導访雪,并沒有很好地保留上皮層和免疫區(qū)域的組織結構。僅依賴空間信息的BayesSpace在增強剖面中并沒有顯著細化區(qū)域邊界囤官。圖像soScope由于缺乏轉錄組學的信息冬阳,未能恢復大多數(shù)模式。相比之下党饮,soScope在所有三個區(qū)域都取得了合理的性能肝陪。通過使用皮爾遜相關性和均方誤差(MSE)對增強表達進行定量評估,soScope始終展現(xiàn)出最高一致性和最低重建誤差(圖2d)刑顺。接下來氯窍,我們使用Kolmogorov–Smirnov(KS)距離檢查了每個marker基因在其相應組織區(qū)域內外表達分布的差異。soScope和iStar為大多數(shù)測試基因產生了最明顯的分離(圖2e)蹲堂,并實現(xiàn)了與原始剖面(紅色虛線)類似的可區(qū)分性狼讨。
其次,文章評估了來自Xenium平臺的小鼠頭部數(shù)據(jù)集柒竞。所有379個測量基因都包括在分析中政供,我們將2,619個斑點合并為291個“低分辨率”斑點,以進行分辨率增強分析朽基。相應的H&E圖像區(qū)域被轉換為深度特征布隔,如前所述,以幫助增強稼虎。從增強結果(圖2f衅檀、g和補充圖3b)來看,觀察到iStar和soScope在保留高分辨率表達剖面方面都表現(xiàn)良好霎俩。然而哀军,通過檢查基于它們的變化性(圖2h)或豐度的基因,我們發(fā)現(xiàn)soScope在不同變化中表現(xiàn)出更穩(wěn)定的性能打却。此外杉适,調查了分辨率增強是否會影響基因相關性。發(fā)現(xiàn)大多數(shù)方法在分辨率增強后都能保持基因間的相關性模式学密,除了XFuse(圖2i)淘衙,無論生物學變異性差異如何。值得注意的是腻暮,soScope通過MSE或皮爾遜相關性展示了最高性能(補充圖3d)彤守。
第三毯侦,文章評估了soScope在增強單細胞分辨率方面的能力。使用了Xenium分析的小鼠腎臟數(shù)據(jù)集(圖2j)具垫,涵蓋了1538個細胞侈离。將組織劃分為小正方形區(qū)域,并聚合了每個區(qū)域內細胞的基因表達筝蚕,目的是恢復它們的細胞表達卦碾。在分析中,使用了原始研究中鑒定的前5個豐度最高的和前5個標記基因以及每個單細胞的深度特征起宽。從結果來看洲胖,觀察到iStar傾向于高估高細胞密度和高表達區(qū)域的表達水平(圖2k和補充圖3e)。相反坯沪,soScope展示了與真實情況更一致的表達模式(圖2l)绿映。
這些發(fā)現(xiàn)證明了soScope在提高不同技術平臺、分辨率要求和基因統(tǒng)計特征的轉錄數(shù)據(jù)空間分辨率方面的能力腐晾,從而能夠詳細地表征組織結構叉弦。
soScope achieves consistent performance in tissue structure recovery from extremely low-resolution profiles simulated from slide-DNA/RNA-seq data
在先前的實驗中展示了 soScope 在具有固定分辨率增強比例的空間組學數(shù)據(jù)集上的性能。然而藻糖,不同的空間組學技術具有不同的空間分辨率淹冰,這一點很重要。例如巨柒,在最初的空間轉錄組學技術中樱拴,每個測序斑點可能覆蓋約 10-200 個細胞,而在較新的 Visium 平臺上洋满,一個斑點包括 6-10 個細胞疹鳄。這些原始數(shù)據(jù)的變化要求分辨率增強方法能夠在不同空間分辨率下對組織進行穩(wěn)健的剖面恢復。在這里芦岂,文章設計了一個多尺度壓力測試,以評估和校準不同方法在增強不同原始分辨率的組學數(shù)據(jù)時的性能垫蛆。
為了進行多尺度測試禽最,使用了 slide-seq 技術對小鼠肝臟腫瘤組織進行剖面分析的數(shù)據(jù)集,該技術使用帶條碼的磁珠在組織中編碼空間信息袱饭,實現(xiàn)了接近單細胞分辨率的空間測序川无。slide-seq 原始數(shù)據(jù)的高分辨率允許我們以不同尺度生成低分辨率數(shù)據(jù),并測試從這些數(shù)據(jù)中恢復原始剖面的能力虑乖。該肝臟腫瘤組織包括兩個轉移克隆區(qū)域懦趋,并使用 slide-DNA-seq 和 slide-RNA-seq 進行了剖面分析,包括 24,679 個 DNA 磁珠和 31,286 個 RNA 磁珠(圖 4a)疹味。為了進行測試仅叫,將整個組織劃分為 60×60 分辨率的小正方形區(qū)域帜篇,并逐漸合并不同大小的鄰近區(qū)域,形成一個低分辨率斑點诫咱。使用所有測試方法笙隙,目標是從降低分辨率的數(shù)據(jù)中恢復原始剖面(圖 4b)。
首先關注了 slide-DNA-seq 中前兩個 DNA 主成分(PCs)的增強測試坎缭,如原始工作中所用(圖 4a竟痰,右側)。采用高斯分布來模擬 soScope 模型中的 DNA PCs掏呼。在原始數(shù)據(jù)中坏快,DNA PC1 在克隆 A 區(qū)域(Clone-A PC)表現(xiàn)出高富集,而 PC2 富集在克隆 B 區(qū)域(Clone-B PC)憎夷。隨著分辨率的降低莽鸿,DNA 區(qū)域模式急劇惡化(圖 4c,第一行)岭接。在分辨率增強之后富拗,發(fā)現(xiàn)僅考慮斑點之間空間關系的方法能夠捕獲對應于兩個癌癥克隆的正確區(qū)域;然而鸣戴,這些方法傾向于過度平滑表達模式啃沪,特別是在從極低分辨率(10×10)的數(shù)據(jù)中恢復時。相比之下窄锅,基于圖像或聯(lián)合預測方法(Image linear, Image GP, Image MLP, 和 Joint MLP)更好地保留了局部表達模式创千。然而,正如原始出版物中提到的入偷,由于組織處理追驴,H&E 圖像和 DNA 剖面之間存在輕微的空間坐標不匹配。這些方法被 H&E 數(shù)據(jù)所誤導疏之,并重建了與 H&E 圖像定義的克隆區(qū)域更相似的高分辨率 DNA PCs(圖 4a)殿雪,而不是原始 DNA 數(shù)據(jù)(圖 4c,左側锋爪;與虛線區(qū)域輪廓比較)丙曙。相比之下,soScope 成功地保留了局部表達模式其骄,同時準確地重建了原始克隆區(qū)域亏镰,即使是從極低分辨率的數(shù)據(jù)中也是如此。這突出了 soScope 能夠使用生成框架整合空間和跨模態(tài)信息以實現(xiàn)穩(wěn)健分辨率增強的重要性拯爽。
從定量評估(圖 4d)來看索抓,大多數(shù)方法隨著分辨率的降低而準確性下降。soScope 在不同分辨率下始終顯示出穩(wěn)定的性能,準確性的下降相對較小逼肯。為了進一步驗證重建的 DNA 特征是否能夠反映組織結構耸黑,對增強剖面進行了 k-means 聚類。當將聚類數(shù)(k)設置為 3 時汉矿,所有方法都成功地識別了之前定義的三個區(qū)域(圖 4e崎坊,頂部和補充圖 7,左側)洲拇。為了探索更詳細的結構奈揍,將聚類數(shù)增加到 4,揭示了克隆 A 內部的一個亞區(qū)域赋续,其 PC1 的表達極高(圖 4e男翰,底部)。在各種方法中纽乱,只有 soScope 和 Spatial GP 重建的 DNA PCs 能夠一致地捕獲所有降低分辨率下的這種亞結構(圖 4e蛾绎,底部和補充圖 7,右側)鸦列。除了 DNA 分析租冠,我們還對使用 slide-RNA-seq 從同一組織獲得的轉錄數(shù)據(jù)進行了壓力測試。
其它章節(jié)
文章展示了soScope在其它組學上的表現(xiàn)薯嗤,展示了除空間轉錄組外的其它應用顽爹。如soScope 能夠降低測序噪聲并在通過spatial-CUT&Tag分析的小鼠胚胎上揭示詳細結構,soScope通過利用空間CITE -seq和空間ATAC-RNAseq數(shù)據(jù)的交叉組參考來糾正技術偏差骆姐。
應用前景
soScope 在多種分子類型和不同空間技術剖面的健康和疾病組織上展示出了 有效性和通用性镜粤,包括 Visium、Xenium玻褪、空間-CUT&Tag肉渴、slide-DNA-seq、slide-RNA-seq带射、空間-CITE-seq 和空間 ATAC-RNA-seq同规,在細化組織領域識別、提高已知marker的區(qū)分度以及校正數(shù)據(jù)和技術偏差方面表現(xiàn)很好窟社,相比于當前只依賴單一模態(tài)的分辨率增強工具更值得嘗試捻浦。
雖然 soScope 提供了預指定的subspot或細胞位置的增強剖面,但它可能無法達到亞細胞分辨率桥爽。通過修改 soScope,以納入來自相同組織的配對單細胞組學數(shù)據(jù)昧识,可以進一步提高分辨率钠四。此外,soScope 將 H&E 圖像作為輸入,這些圖像可以在某些臨床研究中由專家輕松注釋缀去。通過修改 soScope侣灶,以納入人工標簽并以半監(jiān)督的方式指導后驗推斷,可以改進潛在表征和剖面學習缕碎。這些擴展性可能增加soScope的應用場景褥影。
一句話評價
多一種選擇。