空間分辨轉(zhuǎn)錄組分析可以揭示組織結(jié)構(gòu)和環(huán)境依賴性細胞-細胞或細胞-環(huán)境相互作用的分子機制忿墅。由于目前的技術(shù)限制囤躁,以單細胞分辨率獲得全基因組空間轉(zhuǎn)錄組是一項挑戰(zhàn)泽艘。近日缘厢,《Science Advances》發(fā)表了一個名為iSpatial的新算法保礼,通過整合空間轉(zhuǎn)錄組和單細胞轉(zhuǎn)錄組數(shù)據(jù)集來推導整個轉(zhuǎn)錄組的空間模式沛励。
iSpatial是什么?
基于FISH和原位測序的ST技術(shù)炮障,如MERFISH目派、seqFISH、osmFISH和STARmap胁赢,可以以單細胞分辨率同時揭示基因表達和位置企蹭,但預定義的基因靶點有限(下圖左)。另一方面智末,scRNA-seq可以無偏地描繪整個轉(zhuǎn)錄組谅摄,但不提供空間信息(下圖中間)。通過整合兩種方法的單細胞基因表達譜(逐個細胞的基因矩陣)系馆,可以根據(jù)scRNA-seq數(shù)據(jù)推斷出每個空間圖譜細胞中非目標基因的缺失信息送漠,從而得到圖譜細胞的全基因組空間表達信息(下圖右)。
iSpatial是一種基于R的生物信息學工具由蘑,它整合了scRNA-seq和ST譜數(shù)據(jù)闽寡,以高空間分辨率推斷每個基因的表達模式。
iSpatial的性能測試
開發(fā)團隊使用不同組織和技術(shù)產(chǎn)生的多個ST數(shù)據(jù)集測試了iSpatial尼酿。與其他現(xiàn)有方法相比爷狈,iSpatial在預測基因表達和空間分布方面具有更高的準確性。此外谓媒,它還減少了原始數(shù)據(jù)集中的假陽性和假陰性信號淆院。同時它對來自不同組織和不同技術(shù)的數(shù)據(jù)集具有廣泛適用性。
在所有的應用中,iSpatial能夠?qū)⒖臻g信息從原始ST數(shù)據(jù)中預定義的基因小組擴展到整個轉(zhuǎn)錄組土辩,這為下游分析帶來了一些好處支救。首先,它能夠系統(tǒng)地識別SVG拷淘。在大腦和肝臟的數(shù)據(jù)集中各墨,發(fā)現(xiàn)在iSpatial歸納之后SVG的數(shù)量從幾百個增加到幾千個。第二启涯,iSpatial能夠發(fā)現(xiàn)整個組織的不同空間表達模式贬堵,這是通過SVG的空間聚類分析實現(xiàn)的。許多這樣的無偏識別的表達模式是與生物相關(guān)的结洼。例如黎做,開發(fā)團隊發(fā)現(xiàn)SVG組在大腦皮層中被組織成層狀結(jié)構(gòu)松忍,在紋狀體中表現(xiàn)出核心/外殼富集蒸殿,表明基因表達與組織結(jié)構(gòu)之間存在緊密的關(guān)系。第三鸣峭,iSpatial支持對SVG或SVG亞群進行需要足夠基因數(shù)量或高統(tǒng)計能力的生物信息學分析(如KEGG)宏所。例如,通過推斷肝臟中轉(zhuǎn)錄體的空間模式摊溶,發(fā)現(xiàn)富集在CV和PV中的基因涉及不同的KEGG通路爬骤,這表明區(qū)域特定的基因表達和功能之間可能存在聯(lián)系。
iSpatial在預測空間表達模式的準確性方面優(yōu)于現(xiàn)有工具莫换。
為了評估iSpatial的性能并與現(xiàn)有的工具進行比較霞玄,開發(fā)使用了從Slide-seq V2生成的小鼠海馬數(shù)據(jù)集。通過將推斷出的表達模式與Slide-seq(驗證數(shù)據(jù)組)確定的 "真相 "進行比較發(fā)現(xiàn)iSpatial可以高度準確地預測空間表達模式浓镜;iSpatial可以 "增強 "原始數(shù)據(jù)中沒有很好檢測到的信號溃列。
隨后開發(fā)團隊使用Slide-seq數(shù)據(jù)集進一步比較了iSpatial與另外兩個現(xiàn)有工具Liger和Seurat在同一任務上的性能:與iSpatial相比,從Liger和Seurat獲得的空間模式在較高背景下更模糊膛薛;在不同表達水平的所有基因組中听隐,iSpatial表現(xiàn)出明顯高于其他方法的相關(guān)系數(shù)和較低的RMSE,而且預測的準確性與基因表達水平呈正相關(guān)哄啄。此外雅任,細胞類型特異性表達的基因表現(xiàn)出更高的預測準確性。這一結(jié)果表明咨跌,iSpatial在功能相關(guān)的基因上實現(xiàn)了更高的預測準確性沪么。當比較從原始Slide-seq數(shù)據(jù)識別的SVG和從不同方法推斷的數(shù)據(jù)識別的SVG時發(fā)現(xiàn)iSpatial在三種方法中對SVG具有最高的預測能力。
開發(fā)團隊還使用了成年小鼠冠狀半腦切片的Stereo-seq數(shù)據(jù)來衡量iSpatial的性能锌半。結(jié)果顯示禽车,iSpatial在驗證數(shù)據(jù)集上取得了比其他方法更高的相關(guān)性。
通過將iSpatial應用于來自不同組織(海馬、大腦半球殉摔、皮層州胳、紋狀體和肝臟)和用不同技術(shù)(Slide-seq、Stereo-seq逸月、MERFISH和STARmap)生成的數(shù)據(jù)集栓撞,在每個數(shù)據(jù)集中都發(fā)現(xiàn)了已知和以前未知的空間表達模式,表明iSpatial廣泛適用于分析不同ST數(shù)據(jù)集碗硬。
iSpatial可以減少由不同技術(shù)產(chǎn)生的不同組織的原始ST數(shù)據(jù)中的FP和FN信號瓤湘。
iSpatial實現(xiàn)了整個轉(zhuǎn)錄體水平的空間分析:在STARmap皮層數(shù)據(jù)集和MERFISH紋狀體數(shù)據(jù)集平行分析的結(jié)果表明iSpatial推斷的數(shù)據(jù)明顯增加了檢測到的SVG的數(shù)量;iSpatial可以幫助識別生物學相關(guān)的空間基因表達模式恩尾。
為了評估iSpatial在其他組織(除腦組織之外)數(shù)據(jù)集中的性能弛说,開發(fā)團隊分析了Vizgen MERFISH小鼠肝臟圖譜數(shù)據(jù)集,iSpatial成功地推斷出每個單個細胞中平均6000多個基因的表達翰意,比原始數(shù)據(jù)增加了20倍以上剃浇。推斷出的空間模式與現(xiàn)有知識基本一致。在iSpatial推斷表達譜的基礎(chǔ)上進一步生成了UMAP猎物,發(fā)現(xiàn)細胞在UMAP上的位置與它們沿CV-PV軸的原位分布密切相關(guān),顯示了沿CV-PV軸的梯度表達譜角塑。值得注意的是蔫磨,盡管Liger和Seurat也能揭示類似的梯度表達模式,但三種方法的比較表明圃伶,iSpatial取得了更高的特異性和準確性堤如,特別是對具有更多空間限制的表達模式的基因≈吓螅總之搀罢,iSpatial可以克服各種ST分析的目標基因數(shù)量有限的問題,在不同組織中達到全轉(zhuǎn)錄組水平的高精確度侥猩。
iSpatial的一個潛在限制是它需要相應的ST和scRNA-seq數(shù)據(jù)榔至,而這些數(shù)據(jù)可能并不總是可用。然而欺劳,鑒于ST和scRNA-seq技術(shù)的快速發(fā)展唧取,以及在大型單細胞聯(lián)盟和ST方面的持續(xù)努力,預計iSpatial將被廣泛用于幫助理解不同器官的復雜組織在正常和疾病狀態(tài)下的結(jié)構(gòu)和功能異質(zhì)性的分子基礎(chǔ)划提。
iSpatial的R包枫弟、如何使用iSpatial整合紋狀體scRNA-seq和MERFISH數(shù)據(jù)來推斷基因組范圍內(nèi)空間表達模式的教程均可以在如下鏈接獲取:?https://github.com/YiZhang-lab/iSpatial.
首發(fā)公號國家基因庫大數(shù)據(jù)平臺
參考文獻
Zhang C, Chen R, Zhang Y. Accurate inference of genome-wide spatial expression with iSpatial. Sci Adv. 2022 Aug 26;8(34):eabq0990. doi: 10.1126/sciadv.abq0990. Epub 2022 Aug 26. PMID: 36026447; PMCID: PMC9417177.
圖片來源于Science Advances官網(wǎng)和參考文獻鹏往,如有侵權(quán)請聯(lián)系刪除淡诗。