空間分子圖譜技術(shù)的飛速發(fā)展正在改變我們對生物組織的認(rèn)知。然而封救,由于海量的數(shù)據(jù)拇涤、異構(gòu)的數(shù)據(jù)類型以及缺乏靈活的空間感知數(shù)據(jù)結(jié)構(gòu),單模態(tài)和多模態(tài)空間組學(xué)數(shù)據(jù)的處理仍然面臨挑戰(zhàn)誉结。來自歐洲分子生物學(xué)實(shí)驗(yàn)室的Oliver Stegle團(tuán)隊(duì)及其合作者開發(fā)了SpatialData鹅士,這是一個統(tǒng)一且可擴(kuò)展的多平臺文件格式框架。該框架支持大于內(nèi)存的數(shù)據(jù)惰性表示惩坑、將數(shù)據(jù)轉(zhuǎn)換并對齊到共同坐標(biāo)系統(tǒng)掉盅,以及跨模態(tài)的聚合和分析。該研究成果發(fā)表在Nature Methods雜志上以舒。
SpatialData框架包含一個核心Python包和相關(guān)的衛(wèi)星包趾痘。它建立在OME-NGFF規(guī)范和Zarr文件格式之上,支持傳統(tǒng)的文件系統(tǒng)和基于云存儲的高性能互操作訪問蔓钟。該框架還集成了廣泛使用空間組學(xué)技術(shù)的讀取器功能永票、靈活的操作和訪問功能,以及定義生物組織共同坐標(biāo)系統(tǒng)的功能滥沫。此外侣集,它還提供了用于交互式注釋的napari插件和用于靜態(tài)圖形創(chuàng)建的spatialdata-plot庫。
研究者展示了SpatialData在乳腺癌研究中的應(yīng)用兰绣。他們使用該框架表示和處理來自不同實(shí)驗(yàn)平臺的多模態(tài)空間組數(shù)據(jù)世分,實(shí)現(xiàn)了數(shù)據(jù)集的對齊、空間注釋的創(chuàng)建以及跨模態(tài)的聚合分析狭魂。這些分析表明SpatialData能夠靈活地在不同種類的空間組學(xué)之間進(jìn)行聚合罚攀,提供多樣的空間注釋信息。
SpatialData提供了一個開放且通用的空間組學(xué)數(shù)據(jù)框架雌澄,支持幾乎所有目前可用的空間組學(xué)技術(shù)。該框架在分析中提供靈活性和現(xiàn)成的解決方案杯瞻,將促進(jìn)集成空間分析并提高跨研究的可重現(xiàn)性镐牺。隨著SpatialData的廣泛應(yīng)用,其效用將進(jìn)一步提高魁莉,這為空間組學(xué)研究開啟了新的可能性睬涧。
SpatialData 的架構(gòu)設(shè)計(jì)與核心功能
SpatialData 框架采用了統(tǒng)一的數(shù)據(jù)存儲格式,可以存儲各種空間組學(xué)技術(shù)的原始數(shù)據(jù)和衍生數(shù)據(jù)旗唁。該格式基于五種基本元素(SpatialElements):圖像(Images)畦浓、標(biāo)簽(Labels)、點(diǎn)(Points)检疫、形狀(Shapes)和表(Tables)讶请,并以符合OME-NGFF標(biāo)準(zhǔn)的方式序列化為Zarr存儲。SpatialData的Python庫實(shí)現(xiàn)了對不同數(shù)據(jù)類型的訪問屎媳、對齊夺溢、查詢和聚合操作论巍。它支持指定坐標(biāo)轉(zhuǎn)換,將多個模態(tài)對齊到共同坐標(biāo)系統(tǒng)(CCS)风响,從而允許跨模態(tài)部署空間查詢和聚合操作嘉汰。此外,SpatialData兼容常用的數(shù)據(jù)格式状勤,包括特定于供應(yīng)商的文件格式鞋怀。多個數(shù)據(jù)集的集合可以存儲在單個Zarr存儲中,并表示為一個SpatialData對象持搜。
SpatialData還提供了交互式注釋和可視化的工具密似。集成的napari-spatialdata插件可用于交互式地注釋存儲在SpatialData格式中的數(shù)據(jù)集;SpatialData提供了生成交互式和靜態(tài)圖的功能朵诫。此外辛友,SpatialData 與 PyTorch 庫兼容,方便進(jìn)行深度學(xué)習(xí)模型的訓(xùn)練剪返。最后废累,SpatialData基于已建立的標(biāo)準(zhǔn)和軟件,提供了與現(xiàn)有多模態(tài)分析方法的交互操作性脱盲,包括Squidpy邑滨、Scanpy、MONAI和scvi-tools等钱反。
應(yīng)用案例:三個乳腺癌空間組數(shù)據(jù)集的對齊與聯(lián)合分析
為了展示SpatialData在實(shí)際應(yīng)用場景下的功能掖看,研究人員利用SpatialData框架對一項(xiàng)乳腺癌研究中的三個數(shù)據(jù)集進(jìn)行了對齊和整合分析。該研究包括來自乳腺癌腫瘤連續(xù)切片的兩個原位測序數(shù)據(jù)集(10x Genomics Xenium)和一個空間轉(zhuǎn)錄組數(shù)據(jù)集(10x Visium CytAssist)面哥。首先哎壳,研究人員使用napari-spatialdata在所有數(shù)據(jù)集中定義了存在的地標(biāo)點(diǎn),然后使用轉(zhuǎn)換將所有三個數(shù)據(jù)集對齊到共同坐標(biāo)系(CCS)尚卫。對齊后归榕,SpatialData使他們能夠識別共同的空間區(qū)域,并可以跨數(shù)據(jù)集使用SpatialData查詢來訪問該區(qū)域吱涉。
接下來刹泄,研究人員使用來自所有三個數(shù)據(jù)集的集體信息創(chuàng)建了一組共享的空間注釋。他們基于H&E圖像中存在的組織學(xué)特征選擇了四個感興趣區(qū)域(ROI)怎爵,然后使用Visium中的基因組范圍內(nèi)轉(zhuǎn)錄組信息估計(jì)拷貝數(shù)狀態(tài)特石,并注釋主要的遺傳亞克隆。最后鳖链,通過將獨(dú)立乳腺癌單細(xì)胞RNA測序圖譜中的細(xì)胞類型標(biāo)簽轉(zhuǎn)移到兩個Xenium重復(fù)樣本中姆蘸,他們注釋了Xenium重復(fù)樣本中的細(xì)胞類型。
SpatialData的聚合功能展示在不同數(shù)據(jù)集之間靈活轉(zhuǎn)移空間注釋的能力。研究人員考慮Visium捕獲位置的掩模 (Mask)乞旦,并聚合了重疊的Xenium細(xì)胞中的細(xì)胞類型信息贼穆,以估計(jì)每個位置的細(xì)胞類型比例。為了比較兰粉,他們還考慮了使用相同的單細(xì)胞RNA測序衍生的細(xì)胞類型對Visium計(jì)數(shù)進(jìn)行去卷積分析故痊。結(jié)果表明,Xenium重復(fù)樣本之間以及Xenium和去卷積結(jié)果之間的細(xì)胞類型豐度估計(jì)具有高度一致性玖姑。
這個例子說明了SpatialData聚合功能的靈活性愕秫,該功能可應(yīng)用于不同類型的空間元素之間,以傳遞多種空間注釋焰络。這突出了SpatialData在處理和整合多模態(tài)空間組學(xué)數(shù)據(jù)集方面的效用戴甩。
原文鏈接:https://www.nature.com/articles/s41592-024-02212-x
GitHub Repo:https://github.com/scverse/spatialdata