Nat Biomed Eng | 網(wǎng)上解說數(shù)字病理圖像和組織圖譜數(shù)據(jù)
原創(chuàng)?huacishu?圖靈基因?今天
收錄于話題#前沿生物大數(shù)據(jù)分析
撰文:huacishu
IF=25.671
推薦度:?????
亮點:
1爽篷、作者描述了可用于組織圖像分析的軟件生態(tài)系統(tǒng)单山,并討論了對交互式在線指南的需求邢隧,以幫助組織病理學(xué)家能夠理解復(fù)雜圖像虐秋;
2领虹、通過一個軟件界面(Minerva)來實現(xiàn)這一想法,該界面可通過web瀏覽器訪問乖篷,集成了多組學(xué)和組織圖譜功能凉蜂。
哈佛醫(yī)學(xué)院Peter Sorger教授團隊在國際知名期刊Nat Biomed Eng在線發(fā)表題為“Narrative online guides for the interpretation of digital-pathology images and tissue-atlas data”的論文。復(fù)合組織成像有助于診斷和理解復(fù)雜的疾病特征羔杨。然而捌臊,這些數(shù)字圖像的分析在很大程度上依賴于解剖病理學(xué)家對組織特征的回顧、注釋和描述的經(jīng)驗问畅。此外娃属,在基礎(chǔ)研究和轉(zhuǎn)化研究以及課堂上更廣泛地使用來自組織的數(shù)據(jù)六荒,將受益于圖像及其分析結(jié)果可視化和共享的軟件。從這個角度出發(fā)矾端,作者描述了可用于組織圖像分析的軟件生態(tài)系統(tǒng)掏击,并討論了對交互式在線指南的需求,以幫助組織病理學(xué)家能夠理解復(fù)雜圖像秩铆。通過一個軟件界面(Minerva)來說明這一想法砚亭,該界面可通過web瀏覽器訪問,集成了多組學(xué)和組織圖譜功能殴玛。作者認(rèn)為捅膘,這樣的互動敘事指南可以有效地傳播數(shù)字組織學(xué)數(shù)據(jù),并幫助人們對數(shù)據(jù)的理解滚粟。
目前作者正在開展國際項目寻仗,以創(chuàng)建可公開獲取的正常人體組織和腫瘤圖譜。其中包括人類細(xì)胞圖譜凡壤、人類生物分子圖譜計劃(HuBMAP)和人類腫瘤圖譜網(wǎng)絡(luò)(HTAN)署尤。例如,HTAN被設(shè)想為已建立的癌癥基因組圖譜(TCGA)的空間分辨對應(yīng)物(圖1)亚侠。HTAN圖譜旨在整合來自分離單細(xì)胞方法(如單細(xì)胞RNA測序)的遺傳和分子信息曹体,以及來自組織成像和空間轉(zhuǎn)錄組學(xué)的形態(tài)學(xué)和空間細(xì)節(jié)。這些地圖集將把許多標(biāo)本的圖像合并到共同的參考系統(tǒng)中硝烂,以便對數(shù)據(jù)進行系統(tǒng)的患者間和跨疾病分析箕别。從概念上講,在衍生特征的層面上滞谢,跨樣本和數(shù)據(jù)類型的整合最容易實現(xiàn)串稀,例如細(xì)胞類型和位置的普查(來自成像數(shù)據(jù))或轉(zhuǎn)錄水平(來自單細(xì)胞RNA測序)。自動從圖像中提取空間信息的計算方法仍在開發(fā)中狮杨;因此厨诸,由解剖病理學(xué)家注釋幻燈片的實踐仍然是必要的。為了更好地理解病理學(xué)家如何從組織標(biāo)本進行診斷禾酱,并量化從細(xì)胞鄰域計算的特征與臨床結(jié)果之間的聯(lián)系微酬,正在進行的研究將為自動化圖像分析管道的發(fā)展提供有用的見解。然而颤陶,人類對組織圖像的監(jiān)督對于將形態(tài)學(xué)與病理生理學(xué)聯(lián)系起來颗管、評估圖像處理算法的質(zhì)量和訓(xùn)練機器學(xué)習(xí)分類器仍然是必不可少的。
各種各樣的學(xué)術(shù)和商業(yè)顯微鏡軟件系統(tǒng)可用作桌面系統(tǒng)滓走,用于數(shù)據(jù)分析垦江,或作為客戶機-服務(wù)器關(guān)系數(shù)據(jù)庫管理系統(tǒng)(RDBMS),用于圖像管理(圖2a)搅方。桌面軟件特別適用于交互式圖像分析比吭,因為它利用圖形卡進行快速圖像渲染绽族,并利用高帶寬連接到本地數(shù)據(jù)進行計算。相反衩藤,RDBMS是數(shù)據(jù)管理的理想選擇吧慢,因為它們支持關(guān)系查詢、支持多個用戶赏表、確保數(shù)據(jù)完整性并有效管理對大規(guī)模本地和基于云的計算機資源的訪問(圖2b)检诗,隨著全玻片組織圖像的引入,需要新的軟件來引導(dǎo)用戶處理包含105-106個細(xì)胞和100多個通道的異常復(fù)雜的圖像瓢剿。這種大小的圖像不僅難以處理和共享逢慌,而且也難以理解。設(shè)想“解釋性指南”或“數(shù)字指導(dǎo)者”將扮演一個關(guān)鍵角色间狂,幫助引導(dǎo)用戶通過一系列人類提供和機器生成的圖像注釋攻泼,就像一篇已發(fā)表文章的結(jié)果部分通過多面板圖引導(dǎo)用戶一樣〖螅基因科學(xué)也面臨著類似的高效應(yīng)用需求和直觀的可視化工具坠韩,這導(dǎo)致了有影響力的整合基因組學(xué)的發(fā)展。圖片和圖像的交互式指南在其他科學(xué)領(lǐng)域已經(jīng)證明非常成功炼列,Mirador項目就是一個例子(https://projectmirador.org). Mirador項目的重點是開發(fā)基于網(wǎng)絡(luò)的文化資源解說旅游,如藝術(shù)博物館音比、有文化或歷史意義的城市等俭尖。在這些在線旅行中,一系列航路點(用于幫助導(dǎo)航顯示的信息的參考點)和伴隨的文本將用戶引導(dǎo)到感興趣的區(qū)域洞翩,同時也允許自由探索稽犁。這種類型的互動敘述也稱為數(shù)字講故事或視覺講故事,模仿了導(dǎo)游提供的一些好處骚亿,并作為一種教學(xué)工具發(fā)揮作用已亥,增強理解和記憶形成。多項研究已經(jīng)確定了以敘述方式接收復(fù)雜信息的好處来屠,數(shù)字故事講述已經(jīng)應(yīng)用于醫(yī)學(xué)和研究的多個領(lǐng)域虑椎,包括腫瘤學(xué)、心理健康俱笛、健康公平和科學(xué)傳播捆姜。這些經(jīng)驗如何應(yīng)用于組織圖像?至少迎膜,作者認(rèn)為泥技,僅僅在桌面軟件上下載和分析千兆像素大小的圖像不足以推進科學(xué)發(fā)現(xiàn)和改善診斷結(jié)果。相反磕仅,一種簡單的方法珊豹,通過相關(guān)注釋和注釋引導(dǎo)用戶了解圖像的顯著特征簸呈,對專家和非專家都是有益的。目前店茶,病理學(xué)家使用顯微鏡在圖像上平移蜕便,并在高倍和低倍視野(放大率)之間切換,從而詳細(xì)研究細(xì)胞忽妒,同時將細(xì)胞置于整個組織中玩裙。在此過程中,通常使用指針突出顯示關(guān)鍵功能段直。在多重圖像的情況下载弄,必須將經(jīng)過時間檢驗的病理實踐與切換通道的方法一起內(nèi)置到軟件中(以便確定特定抗體對最終圖像的貢獻)艾蓝,并顯示圖像分析產(chǎn)生的定量數(shù)據(jù)。
如何實施組織圖像的解釋性指南?一種可能性是使用OMERO客戶機铅协。OMERO是部署最廣泛的開源圖像信息系統(tǒng),它與一系列軟件客戶端兼容仰税。但是缺虐,OMERO客戶端需要訪問OMERO數(shù)據(jù)庫,并且隨著映像變大功茴,服務(wù)器將大量加載庐冯。獨立于數(shù)據(jù)庫的查看器由Project Mirador使用,并且基于開源OpenSeaDragon平臺坎穿。OpenSeadragon可以輕松地縮放和平移圖像(方式類似于谷歌地圖)展父。Minerva是為多路圖像的引導(dǎo)觀看而定制的,它采用了這種方法玲昧。Minerva是一個使用客戶端JavaScript(因此不需要下載軟件)的web應(yīng)用程序栖茉,它可以輕松地部署在標(biāo)準(zhǔn)的商業(yè)云上,如Amazon web Services(AWS)(圖3)或支持靜態(tài)站點生成器Jekyll的本地計算服務(wù)器上孵延。OpenSeadragon以前曾用于顯示H&E圖像吕漂,但在Minerva,它與敘事功能尘应、圖像空間內(nèi)衍生單細(xì)胞功能的交互視圖以及適應(yīng)亮場(H&E和IHC)和多路免疫熒光圖像的能力相結(jié)合惶凝。Minerva還可以在智能手機上顯示圖像和注釋。Minerva兼容OME和生物格式犬钢,因此可用于任何現(xiàn)有顯微鏡或載玻片掃描儀的圖像梨睁。可以同時訪問Minerva開發(fā)的敘述指南的用戶數(shù)量沒有實際限制娜饵,也不需要專門的服務(wù)器或關(guān)系數(shù)據(jù)庫坡贺,因此保持了低復(fù)雜性和低成本。任何熟悉GitHub和AWS(或類似云服務(wù))的人都可以在幾分鐘內(nèi)部署一個Minerva,然后由在軟件和計算生物學(xué)方面缺乏專業(yè)知識的個人使用遍坟。開發(fā)人員還可以基于Minerva框架為其他應(yīng)用程序開發(fā)敘述工具(例如拳亿,用于解釋蛋白質(zhì)結(jié)構(gòu)或復(fù)雜的高維數(shù)據(jù)集)。Minerva等軟件查看器并非旨在成為處理和分析組織數(shù)據(jù)的解決方案愿伴;相反肺魁,它們是專門的瀏覽器,可以很好地執(zhí)行一項任務(wù)隔节。在Minerva的案例中鹅经,它為已經(jīng)使用其他工具分析的圖像提供了一種直觀和解釋性的方法≡踅耄基因組瀏覽器是相似的:它們不執(zhí)行對齊和數(shù)據(jù)分析瘾晃;相反,它們使得與處理后的序列有效地交互成為可能幻妓。
在標(biāo)準(zhǔn)web瀏覽器上的Minerva窗口內(nèi)蹦误,敘述面板將用戶的注意力引導(dǎo)到圖像的特定區(qū)域和特定頻道分組,并伴隨文本描述(Minerva可以大聲讀出)和涉及重疊幾何形狀或文本的圖像注釋(圖4)肉津。每個圖像可以與多個敘述的故事關(guān)聯(lián)强胰,并與查看相同類型數(shù)據(jù)的不同方式關(guān)聯(lián)。敘事指南的一個基本方面是妹沙,具有特定疾病或組織專業(yè)知識的個人(特別是病理學(xué)家)可以創(chuàng)建故事供他人使用偶洋,以幫助他們理解標(biāo)本的形態(tài)。Minerva Author是一個桌面應(yīng)用程序距糖,它將OME-TIFF格式的圖像轉(zhuǎn)換為金字塔圖像(分辨率不同的分層圖像玄窝,最大的在底部,最小的在頂部)肾筐,并協(xié)助添加航路點和文本注釋。Minerva作者支持RGB圖像缸剪,如亮場吗铐、H&E和IHC,以及多通道圖像杏节,如免疫熒光唬渗、CODEX和CyCIF。在Minerva Author中寫入航路點后奋渔,用戶將收到配置文件和圖像金字塔镊逝,以部署到AWS S3或另一個基于web的存儲位置(圖3)。故事可以簡單到一個帶有簡短介紹的單面板嫉鲸,也可以簡單到多面板敘述撑蒜,其中包含一系列具有詳細(xì)描述、縮放級別變化和相關(guān)數(shù)據(jù)分析的視圖。用戶需要幾個小時來學(xué)習(xí)軟件座菠,然后從大約30分鐘到幾個小時來創(chuàng)建一個故事狸眼;這與為已發(fā)表的文章創(chuàng)建一個良好的靜態(tài)圖形面板所需的時間差不多,并且比數(shù)據(jù)收集浴滴、圖像配準(zhǔn)拓萌、分割和數(shù)據(jù)分析所需的時間要少得多。作為一個交互式組織指南的案例研究升略,作者使用Minerva Story標(biāo)記了一個人類肺腺癌的大樣本(https://www.cycif.org/MinervaLungHistology).?該原發(fā)腫瘤的大小約為5×3.5mm微王,并以亞細(xì)胞分辨率成像。然后將多個區(qū)域縫合成一個圖像品嚣。因為沒有單一的最佳方法來分析包含幾十萬個細(xì)胞的圖像炕倘,作者創(chuàng)建了兩個指南:一個側(cè)重于感興趣區(qū)域的組織學(xué)回顧和特定類型的免疫細(xì)胞和腫瘤細(xì)胞的指南,以及重點介紹在原始圖像背景下的定量數(shù)據(jù)分析(圖4a)腰根。Minerva故事窗口左側(cè)的一個面板(圖4a中用橙色標(biāo)出)顯示了樣本的名稱激才、相關(guān)故事的鏈接、目錄和導(dǎo)航工具额嘿。在窗口右側(cè)(以粉紅色勾勒)瘸恼,另一個導(dǎo)航面板允許選擇感興趣的頻道〔嵫可以預(yù)先指定通道和通道組以及它們定義的單元類型东帅。每種蛋白質(zhì)(抗原)都與解釋性信息源相關(guān)聯(lián)。故事從一個航路點進展到下一個航路點球拦,每個航路點可以包含不同的視野靠闭、放大率和通道集,以及描述感興趣的特定特征的箭頭和文字(以灰色標(biāo)記)坎炼。在圖4a中愧膀,“waypoint one”顯示了在腫瘤-基質(zhì)界面處生長的細(xì)胞角蛋白陽性腫瘤細(xì)胞。腫瘤的這一區(qū)域以炎癥微環(huán)境為特征谣光,表現(xiàn)為存在多種淋巴細(xì)胞和巨噬細(xì)胞群體檩淋,可通過其細(xì)胞表面標(biāo)記物的表達加以區(qū)分。通過使用右側(cè)的面板萄金,用戶可以打開和關(guān)閉這些標(biāo)記蟀悦,以瀏覽圖像和數(shù)據(jù),并評估分類的準(zhǔn)確性氧敢。故事的其余部分探討PD-L1的表達以及淋巴細(xì)胞和巨噬細(xì)胞群體的定位日戈。敘事指南也有助于在原始圖像的背景下顯示定量數(shù)據(jù)分析的結(jié)果。例如孙乖,組織圖像的數(shù)據(jù)分析通常涉及測量多個細(xì)胞類型標(biāo)記(例如免疫譜系標(biāo)記)的共表達浙炼,以識別單個細(xì)胞類型份氧。細(xì)胞狀態(tài)、形態(tài)的分析也很常見鼓拧。在Minerva Story中半火,可以將定量數(shù)據(jù)的表示直接鏈接到圖像空間。例如季俩,當(dāng)在2D圖中捕獲數(shù)據(jù)時钮糖,例如用于降維的UMAP(圖4b),選擇數(shù)據(jù)點將用戶直接帶到圖像中單元的對應(yīng)位置酌住。這是histoCat和Facetto等桌面軟件中的標(biāo)準(zhǔn)功能店归,極大地增強了用戶對圖像和圖像衍生功能之間關(guān)系的理解。此外酪我,用戶可以交互地突出顯示感興趣的區(qū)域消痛、添加注釋并生成可共享鏈接,允許其他人導(dǎo)航到圖像中的相同位置并查看任何添加的注釋和文本(圖4b)都哭。
敘事性指南可用于教學(xué)秩伞。組織學(xué)在本科教學(xué)中具有挑戰(zhàn)性,課程改革減少了醫(yī)學(xué)生和住院醫(yī)師在顯微鏡前的時間欺矫。在線收集組織圖像是一種常見的替代品纱新。事實上,將課堂教學(xué)與動態(tài)觀察以及與圖像數(shù)據(jù)的靈活交互結(jié)合起來對于學(xué)習(xí)至關(guān)重要穆趴。因此脸爱,作者創(chuàng)建了一份H&E圖像的敘述指南,該圖像取自一名經(jīng)歷多次心肌梗死的患者的心臟組織標(biāo)本(圖5)未妹。介紹性面板描述了心臟的整體結(jié)構(gòu)和各種標(biāo)本的切除位置簿废。這些圖像顯示了缺血性心臟病的組織學(xué)特征:嚴(yán)重的冠狀動脈硬化、斑塊破裂络它、再灌注損傷以及心肌組織梗死的早期族檬、中期和晚期特征。而不是在教科書或注釋不清的在線圖像中查看組織學(xué)數(shù)據(jù)片段化戳,組織圖像數(shù)據(jù)的交互式敘述提供了有助于更細(xì)致地理解常見心臟病理生理學(xué)的背景单料。通過相對較少的努力,文本可以超鏈接到故事和航路點迂烁,學(xué)生可以使用圖像注釋功能記筆記和提問看尼。
最近對單細(xì)胞組織生物學(xué)的興趣不僅來源于顯微鏡技術(shù)的進步递鹉,也來源于單細(xì)胞測序的廣泛采用盟步。正常組織和病變組織的綜合表征幾乎肯定涉及多種分析模式的數(shù)據(jù)整合,包括成像躏结、空間轉(zhuǎn)錄組分析却盘、代謝產(chǎn)物和藥物的質(zhì)譜成像,以及具有空間特征的游離單細(xì)胞RNA測序的計算。Minerva目前無法處理所有這些任務(wù)黄橘,但它可以很容易地與其他工具結(jié)合兆览,創(chuàng)建組織圖譜所需的多組學(xué)查看器。一個有吸引力的可能性是將敘述性組織指南添加到廣泛使用的基因組學(xué)平臺塞关,如癌癥基因組學(xué)的cBioPortal抬探,以創(chuàng)建可以同時查看基因組和復(fù)合組織組織病理學(xué)的環(huán)境。更好的可視化也有助于完成更具概念挑戰(zhàn)性的任務(wù)帆赢,將多重圖像中的空間分子特征與基因表達和突變數(shù)據(jù)相結(jié)合小压。關(guān)于臨床應(yīng)用,生物醫(yī)學(xué)界需要確保數(shù)字病理系統(tǒng)不會被基于不可互操作軟件的專有數(shù)據(jù)格式所鎖定椰于。研究小組怠益、儀器制造商和科學(xué)出版商可以很容易地部署基于開源許可的易于使用的可視化軟件,以使高復(fù)雜度的圖像數(shù)據(jù)廣泛可訪問且易于理解瘾婿。這將有助于組織成像和數(shù)字病理學(xué)的發(fā)展蜻牢。
教授介紹
Peter Sorger博士是哈佛醫(yī)學(xué)院的系統(tǒng)生物學(xué)教授、哈佛治療科學(xué)項目(HiTS)負(fù)責(zé)人及系統(tǒng)藥理學(xué)實驗室主任偏陪。他從哈佛學(xué)院獲得博士學(xué)位抢呆,在加入HMS之前,Peter在麻省理工學(xué)院擔(dān)任生物學(xué)和生物工程教授竹挡。Peter的研究重點是控制細(xì)胞增殖和死亡的信號轉(zhuǎn)導(dǎo)網(wǎng)絡(luò)的系統(tǒng)生物學(xué)镀娶、這些網(wǎng)絡(luò)在癌癥和炎癥疾病中的失調(diào)以及針對信號蛋白的治療藥物的作用機制。他的團隊使用數(shù)學(xué)和實驗方法來構(gòu)建和測試人類和小鼠細(xì)胞信號傳導(dǎo)的計算模型揪罕,以此作為理解并最終預(yù)測細(xì)胞和腫瘤對單獨或聯(lián)合用藥的反應(yīng)的手段梯码。Sorger是Merrimack Pharmaceuticals和Glencoe Software的共同創(chuàng)始人,也是美國好啰、歐洲和日本多家公共和私人公司及研究機構(gòu)的顧問轩娶。
參考文獻
Rashid R, Chen YA, Hoffer J, et al. Narrative online guides for theinterpretation of digital-pathology images and tissue-atlas data. Nat BiomedEng. 2021;10.1038/s41551-021-00789-8. doi:10.1038/s41551-021-00789-8