Cancer Disc | 構(gòu)建腫瘤發(fā)育圖譜:腫瘤相關(guān)細(xì)胞譜系和發(fā)育程序
原創(chuàng)?榴蓮不酥?圖靈基因?2022-09-05 10:21?發(fā)表于江蘇
收錄于合集#前沿分子生物學(xué)機制
撰文:榴蓮不酥
IF=?38.272
推薦度:?????
亮點:
本文系統(tǒng)地比較了癌癥基因組圖譜(TCGA)腫瘤樣本和小鼠器官形成細(xì)胞圖譜(MOCA)單細(xì)胞數(shù)據(jù)煌茴,以構(gòu)建人類腫瘤的發(fā)育圖譜随闺。使用該圖將腫瘤解卷積為發(fā)育成分,這反過來又可構(gòu)建能高精度預(yù)測腫瘤類型的D-MLP分類器蔓腐。為使用發(fā)育映射來幫助診斷病理學(xué)以及新興單細(xì)胞數(shù)據(jù)集如何影響臨床癌癥護理作為診斷工具參考圖譜提供了原理證明矩乐。
2022年8月30日,在Cancer Discovery雜志上發(fā)表了一篇名為“Developmental Deconvolution for Classification of Cancer Origin”的文章回论,系統(tǒng)地比較了TCGA和MOCA兩種圖譜來構(gòu)建人類腫瘤的發(fā)育圖譜散罕,并由此定義了一個深度學(xué)習(xí)的基于基因表達(dá)數(shù)據(jù)提取腫瘤發(fā)展軌跡的人工智能工具,可預(yù)測腫瘤類型傀蓉,有利于提高對患者的治療成功率欧漱。
惡性腫瘤的診斷依賴于腫瘤外觀的組織病理學(xué)分類,通常與突變分析和臨床表現(xiàn)等其他特征聯(lián)系一起僚害。然而硫椰,許多腫瘤表現(xiàn)出一系列異質(zhì)外觀繁调,這可能部分反映了它們發(fā)展中的未知差異。缺乏診斷信息導(dǎo)致使用具有嚴(yán)重毒性和不良結(jié)果的非靶向療法治療許多癌癥靶草。了解惡性腫瘤中失調(diào)的起源或發(fā)育途徑的細(xì)胞類型是癌癥生物學(xué)的主要目標(biāo)蹄胰,并且將能夠針對這些途徑進行更精確的診斷和治療干預(yù)。
當(dāng)應(yīng)用于放射學(xué)和組織病理學(xué)中的圖像處理時奕翔,機器學(xué)習(xí)分類器已顯示出作為新工具的前景裕寨。然而,圖像分類器只檢測視覺特征派继,有時會受到偽影的影響宾袜。使用分子特征的分類器具有通過捕獲非視覺信息來幫助診斷的巨大潛力,最近的方法已證明在結(jié)合視覺和分子特征進行分類方面具有價值驾窟。然而庆猫,基因表達(dá)分類器由于大量特征而遭受過擬合,這導(dǎo)致對新數(shù)據(jù)集的預(yù)測能力較差绅络,或者選擇了小型基因組進行測量月培。如何在從基因表達(dá)數(shù)據(jù)中提取最相關(guān)信息的同時減少特征數(shù)量仍然是構(gòu)建集成診斷模型的關(guān)鍵挑戰(zhàn)。
為了解決這些問題恩急,使用了兩個綜合圖譜:癌癥基因組圖譜(TCGA)和小鼠器官形成細(xì)胞圖譜(MOCA)杉畜。概述了TCGA和MOCA數(shù)據(jù)集之間的系統(tǒng)比較及其在構(gòu)建診斷工具中的用途。簡而言之衷恭,將腫瘤映射到屬于主要細(xì)胞譜系和發(fā)育程序的軌跡此叠。這可將大量腫瘤基因表達(dá)特征解卷積為發(fā)育成分,然后研究團隊將其輸入到輸出腫瘤類型的多層感知器分類器中随珠。
圖1:通過發(fā)育反卷積和機器學(xué)習(xí)診斷惡性腫瘤
首先系統(tǒng)地比較了每個TCGA樣本與每個MOCA單細(xì)胞的基因表達(dá)譜灭袁。為了可視化數(shù)據(jù),用了TCGA腫瘤類型和MOCA細(xì)胞亞軌跡牙丽。接下來折疊了相同發(fā)育子軌跡的所有細(xì)胞的相關(guān)系數(shù)简卧,并將它們可視化為單個相似性分?jǐn)?shù)兔魂。此外觀察到預(yù)期的發(fā)育譜系關(guān)系:具有神經(jīng)嵴軌跡的黑色素瘤樣本(SKCM)烤芦、具有上皮譜系的癌腫瘤和具有中胚層衍生發(fā)育譜系的間充質(zhì)腫瘤類型都顯示出很強的相似性。
有趣的是析校,腫瘤與發(fā)育軌跡的比較也揭示了意想不到的或新出現(xiàn)的關(guān)系构罗。分析注意到膠質(zhì)母細(xì)胞瘤與主要發(fā)育軌跡神經(jīng)管或脊索和特定神經(jīng)嵴亞型的強相關(guān)性,而其他主要軌跡神經(jīng)嵴譜系沒有顯示出如此強的相似性智玻。觀察到具有強正相關(guān)和負(fù)相關(guān)的高度信息軌跡遂唧,與腫瘤具有混合關(guān)系的軌跡以及許多其他關(guān)系。通過檢查與每種類型正吊奢、負(fù)和可變相關(guān)的軌跡數(shù)量盖彭,對每種TCGA腫瘤類型進行了類似的分析。正如預(yù)期的那樣,許多TCGA腫瘤具有正相關(guān)和負(fù)相關(guān)的軌跡召边。有趣的是铺呵,一組腫瘤的特征在于腹膜后的解剖位置,并顯示出所有類型的相關(guān)關(guān)系隧熙。這些分析共同為TCGA樣本類型提供了發(fā)展軌跡的強大地圖片挂。
圖2:TCGA與發(fā)展軌跡的系統(tǒng)映射
許多癌癥已被假定為去分化疾病。通過在比較腫瘤和正常組織時樣本和軌跡之間的關(guān)系如何隨時間變化以評估前者與后者相比是否去分化贞盯。在發(fā)育軌跡上繪制了與其相應(yīng)瘤旁正常組織的系統(tǒng)相關(guān)性音念,同時還記錄了每個細(xì)胞的胚胎日。膠質(zhì)母細(xì)胞瘤與所有時間點的神經(jīng)元細(xì)胞都表現(xiàn)出高度相似性躏敢,而正常大腦與后期時間點的神經(jīng)細(xì)胞更相似闷愤。接下來將該分析擴展到一個泛癌隊列,確定了與每個樣本具有最高正相關(guān)性的MOCA細(xì)胞件余,并將這些細(xì)胞的已知胚胎時間段分類肝谭。與正常組織相比,腫瘤早期胚胎期的泛癌富集蛾扇。此外攘烛,通過計算每個TCGA樣本的標(biāo)準(zhǔn)化“胚胎期分?jǐn)?shù)”。發(fā)現(xiàn)腫瘤向較低的胚胎期評分轉(zhuǎn)移镀首,這與惡性腫瘤部分由去分化驅(qū)動的觀點一致坟漱。
為了評估較高級別的腫瘤是否比較低級別的腫瘤更容易去分化這一假設(shè),分析了腫瘤等級是否與發(fā)育時間相對應(yīng)更哄。與3級腫瘤相比芋齿,2級腫瘤在胚胎后期顯示出相對富集。此外成翩,2級腫瘤向更高的胚胎期評分轉(zhuǎn)移觅捆,這與后期發(fā)育階段的相似性高度一致÷榈校總之栅炒,這些結(jié)果表明發(fā)育映射捕獲了惡性腫瘤的相關(guān)組織病理學(xué)特征。
圖3:通過比較樣本類型和發(fā)育時間之間的關(guān)系進行驗證
在TCGA樣本和發(fā)育軌跡之間創(chuàng)建系統(tǒng)圖术羔,啟發(fā)我們嘗試對人類腫瘤基因表達(dá)進行系統(tǒng)發(fā)育反卷積赢赊。在反卷積中,由組成部分組成的記錄信號被解構(gòu)為來自每個組成部分的單獨信號级历。發(fā)育組件(DC)在所有腫瘤樣本中進行縮放并繪制在雷達(dá)圖上释移,雷達(dá)圖代表每個樣本的發(fā)育期、子軌跡和DC評分的信息寥殖。顯示了單個肝細(xì)胞癌(LIHC)的發(fā)育反卷積的代表性雷達(dá)圖玩讳。
在單個雷達(dá)圖中繪制了所有肝細(xì)胞癌的信號涩蜘。所有LIHC樣本的特點是肝臟軌跡評分升高和神經(jīng)元軌跡耗盡。相比之下熏纯,低級別膠質(zhì)瘤顯示神經(jīng)元軌跡的高信號和肝臟軌跡的低信號皱坛,與映射結(jié)果一致。接下來分析了發(fā)育反卷積在區(qū)分不同腫瘤類型方面的有效性豆巨。使用UMAP降維繪制了所有TCGA樣本的發(fā)育成分評分剩辟,并按組織類型和腫瘤類型進行注釋。此外往扔,大多數(shù)腫瘤類型都高度聚集證實發(fā)育反卷積提取了顯著的基因表達(dá)數(shù)據(jù)贩猎。轉(zhuǎn)移樣本聚集在一起,部分原因是該組中SKCM的過度表現(xiàn)萍膛】苑總之,這表明TCGA-MOCA映射可用于將腫瘤基因表達(dá)解卷積為發(fā)育成分蝗罗,以解決大多數(shù)腫瘤類型的方式艇棕。
圖4:腫瘤樣本的發(fā)育反卷積。
通過發(fā)育反卷積解決不同腫瘤類型的能力提高了設(shè)計監(jiān)督機器學(xué)習(xí)(SML)方法對惡性腫瘤進行分類的可能性串塑。研究團隊推斷基于發(fā)育反卷積分?jǐn)?shù)的分類器將從基因表達(dá)中提取最相關(guān)的數(shù)據(jù)沼琉,同時還以胚胎發(fā)育程序在腫瘤中失調(diào)的形式捕獲基因之間的非線性關(guān)系。
首先桩匪,廣泛收集數(shù)據(jù)打瘪。除了TCGA,還整合了來自其他癌癥隊列的樣本以及我們從FFPE組織生成的測序數(shù)據(jù)傻昙。接下來將樣本分成兩個獨立的群組用于構(gòu)建模型的訓(xùn)練群組和模型從未見過的單獨群組闺骚,稍后用于測試性能。接下來將發(fā)展反卷積方法與直接在基因表達(dá)數(shù)據(jù)上進行訓(xùn)練進行了比較妆档。在組裝的病例隊列中選擇了表達(dá)變化最大的基因與D-MLP進行匹配僻爽,并訓(xùn)練了一個新分類器評估了新分類器在測試集上的準(zhǔn)確性〖值耄總之胸梆,研究團隊得出結(jié)論,與直接對相似數(shù)量的輸入特征的基因表達(dá)數(shù)據(jù)進行訓(xùn)練相比纤虽,發(fā)育反卷積產(chǎn)生的分類精度更高乳绕。
圖5:腫瘤類型發(fā)育多層感知器(D-MLP)分類器的構(gòu)建和測試绞惦。
未知原發(fā)性癌癥仍然是一個主要的臨床問題逼纸,惡性腫瘤表現(xiàn)出侵襲性特征和較差的患者預(yù)后。在臨床上出現(xiàn)CUP的患者中济蝉,通過使用H&E染色杰刽、免疫組化和腫瘤突變分析可以有效解決病例菠发。然而一部分病例未能通過所有當(dāng)前可用的診斷技術(shù),仍然是需要新方法的真正診斷困境贺嫂。因此滓鸠,研究團隊將D-MLP分類器應(yīng)用于20個此類CUP病例,代表了機構(gòu)中最具挑戰(zhàn)性的診斷困境第喳。分類器對大多數(shù)情況做出了強有力的診斷預(yù)測糜俗,分布在分類類型中。CUP的發(fā)育反卷積顯示曲饱,內(nèi)皮軌跡對大約一半的病例有很大貢獻(xiàn)悠抹;同樣,間充質(zhì)軌跡對大約一半的病例有很大貢獻(xiàn)扩淀。
如果臨床上可用楔敌,這種發(fā)育信息可以補充診斷決策。免疫組化顯示乳腺標(biāo)志物驻谆、肺和黑色素瘤呈陰性卵凑,上皮標(biāo)志物呈陽性,并且泌尿生殖起源可變或者弱陽性胜臊。分析腹水中的細(xì)胞勺卢,D-MLP分類器對該病例給出了卵巢癌的強有力預(yù)測。六個月后象对,經(jīng)過廣泛的額外臨床檢查值漫,發(fā)現(xiàn)患者有腫塊,證實為卵巢漿液性癌织盼⊙詈危總之,基于發(fā)育反卷積的深度學(xué)習(xí)分類器可以作為有用的輔助工具沥邻,影響診斷和臨床決策危虱。
圖6:通過發(fā)育多層感知器D-MLP診斷未知原發(fā)性癌癥。
綜上所述唐全,本研究的結(jié)果給出了人類腫瘤的發(fā)展圖譜埃跷,并提出了一種新的工具,以減少病理學(xué)診斷的不確定性邮利,并暗示癌癥的診斷分類弥雹。
作者介紹
SalilGarg,醫(yī)學(xué)博士延届,麻省總醫(yī)院和哈佛醫(yī)學(xué)院病理學(xué)研究員剪勿,麻省理工學(xué)院科赫綜合癌癥研究所臨床研究員。其所領(lǐng)導(dǎo)的實驗室結(jié)合了來自細(xì)胞生物學(xué)方庭、系統(tǒng)生物學(xué)和生物信息學(xué)的方法來理解異質(zhì)性以及它是如何導(dǎo)致癌癥治療失敗的厕吉。在一個相關(guān)的方向上酱固,研究團隊正在使用腫瘤的發(fā)展繪圖來建立新的癌癥診斷,更精確地定義癌癥實體和預(yù)測治療反應(yīng)头朱。長期目標(biāo)是了解癌癥和發(fā)展的異質(zhì)性是如何產(chǎn)生的运悲,了解哪些癌癥是由發(fā)展現(xiàn)象驅(qū)動的,并利用這些知識來改善癌癥的治療和診斷项钮。
參考文獻(xiàn)
Moiso E, Farahani A, Marble HD, Hendricks A, Mildrum S, Levine S, Lennerz JK, Garg S. Developmental Deconvolution for Classification of Cancer Origin. Cancer Discov. 2022 Aug 30:CD-21-1443. doi: 10.1158/2159-8290.CD-21-1443. Epub ahead of print. PMID: 36041084.=