Nature | AI病理預(yù)測(cè)未知原發(fā)性癌癥的起源
原創(chuàng)?榴蓮不酥?圖靈基因?今天
收錄于話題#前沿生物大數(shù)據(jù)分析
撰文:榴蓮不酥
IF=49.962
推薦度:?????
亮點(diǎn):
不明原發(fā)性癌癥因?yàn)闊o法確定腫瘤的原發(fā)性主要解剖部位诺核,這對(duì)于癌癥的治療來說提出了相當(dāng)大的挑戰(zhàn)亥曹。該團(tuán)隊(duì)提出了一種基于深度學(xué)習(xí)的算法——通過深度學(xué)習(xí)進(jìn)行腫瘤起源評(píng)估(TOAD)院水,即使用常規(guī)獲得的組織學(xué)切片為原發(fā)腫瘤的起源提供鑒別診斷鬼廓,深度學(xué)習(xí)可用作輔助工具噩死,為轉(zhuǎn)移性腫瘤和不明原發(fā)性癌癥的復(fù)雜病例提供鑒別診斷,并可與輔助檢查和廣泛的診斷檢查結(jié)合使用或代替輔助檢查和廣泛的診斷檢查熔任,以減少不明原發(fā)性癌癥的發(fā)生染突。
2021年5月5日,在Nature雜志上發(fā)表了一篇名為“AI-based pathology predicts origins for cancers of unknown primary”的文章姻僧,提出了一種基于深度學(xué)習(xí)的算法——通過深度學(xué)習(xí)進(jìn)行腫瘤起源評(píng)估规丽,它可以使用常規(guī)獲得的組織學(xué)切片為原發(fā)腫瘤的起源提供鑒別診斷蒲牧,以更好的為原發(fā)腫瘤的診斷提供技術(shù)手段。
原發(fā)性腫瘤的主要解剖部位在指導(dǎo)轉(zhuǎn)移性腫瘤患者的臨床護(hù)理中至關(guān)重要赌莺,目前臨床上確定腫瘤的原發(fā)性主要解剖部位通常通過組織病理學(xué)檢查或者通過患者的臨床和放射學(xué)評(píng)估確定冰抢。隨著科技的發(fā)展,盡管對(duì)復(fù)雜的成像方式進(jìn)行了改進(jìn)艘狭,使用免疫造血化學(xué)(IHC)進(jìn)行特定和敏感的測(cè)試晒屎,原發(fā)腫瘤原位的具體確定仍然可以是一個(gè)診斷難題。事實(shí)上缓升,1%的癌癥往往是分類為不明原發(fā)性癌癥鼓鲁,不明原發(fā)性癌癥患者經(jīng)常接受全面診斷,包括病理學(xué)港谊,放射學(xué)骇吭,內(nèi)窺鏡和實(shí)驗(yàn)室檢查以確定腫瘤的發(fā)生位置。最近的研究建議使用基因組學(xué)和轉(zhuǎn)錄組學(xué)來確定腫瘤的主要來源歧寺,然而分子譜分析并非對(duì)每一位患者進(jìn)行常規(guī)分析燥狰,尤其是在資源匱乏的條件下。深度學(xué)習(xí)的進(jìn)步在醫(yī)學(xué)的各種不同診斷任務(wù)中證明了準(zhǔn)確斜筐、可靠和可重復(fù)的優(yōu)點(diǎn)龙致,能夠輕松識(shí)別專家無法識(shí)別的特征。
FaisalMahmood教授團(tuán)隊(duì)向我們展示了TOAD顷链,這是一種高通量目代、可解釋的基于深度學(xué)習(xí)的方案,基于AI的腫瘤起源評(píng)估嗤练。它使用基于臨床診斷確定腫瘤標(biāo)本原發(fā)部位的蘇木精-伊紅全載玻片圖像(WSI)榛了。該團(tuán)隊(duì)認(rèn)為他們的方法可用于同時(shí)預(yù)測(cè)腫瘤是否為轉(zhuǎn)移性腫瘤并為原發(fā)腫瘤的起源分配鑒別診斷。TOAD可以作為病理學(xué)家的輔助工具煞抬,用于評(píng)估復(fù)雜的轉(zhuǎn)移性和未知原發(fā)腫瘤病例霜大,需要進(jìn)行大量臨床和輔助檢查以縮小鑒別診斷范圍。
TOAD工作流程如圖一所示革答,將患者的數(shù)字化高分辨率組織學(xué)載玻片作為主網(wǎng)絡(luò)輸入战坤,對(duì)于每個(gè)WSI,組織內(nèi)容會(huì)自動(dòng)分割并平均分成數(shù)千個(gè)~數(shù)萬個(gè)區(qū)域作為小圖像塊残拐。這些圖像由具有固定參數(shù)的卷積神經(jīng)網(wǎng)絡(luò)處理途茫,該網(wǎng)絡(luò)作為編碼器從每個(gè)補(bǔ)丁中提取緊湊的描述性特征向量。使用基于注意力的多實(shí)例學(xué)習(xí)算法蹦骑,TOAD學(xué)習(xí)使用特征向量對(duì)幻燈片中的所有組織區(qū)域進(jìn)行排序慈省,并根據(jù)它們的相對(duì)重要性在整個(gè)幻燈片中聚合它們的信息臀防,為感知到的區(qū)域分配更大的權(quán)重診斷相關(guān)性眠菇。作為額外的協(xié)變量边败,患者的性別可以與匯總的組織學(xué)特征融合以進(jìn)一步指導(dǎo)分類。通過使用分支網(wǎng)絡(luò)架構(gòu)和多任務(wù)目標(biāo)捎废,TOAD可以預(yù)測(cè)腫瘤起源以及癌癥是原發(fā)性還是轉(zhuǎn)移性笑窜。每個(gè)任務(wù)學(xué)習(xí)單獨(dú)的注意力層權(quán)重以增加模型的表達(dá)能力,使其能夠根據(jù)任務(wù)關(guān)注幻燈片的不同信息豐富區(qū)域集登疗。
圖1:TOAD工作流程
該團(tuán)隊(duì)后續(xù)對(duì)深度學(xué)習(xí)模型性能進(jìn)行了評(píng)估排截,結(jié)果顯示模型在訓(xùn)練期間的整體準(zhǔn)確率為83.4%;當(dāng)使用top-k鑒別診斷準(zhǔn)確度評(píng)估模型時(shí)辐益,TOAD實(shí)現(xiàn)了top-3 95.5%的準(zhǔn)確度和top-598.1%的準(zhǔn)確度断傲。最高預(yù)測(cè)對(duì)于轉(zhuǎn)移性腫瘤和不明原發(fā)性癌癥的復(fù)雜病例可能有用,在這些病例中縮小潛在的原發(fā)腫瘤起源可以幫助診斷腫瘤的工作流程并減少發(fā)現(xiàn)原發(fā)性腫瘤所需的輔助測(cè)試的數(shù)量智政。高top-k精度表明使用TOAD對(duì)給定幻燈片的最高預(yù)測(cè)將腫瘤的起源縮小到少數(shù)认罩,他們表示該模型以高置信度做出的預(yù)測(cè)通常是可靠的。此外续捂,TOAD能夠以85.0%的準(zhǔn)確度和0.942的受試者操作特征曲線下面積(AUCROC)預(yù)測(cè)腫瘤標(biāo)本是否為轉(zhuǎn)移垦垂。
該團(tuán)隊(duì)也在不同醫(yī)療保健領(lǐng)域評(píng)估了該模型的適應(yīng)性。在沒有調(diào)整或預(yù)適應(yīng)的情況下牙瓢,具有不同染色方案和患者群體的系統(tǒng)中劫拗,TOAD訓(xùn)練模型產(chǎn)生了79.9%的準(zhǔn)確率以及93.4%的top-3準(zhǔn)確率。此外在區(qū)分轉(zhuǎn)移瘤和原發(fā)腫瘤矾克,該模型AUC為0.919页慷,表明該模型能夠泛化到不同的數(shù)據(jù)源和染色訓(xùn)練期間未遇到的情況。
圖2:TOAD模型性能
由于有限的真實(shí)標(biāo)簽和固有的相關(guān)不確定性胁附,客觀評(píng)估模型預(yù)測(cè)CUP病例的腫瘤起源的能力具有挑戰(zhàn)性差购,即使在這些標(biāo)簽確實(shí)存在的情況下。因此汉嗽,該研究團(tuán)隊(duì)首先測(cè)試集中分析了TOAD對(duì)轉(zhuǎn)移性腫瘤的性能欲逃,該測(cè)試集中已為其分配了診斷并可用。對(duì)于這些轉(zhuǎn)移性腫瘤饼暑,TOAD實(shí)現(xiàn)了82.8%的準(zhǔn)確度和94.9%的top-3準(zhǔn)確度稳析。我們使用診斷性IHC染色的數(shù)量作為間接測(cè)量來識(shí)別難以診斷的病例26并檢查模型在不同IHC使用水平上的性能。正如預(yù)期的那樣弓叛,在不需要IHC診斷的患者中彰居,TOAD的準(zhǔn)確度最高,為87.4%撰筷,top-3準(zhǔn)確度為96.7%陈惰。然而,即使在需要三個(gè)或更多IHC測(cè)試的更困難的情況下毕籽,TOAD仍然達(dá)到了75.7%的準(zhǔn)確率和92.0%的top-3準(zhǔn)確率抬闯。
圖3:分類性能預(yù)測(cè)轉(zhuǎn)移性腫瘤的癌癥起源
該團(tuán)隊(duì)進(jìn)一步整理了來自152個(gè)醫(yī)療中心的743名患者的數(shù)據(jù)集井辆,這些患者在診斷和治療過程中的某個(gè)時(shí)間點(diǎn)被診斷為CUP。這些患者不能單獨(dú)使用組織學(xué)幻燈片進(jìn)行初步診斷溶握,需要徹底的臨床檢查和輔助測(cè)試杯缺。在分析了所有電子病歷后,我們確定了317名患者的子集睡榆,這些患者被分配了主要差異萍肆。這些對(duì)CUP病例的鑒別診斷涉及不確定性和猜想的元素,應(yīng)與可信的胀屿、真實(shí)的標(biāo)簽區(qū)分開來塘揣,而后者無法從CUP病例中實(shí)際獲得。該團(tuán)隊(duì)觀察到宿崭,模型的最高預(yù)測(cè)直接與317名患者中的192名分配的主要差異所指示的原點(diǎn)一致勿负,并且在考慮到模型的top-3和top-5預(yù)測(cè)。這些結(jié)果令人鼓舞劳曹,因?yàn)槲覀兊哪P湍軌蚋鶕?jù)常規(guī)組織學(xué)圖像分配一致的鑒別診斷奴愉,而CUP病例的鑒別診斷通常是在廣泛的調(diào)查診斷檢查后分配的。
圖4:在轉(zhuǎn)移性和原發(fā)腫瘤中預(yù)測(cè)癌癥起源的表現(xiàn)
TOAD是一種深度學(xué)習(xí)算法铁孵,用于根據(jù)常規(guī)組織病理學(xué)幻燈片預(yù)測(cè)腫瘤的主要起源锭硼。使用最少的臨床信息確定轉(zhuǎn)移性腫瘤的起源具有挑戰(zhàn)性,尤其是在僅根據(jù)組織學(xué)評(píng)估腫瘤時(shí)蜕劝。使用常規(guī)H&E組織學(xué)和患者的性別作為輸入檀头,TOAD模型使用弱監(jiān)督學(xué)習(xí)對(duì)數(shù)萬個(gè)樣本進(jìn)行訓(xùn)練,可以做出相當(dāng)準(zhǔn)確的預(yù)測(cè)岖沛,證明使用多任務(wù)學(xué)習(xí)訓(xùn)練的單個(gè)網(wǎng)絡(luò)可以預(yù)測(cè)腫瘤是否發(fā)生了轉(zhuǎn)移暑始,并且可以區(qū)分在同一組織部位發(fā)現(xiàn)的是原發(fā)性腫瘤或者是轉(zhuǎn)移性腫瘤∮は鳎總體而言廊镜,該研究為開發(fā)用于起源預(yù)測(cè)的大規(guī)模弱監(jiān)督人工智能模型提供了概念證明,并為前瞻性研究和臨床試驗(yàn)鋪平了道路唉俗,以進(jìn)一步評(píng)估使用傳統(tǒng)組織學(xué)進(jìn)行基于人工智能的起源預(yù)測(cè)的功效嗤朴。
教授介紹
Mahmood博士是哈佛醫(yī)學(xué)院和布萊根婦女醫(yī)院計(jì)算病理學(xué)部的病理學(xué)助理教授。他在日本沖繩科學(xué)技術(shù)學(xué)院獲得生物醫(yī)學(xué)影像博士學(xué)位虫溜,曾在約翰霍普金斯大學(xué)生物醫(yī)學(xué)工程系從事博士后研究雹姊。他的研究興趣包括病理圖像分析、形態(tài)特征和使用數(shù)據(jù)融合和多模態(tài)分析的生物標(biāo)志物發(fā)現(xiàn)衡楞。Mahmood博士是Dana-Farber癌癥研究所/哈佛癌癥中心的正式成員吱雏;哈佛大學(xué)和麻省理工學(xué)院博德研究所的準(zhǔn)會(huì)員,以及哈佛生物信息學(xué)和綜合基因組學(xué)教員。
參考文獻(xiàn)
Lu MY, Chen TY, Williamson DFK, et al.AI-based pathology predicts origins for cancers of unknown primary. Nature.2021,594(7861):106-110.