2021-11-29

Nature | AI病理預(yù)測(cè)未知原發(fā)性癌癥的起源

原創(chuàng)?榴蓮不酥?圖靈基因?今天

收錄于話題#前沿生物大數(shù)據(jù)分析

撰文:榴蓮不酥

IF=49.962

推薦度:?????

亮點(diǎn):

不明原發(fā)性癌癥因?yàn)闊o法確定腫瘤的原發(fā)性主要解剖部位诺核,這對(duì)于癌癥的治療來說提出了相當(dāng)大的挑戰(zhàn)亥曹。該團(tuán)隊(duì)提出了一種基于深度學(xué)習(xí)的算法——通過深度學(xué)習(xí)進(jìn)行腫瘤起源評(píng)估(TOAD院水,即使用常規(guī)獲得的組織學(xué)切片為原發(fā)腫瘤的起源提供鑒別診斷鬼廓,深度學(xué)習(xí)可用作輔助工具噩死,為轉(zhuǎn)移性腫瘤和不明原發(fā)性癌癥的復(fù)雜病例提供鑒別診斷,并可與輔助檢查和廣泛的診斷檢查結(jié)合使用或代替輔助檢查和廣泛的診斷檢查熔任,以減少不明原發(fā)性癌癥的發(fā)生染突。


2021年5月5日,在Nature雜志上發(fā)表了一篇名為“AI-based pathology predicts origins for cancers of unknown primary”的文章姻僧,提出了一種基于深度學(xué)習(xí)的算法——通過深度學(xué)習(xí)進(jìn)行腫瘤起源評(píng)估规丽,它可以使用常規(guī)獲得的組織學(xué)切片為原發(fā)腫瘤的起源提供鑒別診斷蒲牧,以更好的為原發(fā)腫瘤的診斷提供技術(shù)手段。


原發(fā)性腫瘤的主要解剖部位在指導(dǎo)轉(zhuǎn)移性腫瘤患者的臨床護(hù)理中至關(guān)重要赌莺,目前臨床上確定腫瘤的原發(fā)性主要解剖部位通常通過組織病理學(xué)檢查或者通過患者的臨床和放射學(xué)評(píng)估確定冰抢。隨著科技的發(fā)展,盡管對(duì)復(fù)雜的成像方式進(jìn)行了改進(jìn)艘狭,使用免疫造血化學(xué)(IHC)進(jìn)行特定和敏感的測(cè)試晒屎,原發(fā)腫瘤原位的具體確定仍然可以是一個(gè)診斷難題。事實(shí)上缓升,1%的癌癥往往是分類為不明原發(fā)性癌癥鼓鲁,不明原發(fā)性癌癥患者經(jīng)常接受全面診斷,包括病理學(xué)港谊,放射學(xué)骇吭,內(nèi)窺鏡和實(shí)驗(yàn)室檢查以確定腫瘤的發(fā)生位置。最近的研究建議使用基因組學(xué)和轉(zhuǎn)錄組學(xué)來確定腫瘤的主要來源歧寺,然而分子譜分析并非對(duì)每一位患者進(jìn)行常規(guī)分析燥狰,尤其是在資源匱乏的條件下。深度學(xué)習(xí)的進(jìn)步在醫(yī)學(xué)的各種不同診斷任務(wù)中證明了準(zhǔn)確斜筐、可靠和可重復(fù)的優(yōu)點(diǎn)龙致,能夠輕松識(shí)別專家無法識(shí)別的特征。


FaisalMahmood教授團(tuán)隊(duì)向我們展示了TOAD顷链,這是一種高通量目代、可解釋的基于深度學(xué)習(xí)的方案,基于AI的腫瘤起源評(píng)估嗤练。它使用基于臨床診斷確定腫瘤標(biāo)本原發(fā)部位的蘇木精-伊紅全載玻片圖像(WSI)榛了。該團(tuán)隊(duì)認(rèn)為他們的方法可用于同時(shí)預(yù)測(cè)腫瘤是否為轉(zhuǎn)移性腫瘤并為原發(fā)腫瘤的起源分配鑒別診斷。TOAD可以作為病理學(xué)家的輔助工具煞抬,用于評(píng)估復(fù)雜的轉(zhuǎn)移性和未知原發(fā)腫瘤病例霜大,需要進(jìn)行大量臨床和輔助檢查以縮小鑒別診斷范圍。


TOAD工作流程如圖一所示革答,將患者的數(shù)字化高分辨率組織學(xué)載玻片作為主網(wǎng)絡(luò)輸入战坤,對(duì)于每個(gè)WSI,組織內(nèi)容會(huì)自動(dòng)分割并平均分成數(shù)千個(gè)~數(shù)萬個(gè)區(qū)域作為小圖像塊残拐。這些圖像由具有固定參數(shù)的卷積神經(jīng)網(wǎng)絡(luò)處理途茫,該網(wǎng)絡(luò)作為編碼器從每個(gè)補(bǔ)丁中提取緊湊的描述性特征向量。使用基于注意力的多實(shí)例學(xué)習(xí)算法蹦骑,TOAD學(xué)習(xí)使用特征向量對(duì)幻燈片中的所有組織區(qū)域進(jìn)行排序慈省,并根據(jù)它們的相對(duì)重要性在整個(gè)幻燈片中聚合它們的信息臀防,為感知到的區(qū)域分配更大的權(quán)重診斷相關(guān)性眠菇。作為額外的協(xié)變量边败,患者的性別可以與匯總的組織學(xué)特征融合以進(jìn)一步指導(dǎo)分類。通過使用分支網(wǎng)絡(luò)架構(gòu)和多任務(wù)目標(biāo)捎废,TOAD可以預(yù)測(cè)腫瘤起源以及癌癥是原發(fā)性還是轉(zhuǎn)移性笑窜。每個(gè)任務(wù)學(xué)習(xí)單獨(dú)的注意力層權(quán)重以增加模型的表達(dá)能力,使其能夠根據(jù)任務(wù)關(guān)注幻燈片的不同信息豐富區(qū)域集登疗。


圖1:TOAD工作流程



該團(tuán)隊(duì)后續(xù)對(duì)深度學(xué)習(xí)模型性能進(jìn)行了評(píng)估排截,結(jié)果顯示模型在訓(xùn)練期間的整體準(zhǔn)確率為83.4%;當(dāng)使用top-k鑒別診斷準(zhǔn)確度評(píng)估模型時(shí)辐益,TOAD實(shí)現(xiàn)了top-3 95.5%的準(zhǔn)確度和top-598.1%的準(zhǔn)確度断傲。最高預(yù)測(cè)對(duì)于轉(zhuǎn)移性腫瘤和不明原發(fā)性癌癥的復(fù)雜病例可能有用,在這些病例中縮小潛在的原發(fā)腫瘤起源可以幫助診斷腫瘤的工作流程并減少發(fā)現(xiàn)原發(fā)性腫瘤所需的輔助測(cè)試的數(shù)量智政。高top-k精度表明使用TOAD對(duì)給定幻燈片的最高預(yù)測(cè)將腫瘤的起源縮小到少數(shù)认罩,他們表示該模型以高置信度做出的預(yù)測(cè)通常是可靠的。此外续捂,TOAD能夠以85.0%的準(zhǔn)確度和0.942的受試者操作特征曲線下面積(AUCROC)預(yù)測(cè)腫瘤標(biāo)本是否為轉(zhuǎn)移垦垂。


該團(tuán)隊(duì)也在不同醫(yī)療保健領(lǐng)域評(píng)估了該模型的適應(yīng)性。在沒有調(diào)整或預(yù)適應(yīng)的情況下牙瓢,具有不同染色方案和患者群體的系統(tǒng)中劫拗,TOAD訓(xùn)練模型產(chǎn)生了79.9%的準(zhǔn)確率以及93.4%的top-3準(zhǔn)確率。此外在區(qū)分轉(zhuǎn)移瘤和原發(fā)腫瘤矾克,該模型AUC為0.919页慷,表明該模型能夠泛化到不同的數(shù)據(jù)源和染色訓(xùn)練期間未遇到的情況。


圖2:TOAD模型性能



由于有限的真實(shí)標(biāo)簽和固有的相關(guān)不確定性胁附,客觀評(píng)估模型預(yù)測(cè)CUP病例的腫瘤起源的能力具有挑戰(zhàn)性差购,即使在這些標(biāo)簽確實(shí)存在的情況下。因此汉嗽,該研究團(tuán)隊(duì)首先測(cè)試集中分析了TOAD對(duì)轉(zhuǎn)移性腫瘤的性能欲逃,該測(cè)試集中已為其分配了診斷并可用。對(duì)于這些轉(zhuǎn)移性腫瘤饼暑,TOAD實(shí)現(xiàn)了82.8%的準(zhǔn)確度和94.9%的top-3準(zhǔn)確度稳析。我們使用診斷性IHC染色的數(shù)量作為間接測(cè)量來識(shí)別難以診斷的病例26并檢查模型在不同IHC使用水平上的性能。正如預(yù)期的那樣弓叛,在不需要IHC診斷的患者中彰居,TOAD的準(zhǔn)確度最高,為87.4%撰筷,top-3準(zhǔn)確度為96.7%陈惰。然而,即使在需要三個(gè)或更多IHC測(cè)試的更困難的情況下毕籽,TOAD仍然達(dá)到了75.7%的準(zhǔn)確率和92.0%的top-3準(zhǔn)確率抬闯。


圖3:分類性能預(yù)測(cè)轉(zhuǎn)移性腫瘤的癌癥起源



該團(tuán)隊(duì)進(jìn)一步整理了來自152個(gè)醫(yī)療中心的743名患者的數(shù)據(jù)集井辆,這些患者在診斷和治療過程中的某個(gè)時(shí)間點(diǎn)被診斷為CUP。這些患者不能單獨(dú)使用組織學(xué)幻燈片進(jìn)行初步診斷溶握,需要徹底的臨床檢查和輔助測(cè)試杯缺。在分析了所有電子病歷后,我們確定了317名患者的子集睡榆,這些患者被分配了主要差異萍肆。這些對(duì)CUP病例的鑒別診斷涉及不確定性和猜想的元素,應(yīng)與可信的胀屿、真實(shí)的標(biāo)簽區(qū)分開來塘揣,而后者無法從CUP病例中實(shí)際獲得。該團(tuán)隊(duì)觀察到宿崭,模型的最高預(yù)測(cè)直接與317名患者中的192名分配的主要差異所指示的原點(diǎn)一致勿负,并且在考慮到模型的top-3和top-5預(yù)測(cè)。這些結(jié)果令人鼓舞劳曹,因?yàn)槲覀兊哪P湍軌蚋鶕?jù)常規(guī)組織學(xué)圖像分配一致的鑒別診斷奴愉,而CUP病例的鑒別診斷通常是在廣泛的調(diào)查診斷檢查后分配的。


圖4:在轉(zhuǎn)移性和原發(fā)腫瘤中預(yù)測(cè)癌癥起源的表現(xiàn)



TOAD是一種深度學(xué)習(xí)算法铁孵,用于根據(jù)常規(guī)組織病理學(xué)幻燈片預(yù)測(cè)腫瘤的主要起源锭硼。使用最少的臨床信息確定轉(zhuǎn)移性腫瘤的起源具有挑戰(zhàn)性,尤其是在僅根據(jù)組織學(xué)評(píng)估腫瘤時(shí)蜕劝。使用常規(guī)H&E組織學(xué)和患者的性別作為輸入檀头,TOAD模型使用弱監(jiān)督學(xué)習(xí)對(duì)數(shù)萬個(gè)樣本進(jìn)行訓(xùn)練,可以做出相當(dāng)準(zhǔn)確的預(yù)測(cè)岖沛,證明使用多任務(wù)學(xué)習(xí)訓(xùn)練的單個(gè)網(wǎng)絡(luò)可以預(yù)測(cè)腫瘤是否發(fā)生了轉(zhuǎn)移暑始,并且可以區(qū)分在同一組織部位發(fā)現(xiàn)的是原發(fā)性腫瘤或者是轉(zhuǎn)移性腫瘤∮は鳎總體而言廊镜,該研究為開發(fā)用于起源預(yù)測(cè)的大規(guī)模弱監(jiān)督人工智能模型提供了概念證明,并為前瞻性研究和臨床試驗(yàn)鋪平了道路唉俗,以進(jìn)一步評(píng)估使用傳統(tǒng)組織學(xué)進(jìn)行基于人工智能的起源預(yù)測(cè)的功效嗤朴。

教授介紹

Mahmood博士是哈佛醫(yī)學(xué)院和布萊根婦女醫(yī)院計(jì)算病理學(xué)部的病理學(xué)助理教授。他在日本沖繩科學(xué)技術(shù)學(xué)院獲得生物醫(yī)學(xué)影像博士學(xué)位虫溜,曾在約翰霍普金斯大學(xué)生物醫(yī)學(xué)工程系從事博士后研究雹姊。他的研究興趣包括病理圖像分析、形態(tài)特征和使用數(shù)據(jù)融合和多模態(tài)分析的生物標(biāo)志物發(fā)現(xiàn)衡楞。Mahmood博士是Dana-Farber癌癥研究所/哈佛癌癥中心的正式成員吱雏;哈佛大學(xué)和麻省理工學(xué)院博德研究所的準(zhǔn)會(huì)員,以及哈佛生物信息學(xué)和綜合基因組學(xué)教員。


參考文獻(xiàn)

Lu MY, Chen TY, Williamson DFK, et al.AI-based pathology predicts origins for cancers of unknown primary. Nature.2021,594(7861):106-110.

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末歧杏,一起剝皮案震驚了整個(gè)濱河市镰惦,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌得滤,老刑警劉巖陨献,帶你破解...
    沈念sama閱讀 217,084評(píng)論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件盒犹,死亡現(xiàn)場離奇詭異懂更,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)急膀,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,623評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門沮协,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人卓嫂,你說我怎么就攤上這事慷暂。” “怎么了晨雳?”我有些...
    開封第一講書人閱讀 163,450評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵行瑞,是天一觀的道長。 經(jīng)常有香客問我餐禁,道長血久,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,322評(píng)論 1 293
  • 正文 為了忘掉前任帮非,我火速辦了婚禮氧吐,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘末盔。我一直安慰自己筑舅,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,370評(píng)論 6 390
  • 文/花漫 我一把揭開白布陨舱。 她就那樣靜靜地躺著翠拣,像睡著了一般。 火紅的嫁衣襯著肌膚如雪游盲。 梳的紋絲不亂的頭發(fā)上心剥,一...
    開封第一講書人閱讀 51,274評(píng)論 1 300
  • 那天,我揣著相機(jī)與錄音背桐,去河邊找鬼优烧。 笑死,一個(gè)胖子當(dāng)著我的面吹牛链峭,可吹牛的內(nèi)容都是我干的畦娄。 我是一名探鬼主播,決...
    沈念sama閱讀 40,126評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢(mèng)啊……” “哼熙卡!你這毒婦竟也來了杖刷?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,980評(píng)論 0 275
  • 序言:老撾萬榮一對(duì)情侶失蹤驳癌,失蹤者是張志新(化名)和其女友劉穎滑燃,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體颓鲜,經(jīng)...
    沈念sama閱讀 45,414評(píng)論 1 313
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡表窘,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,599評(píng)論 3 334
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了甜滨。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片乐严。...
    茶點(diǎn)故事閱讀 39,773評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖衣摩,靈堂內(nèi)的尸體忽然破棺而出昂验,到底是詐尸還是另有隱情,我是刑警寧澤艾扮,帶...
    沈念sama閱讀 35,470評(píng)論 5 344
  • 正文 年R本政府宣布既琴,位于F島的核電站,受9級(jí)特大地震影響泡嘴,放射性物質(zhì)發(fā)生泄漏甫恩。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,080評(píng)論 3 327
  • 文/蒙蒙 一磕诊、第九天 我趴在偏房一處隱蔽的房頂上張望填物。 院中可真熱鬧,春花似錦霎终、人聲如沸滞磺。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,713評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽击困。三九已至,卻和暖如春广凸,著一層夾襖步出監(jiān)牢的瞬間阅茶,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,852評(píng)論 1 269
  • 我被黑心中介騙來泰國打工谅海, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留脸哀,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,865評(píng)論 2 370
  • 正文 我出身青樓扭吁,卻偏偏與公主長得像撞蜂,于是被迫代替她去往敵國和親盲镶。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,689評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容