Nat Cancer | 多模態(tài)數(shù)據(jù)整合預(yù)測(cè)肺癌患者對(duì)PD-(L)1療法的反應(yīng)
原創(chuàng)?驕陽(yáng)似我?圖靈基因?2022-09-04 10:11?發(fā)表于江蘇
收錄于合集#前沿生物大數(shù)據(jù)分析
撰文:驕陽(yáng)似我
IF:23.177
推薦度:?????????
亮點(diǎn):
1.?本文對(duì)247名接受PD-(L)1阻斷治療的非小細(xì)胞肺癌患者進(jìn)行了一項(xiàng)嚴(yán)格治療的多模式隊(duì)列研究,以建立一個(gè)基于深度注意力的多實(shí)例學(xué)習(xí)模型(DyAM),預(yù)測(cè)免疫治療反應(yīng)遏考。
2.?本文提出了一種自適應(yīng)加權(quán)多模式方法的定量評(píng)估和預(yù)測(cè)方法,該方法與來(lái)自組織學(xué)御雕、放射學(xué)矢沿、基因組學(xué)和護(hù)理標(biāo)準(zhǔn)認(rèn)可的生物標(biāo)志物的單峰特征相關(guān)。
阻斷程序性細(xì)胞死亡蛋白1(PD-1)及其配體(PD-L1)以激活細(xì)胞毒性抗腫瘤T細(xì)胞的免疫療法迅速改變了非小細(xì)胞肺癌的治療格局酸纲。短短4年捣鲸,PD-1/PD-L1通路阻斷療法(簡(jiǎn)稱(chēng)PD-(L)1)已成為幾乎所有患者治療的常規(guī)組成部分,目前正在肺癌早期階段和與其他療法聯(lián)合進(jìn)行試驗(yàn)闽坡。這些治療對(duì)一部分晚期肺癌患者具有長(zhǎng)期摄狱、持久的潛在益處。
近期无午,在Nature cancer雜志上發(fā)表了一篇名為“Multimodal integration of radiology, pathology and genomics for prediction of response to PD-(L)1 blockade in patients with non-small cell lung cancer”的文章,該文章試圖開(kāi)發(fā)一種新的模型祝谚,以整合和綜合臨床護(hù)理期間常規(guī)獲得的多模式數(shù)據(jù)宪迟,以預(yù)測(cè)免疫治療的反應(yīng)。
建立非小細(xì)胞肺癌多模式隊(duì)列以預(yù)測(cè)反應(yīng)交惯。
MSK癌癥中心確定了247名晚期非小細(xì)胞肺癌患者次泽,他們?cè)?014年至2019年接受了PD-(L)1阻斷治療,基線數(shù)據(jù)和已知結(jié)果稱(chēng)為多模式隊(duì)列席爽。在多模式隊(duì)列中意荤,有應(yīng)答者和無(wú)應(yīng)答者之間的標(biāo)準(zhǔn)臨床生物標(biāo)志物,包括PD-L1腫瘤比例評(píng)分(TPS)和TMB顯著不同只锻;然而玖像,使用這些特征的分類(lèi)模型無(wú)法完全區(qū)分兩組。
因此齐饮,從MSK-IMPACT臨床測(cè)序平臺(tái)為多模式隊(duì)列收集了常規(guī)收集的臨床信息捐寥、CT掃描、含有非小細(xì)胞肺癌的組織中的數(shù)字化PD-L1 IHC和基因組特征祖驱。利用這些數(shù)據(jù)建立了多模式生物標(biāo)志物握恳。首先單獨(dú)量化每個(gè)模態(tài)的預(yù)測(cè)能力,然后將所有可用數(shù)據(jù)組合成多模態(tài)生物標(biāo)志物捺僻,以構(gòu)建預(yù)測(cè)響應(yīng)的算法乡洼。通過(guò)合并測(cè)試集的結(jié)果,進(jìn)行了十倍交叉驗(yàn)證匕坯,以獲得整個(gè)多峰隊(duì)列的模型預(yù)測(cè)束昵。
圖1 :非小細(xì)胞肺癌的多模式隊(duì)列特征和模式。
來(lái)自臨床測(cè)序數(shù)據(jù)的反應(yīng)的基因組預(yù)測(cè)因子醒颖。
本文評(píng)估了MSK IMPACT臨床測(cè)序數(shù)據(jù)的特征妻怎,以檢測(cè)廣泛的體細(xì)胞基因改變。使用多模式隊(duì)列中PFS的多變量分析泞歉,EGFR的變化和腫瘤突變負(fù)荷(TMB)在突變癌基因(EGFR逼侦、ALK匿辩、ROS1、RET榛丢、MET铲球、ERBB2和BRAF)、腫瘤抑制基因(STK11)晰赞、轉(zhuǎn)錄調(diào)節(jié)因子(ARID1A)的多變量分析中顯示出顯著的修正危險(xiǎn)比(aHR)和TMB稼病。
LR(L1-regularized logistic regression)用于確定TMB與反應(yīng)之間的相關(guān)性。在非小細(xì)胞肺癌(不包括TMB)中通常研究的基因組改變的預(yù)測(cè)能力低于使用TMB和基因組改變訓(xùn)練的模型掖鱼;然而然走,該模型使用TMB和基因組改變的平均值進(jìn)行類(lèi)似的實(shí)驗(yàn),這些特征是獨(dú)立的預(yù)測(cè)因子戏挡;EGFR和TMB不相關(guān)以及STK11和TMB芍瑞,并且包含TMB對(duì)擬合中EGFR和STK11的系數(shù)沒(méi)有影響。這些結(jié)果與以前的報(bào)告基本一致褐墅,證明了它們?cè)诙嗄J綌?shù)據(jù)整合隊(duì)列中的適用性拆檬。
圖2:基因組改變和TMB的反應(yīng)建模。
通過(guò)深度學(xué)習(xí)的多模式集成可以改進(jìn)預(yù)測(cè)妥凳。
在評(píng)估了單峰特征的預(yù)測(cè)能力后竟贯,接下來(lái)實(shí)施了DyAM模型,以結(jié)合放射學(xué)逝钥、組織學(xué)和基因組學(xué)特征預(yù)測(cè)PD-(L)1阻斷反應(yīng)的影響屑那。DyAM模型輸出歸因于每個(gè)模態(tài)的風(fēng)險(xiǎn)(部分風(fēng)險(xiǎn)得分)、模態(tài)接收的注意力(注意力權(quán)重和份額)和總得分艘款。DyAM在沒(méi)有特征的給定患者中具有掩蔽模式的實(shí)用質(zhì)量齐莲。這個(gè)使用Kaplan–Meier分析評(píng)估了多模式整合的性能,其中基于多模式DyAM的分層在區(qū)分高風(fēng)險(xiǎn)和低風(fēng)險(xiǎn)患者方面比PD-L1 TPS和TMB的標(biāo)準(zhǔn)臨床生物標(biāo)志物更有效磷箕。使用該框架系統(tǒng)地比較了單峰特征以及雙峰和多峰特征的各種組合选酗。
一般來(lái)說(shuō),分層互補(bǔ)特征提高了模式內(nèi)和模式間的性能岳枷。此外芒填,整合放射學(xué)數(shù)據(jù)和PD-L1衍生特征(TPS和IHC紋理)的雙峰動(dòng)態(tài)隨機(jī)模型導(dǎo)致AUC=2.68和95%置信域0.61–0.75,而PD-L1和基因組特征的組合導(dǎo)致AUC=0.72和95%可信域0.65–0.79空繁。結(jié)合放射學(xué)和基因組學(xué)特征導(dǎo)致最高的雙峰表現(xiàn)(AUC=0.76殿衰,95%CI 0.69–0.83)。這些雙峰特征中的每一個(gè)都單獨(dú)在單峰特征集上進(jìn)行了改進(jìn)盛泡。
圖3:基于Dyam的單峰和多峰響應(yīng)預(yù)測(cè)闷祥。
使用三種數(shù)據(jù)模式的最佳全自動(dòng)方法包括IHC-G特征,AUC=0.78(95%CI 0.72–0.85)傲诵。最后凯砍,使用PD-L1 TPS評(píng)分的三種數(shù)據(jù)模式得出最高準(zhǔn)確度箱硕,AUC=0.80(95%CI 0.74–0.86)。這與所有模式的LR評(píng)分平均值(AUC=1.72悟衩,95%可信區(qū)間0.65–0.79)形成對(duì)比剧罩。所有多峰動(dòng)態(tài)分析結(jié)果均顯著高于通過(guò)置換測(cè)試獲得的零假設(shè)AUC。然后使用多變量Cox回歸將DyAM模型與已建立的免疫治療反應(yīng)生物標(biāo)志物以及臨床混雜因素進(jìn)行比較座泳。當(dāng)將分類(lèi)器性能與LR風(fēng)險(xiǎn)分?jǐn)?shù)進(jìn)行比較時(shí)惠昔,只有集成模型是顯著的。
使用DyAM評(píng)分將隊(duì)列分成四分位挑势,并進(jìn)行相應(yīng)的Kaplan–Meier分析镇防,重點(diǎn)關(guān)注前12個(gè)月的PFS,以突出DyAM在治療后早期分離反應(yīng)組的潛力潮饱。4個(gè)月時(shí)营罢,最低(保護(hù)性)四分位的進(jìn)展為21%,最高(風(fēng)險(xiǎn))四分位數(shù)的進(jìn)展為79%饼齿,而平均法為30%和60%。
最后評(píng)估了重新加權(quán)個(gè)體數(shù)據(jù)模式對(duì)整體模型性能的影響蝙搔。在存在數(shù)據(jù)模式的患者亞群中缕溉,觀察到去除肺實(shí)質(zhì)結(jié)節(jié)CT紋理和基因組改變對(duì)AUC的影響最大,而該模型對(duì)去除IHC紋理和PD-L1 TPS具有魯棒性吃型。數(shù)據(jù)模態(tài)之間的非線性關(guān)系表明了在DyAM中使用的加權(quán)方案的影響证鸥。在4個(gè)月時(shí),較低和較高四分位數(shù)之間的比率為3.8勤晚,當(dāng)去除CT紋理或基因組改變時(shí)枉层,該比率急劇下降;然而赐写,這種早期分離并沒(méi)有單獨(dú)從兩種模式中表現(xiàn)出來(lái)鸟蜡。隨著單峰注意力的增加,所有模式的模型性能都會(huì)下降挺邀,而動(dòng)態(tài)平均模型的性能優(yōu)于簡(jiǎn)單平均揉忘。
圖4:基于dyam的多峰分析。
生物醫(yī)學(xué)成像端铛、組織病理學(xué)和基因組分析的整合以指導(dǎo)腫瘤決策仍處于初步階段泣矛。在此,本文表明禾蚕,自動(dòng)從不同模式中提取鑒別特征的機(jī)器學(xué)習(xí)方法具有互補(bǔ)和組合能力您朽,可識(shí)別接受免疫治療的非小細(xì)胞肺癌高風(fēng)險(xiǎn)和低風(fēng)險(xiǎn)患者。本文的研究表明换淆,常規(guī)診斷數(shù)據(jù)中的信息內(nèi)容(包括基線CT掃描哗总、組織病理學(xué)切片和臨床下一代測(cè)序)可以結(jié)合起來(lái)几颜,以改善對(duì)PD-(L)1阻斷反應(yīng)的預(yù)測(cè),無(wú)論是單獨(dú)還是標(biāo)準(zhǔn)臨床方法魂奥。
本文的結(jié)果表明可以使用計(jì)算和機(jī)器學(xué)習(xí)方法對(duì)來(lái)自多種癌癥診斷模式的現(xiàn)有數(shù)據(jù)進(jìn)行注釋菠剩、提取和組合,以用于非小細(xì)胞肺癌免疫治療反應(yīng)預(yù)測(cè)的下一代生物標(biāo)志物開(kāi)發(fā)耻煤。本文的DyAM模型是整合多模態(tài)數(shù)據(jù)的一種有前途的方法具壮,未來(lái)使用更大數(shù)據(jù)集的模型將有可能增強(qiáng)當(dāng)前治療決策中的精確腫瘤學(xué)實(shí)踐。
教授介紹:
Sohrab P. Shah
Sohrab Shah于2008年從UBC獲得了計(jì)算機(jī)科學(xué)博士學(xué)位哈蝇,Shah的研究重點(diǎn)是通過(guò)涉及基因組學(xué)和計(jì)算建模的綜合方法棺妓,了解腫瘤如何隨時(shí)間演變。Shah博士開(kāi)創(chuàng)了計(jì)算方法和軟件炮赦,用于推斷癌癥基因組中的突變怜跑,并破譯癌癥進(jìn)化模式,這些方法和軟件已在國(guó)際上廣泛傳播吠勘。他在開(kāi)發(fā)新穎性芬、創(chuàng)新的貝葉斯統(tǒng)計(jì)模型、算法和計(jì)算方法以分析來(lái)自患者腫瘤和模型系統(tǒng)的大型剧防、高維基因組學(xué)和轉(zhuǎn)錄組學(xué)數(shù)據(jù)集方面有著良好的記錄植锉。
Shah博士一直在研究乳腺、卵巢和淋巴惡性腫瘤的腫瘤演變峭拘。他的工作已在《自然》俊庇、《自然遺傳學(xué)》、《自然方法》鸡挠、《NEJM》辉饱、《基因組研究》、《基因組生物學(xué)》等雜志上發(fā)表拣展。Shah于2010年被任命為不列顛哥倫比亞省癌癥機(jī)構(gòu)和不列顛哥倫比亞大學(xué)的首席研究員彭沼。此外,Shah博士于2018年4月被任命為MSK計(jì)算腫瘤學(xué)服務(wù)的首任主任备埃,現(xiàn)任Nichols Biondi主席溜腐。他擔(dān)任加拿大計(jì)算癌癥基因組學(xué)研究主席,并獲得邁克爾·史密斯健康研究基金會(huì)職業(yè)研究員獎(jiǎng)和特里·腹侠克斯研究所新研究員獎(jiǎng)挺益。
參考文獻(xiàn):
Vanguri, R.S., Luo, J., Aukerman, A.T.et al.Multimodal integration of radiology, pathology and genomics for prediction of response to PD-(L)1 blockade in patients with non-small cell lung cancer.Nat Cancer(2022).?https://doi.org/10.1038/s43018-022-00416-8