Gene-Mutation-Based Algorithm for Prediction of Treatment Response in Colorectal Cancer Patients
基于基因突變的算法用于預(yù)測結(jié)直腸癌患者的治療反應(yīng)
發(fā)表期刊:Cancers (Basel)
發(fā)表日期:2022 Apr 18
DOI:? 10.3390/cancers14082045
一裤纹、背景
????????結(jié)直腸癌(CRC)是全球最流行的癌癥之一蠕啄,也是癌癥相關(guān)死亡的主要原因,初次診斷的患者中約有20%患有轉(zhuǎn)移性CRC(mCRC)婚瓜。病理評估的高變異性限制了它們的臨床準(zhǔn)確性,并造成了有針對性的治療決策和預(yù)測治療結(jié)果的錯(cuò)誤刑棵。重要的是要考慮到CRC的高度異質(zhì)性和復(fù)雜性巴刻,特別是mCRC的原發(fā)和轉(zhuǎn)移性病變,在多個(gè)致癌基因中存在功能增益突變蛉签,在多個(gè)腫瘤抑制因子中存在功能缺失胡陪,這些都參與了增殖、生存和侵襲碍舍。
????????基于機(jī)器學(xué)習(xí)(ML)的算法和通過使用CT或MR成像和切片上的組織形態(tài)學(xué)開發(fā)的模型在臨床決策中變得有用柠座。目前,基于ML的預(yù)測模型已經(jīng)成為預(yù)測CRC疾病轉(zhuǎn)移和治療反應(yīng)的有力工具乒验。新技術(shù)的快速發(fā)展使我們能夠從每個(gè)病人的原發(fā)腫瘤中獲得大量的基因組愚隧、表觀基因組和影像學(xué)數(shù)據(jù),基于人工智能的ML工具不僅對數(shù)據(jù)處理而且對癌癥的早期檢測和預(yù)后也特別有用。
二狂塘、材料與方法
1.數(shù)據(jù)來源
1) 結(jié)直腸癌MSK隊(duì)列:從cBioportal獲得了471名在紀(jì)念斯隆凱特琳醫(yī)院治療的不可切除的結(jié)直腸癌(CRC)患者的數(shù)據(jù)
2) TCGA Firehose Legacy的結(jié)直腸癌隊(duì)列:在隨訪的221名患者中录煤,共有191名有基因突變和治療后癌癥進(jìn)展/復(fù)發(fā)的信息,組成了TCGA隊(duì)列
2.實(shí)驗(yàn)流程
三荞胡、實(shí)驗(yàn)結(jié)果
01妈踊、開發(fā)7種基因的算法
????????由于RAS-RAF-MEK-ERK和PI3K/Akt/PTEN/mTOR途徑的基因突變以及TP53和APC主要參與CRC治療反應(yīng),作者想研究這些途徑的基因突變情況是否可用于預(yù)測治療反應(yīng)泪漂。治療后的疾病進(jìn)展是治療反應(yīng)的一個(gè)主要指標(biāo)廊营;因此,研究了是否可以建立一個(gè)基于基因突變的ML模型作為生物標(biāo)志物萝勤,在診斷場合對CRC患者的治療反應(yīng)進(jìn)行分層和預(yù)測露筒。根據(jù)MSK隊(duì)列中447名患者的臨床數(shù)據(jù),將患者分為兩個(gè)亞組:(i)應(yīng)答組:患者在50個(gè)月內(nèi)一線化療后沒有疾病進(jìn)展敌卓;(ii)無應(yīng)答組:患者在50個(gè)月內(nèi)一線化療后出現(xiàn)疾病進(jìn)展慎式。然后利用隨機(jī)森林機(jī)器學(xué)習(xí)分類篩選,測試候選基因的各種突變情況組合是否能夠區(qū)分應(yīng)答者和非應(yīng)答者趟径。一種被稱為7-基因算法的算法由七個(gè)基因的突變譜組成:KRAS瘪吏、BRAF、ERBB2蜗巧、MAP2K1掌眠、TSC2、TP53和APC幕屹,與所有其他基于基因突變的測試算法相比蓝丙,使用邏輯回歸分析確定的分類準(zhǔn)確率最高。7-基因算法的敏感性為83%香嗓,特異性為98%迅腔,區(qū)分應(yīng)答者和非應(yīng)答者的表現(xiàn)準(zhǔn)確性AUC為0.98(圖2A)。
????????作者比較了7-基因算法與臨床和病理風(fēng)險(xiǎn)指標(biāo)之間的表現(xiàn)準(zhǔn)確性靠娱,包括癌癥分期、輔助治療掠兄、原發(fā)腫瘤的手術(shù)和MSI像云。Logistic回歸分析顯示,癌癥分期對區(qū)分應(yīng)答者和非應(yīng)答者的效用AUC值為0.5(圖2B)蚂夕。輔助治療的敏感性為0%迅诬,AUC為0.41;原發(fā)腫瘤手術(shù)的敏感性為0%婿牍,AUC為0.41侈贷;MSI的敏感性為0%,AUC為0.34(圖2C-E)等脂。當(dāng)7-基因算法與所有這些參數(shù)結(jié)合在一起時(shí)俏蛮,癌癥分期撑蚌、輔助治療、原發(fā)腫瘤手術(shù)和MSI搏屑,其敏感性和AUC值仍與單獨(dú)的7-基因算法相似(圖2F)争涌。這些數(shù)據(jù)表明,7-基因進(jìn)展算法作為區(qū)分一線化療應(yīng)答和無應(yīng)答的分類器具有統(tǒng)計(jì)學(xué)意義辣恋;但是亮垫,當(dāng)使用臨床和病理指標(biāo),包括癌癥分期伟骨、輔助治療饮潦、原發(fā)腫瘤的手術(shù)和MSI作為分類器對患者進(jìn)行分層時(shí),沒有統(tǒng)計(jì)學(xué)意義携狭。
02继蜡、評估7-基因算法用于預(yù)測MSK隊(duì)列治療后的無進(jìn)展生存期
????????為了評估7-基因算法是否可以作為生物標(biāo)志物來預(yù)測MSK隊(duì)列的無進(jìn)展生存期(PFS),作者進(jìn)行了對數(shù)秩分析暑中。K-M圖顯示壹瘟,根據(jù)7基因算法評分分層的亞組之間的PFS存在統(tǒng)計(jì)學(xué)上的顯著差異。診斷時(shí)原發(fā)腫瘤的7基因算法評分高的患者與得分低的患者相比鳄逾,PFS明顯較差(圖3A)稻轨。
????????接下來,研究了臨床和病理指標(biāo)雕凹,包括癌癥分期(I/II期與III/IV期)和輔助治療(治療與不治療)殴俱,原發(fā)腫瘤的手術(shù)(手術(shù)與不手術(shù)),以及MSI類型(穩(wěn)定與不穩(wěn)定)枚抵,是否可以用來預(yù)測MSK隊(duì)列的PFS线欲。K-M圖與log-rank分析顯示,根據(jù)癌癥分期汽摹、治療方法和MSI類型的狀況分層的亞組之間的PFS沒有統(tǒng)計(jì)學(xué)上的顯著差異(圖3B,C,E)李丰,而根據(jù)原發(fā)腫瘤的手術(shù)狀態(tài)分層的亞組之間有小的但有統(tǒng)計(jì)學(xué)意義的差異(圖3D)。
????????作為與該算法的比較逼泣,作者研究了7-基因算法中每個(gè)單獨(dú)基因的突變狀態(tài)是否可用來預(yù)測PFS趴泌。進(jìn)行了K-M分析,比較診斷時(shí)確定的原發(fā)腫瘤中每個(gè)基因有突變型和野生型的患者的PFS拉庶。根據(jù)每個(gè)基因突變狀態(tài)分層的突變組和WT組之間的PFS沒有統(tǒng)計(jì)學(xué)上的顯著差異嗜憔。同時(shí),原發(fā)腫瘤中BRAF或APC突變的患者與這些單個(gè)基因?yàn)閃T的患者之間存在著統(tǒng)計(jì)學(xué)上的顯著差異氏仗。這些數(shù)據(jù)表明吉捶,與MSK隊(duì)列中的每個(gè)單獨(dú)基因相比,7-基因算法可能被用作預(yù)測無進(jìn)展生存期(PFS)的生物標(biāo)志物,具有更好的精確性呐舔。
????????作者進(jìn)一步進(jìn)行了點(diǎn)陣圖分析币励,以說明7-基因算法的分類分?jǐn)?shù)在MSK隊(duì)列中治療應(yīng)答和無應(yīng)答病人之間的分布。該圖顯示兩組患者之間的7-基因算法得分有統(tǒng)計(jì)學(xué)上的顯著差異(圖4)滋早。綜合來看榄审,邏輯回歸分析、Kaplan-Meier圖和點(diǎn)陣圖的結(jié)果是一致的杆麸,表明7-基因算法作為預(yù)測治療反應(yīng)的生物標(biāo)志物的準(zhǔn)確表現(xiàn)搁进。
03、7-基因進(jìn)展算法用于預(yù)測治療后的進(jìn)展情況
????????為了進(jìn)一步評估7-基因算法是否可以作為獨(dú)立的預(yù)測性生物標(biāo)志物來預(yù)測首次診斷時(shí)CRC的治療反應(yīng)昔头,作者根據(jù)MSK隊(duì)列的PFS進(jìn)行了單變量和多變量的Cox比例風(fēng)險(xiǎn)回歸分析饼问。單變量分析顯示,7-基因算法對PFS的預(yù)測能力揭斧,如用風(fēng)險(xiǎn)比(HR)表示莱革,為7.5;而癌癥分期的HR值為1.3讹开,輔助治療的HR為1.1盅视,手術(shù)的HR為0.8,MSI的HR為0.7旦万。這些數(shù)據(jù)表明闹击,與其他臨床和病理指標(biāo)相比,7-基因進(jìn)展算法的HR要高得多成艘,在預(yù)測PFS方面具有統(tǒng)計(jì)學(xué)意義赏半。為了進(jìn)一步證實(shí)7-基因算法對PFS的預(yù)測價(jià)值與臨床指標(biāo)的關(guān)系,進(jìn)行了多變量的Cox分析淆两。7-基因算法作為一個(gè)獨(dú)立的生物標(biāo)志物預(yù)測PFS的HR為8.9断箫,而癌癥分期的HR為1.1,輔助治療的HR為1.1秋冰,手術(shù)的HR為0.7仲义,MSI的HR為0.6。這些結(jié)果表明剑勾,7-基因算法有很大的潛力作為PFS的預(yù)測性生物標(biāo)志物光坝。
04、7-基因進(jìn)展算法用于預(yù)測治療后的進(jìn)展情況
????????為了驗(yàn)證7-基因算法對治療后進(jìn)展的預(yù)測甥材,作者使用了一個(gè)有119名患者的TCGA隊(duì)列(圖1)。在這個(gè)隊(duì)列中性含,119名患者中有30人對治療有反應(yīng)洲赵,沒有進(jìn)展/復(fù)發(fā)。使用與MSK隊(duì)列相同的隨機(jī)森林機(jī)器學(xué)習(xí)算法,利用7個(gè)基因的突變情況叠萍,將每個(gè)患者分為無進(jìn)展的治療應(yīng)答或有進(jìn)展的治療無應(yīng)答芝发。邏輯回歸分析顯示,7-基因算法在區(qū)分應(yīng)答和無應(yīng)答患者群體方面表現(xiàn)出很高的準(zhǔn)確性苛谷,敏感性為96%辅鲸,特異性為77%,AUC為0.97(圖5A)腹殿。與在MSK隊(duì)列中觀察到的情況類似独悴,臨床和病理參數(shù),包括癌癥分期锣尉、新輔助治療刻炒、手術(shù)和MSI,在區(qū)分應(yīng)答者和非應(yīng)答者方面沒有表現(xiàn)出高的特異性和高的AUC值(圖5B自沧,C)坟奥。通過使用7-基因算法與上述所有臨床指標(biāo)相結(jié)合,進(jìn)行邏輯回歸分析拇厢。數(shù)據(jù)顯示爱谁,在TCGA隊(duì)列中,7-基因算法與所有臨床指標(biāo)一起使用孝偎,在區(qū)分治療的應(yīng)答者和非應(yīng)答者方面的表現(xiàn)仍與單獨(dú)使用7-基因算法相似(圖5D)访敌。
????????為了進(jìn)一步驗(yàn)證7-基因算法作為治療反應(yīng)預(yù)測性生物標(biāo)志物的性能,使用TCGA隊(duì)列進(jìn)行了K-M分析邪媳。與使用MSK隊(duì)列觀察到的情況類似捐顷,診斷時(shí)原發(fā)腫瘤中7-基因算法得分高的患者與得分低的患者相比,其PFS明顯較差(圖6A)雨效。作者研究了臨床和病理指標(biāo)迅涮,包括癌癥分期(I/II期與III/IV期)和輔助治療(治療與不治療),是否可用于預(yù)測TCGA隊(duì)列的PFS徽龟。K-M圖與對數(shù)分析顯示叮姑,根據(jù)癌癥分期或治療方法的狀態(tài)分層的亞組之間的PFS沒有統(tǒng)計(jì)學(xué)上的顯著差異(圖6B,C)。
????????作為比較据悔,在MSK和TCGA隊(duì)列中传透,也通過K-M圖評估了算法中七個(gè)基因的突變狀態(tài)對PFS的預(yù)測能力。在這個(gè)隊(duì)列中极颓,KRAS朱盐、ERBB2、TSC2和TP53的突變對PFS沒有統(tǒng)計(jì)學(xué)意義菠隆,WT MAP2K1和MAP2K1突變患者的PFS有明顯差異兵琳。結(jié)果顯示狂秘,大多數(shù)單個(gè)基因突變沒有表現(xiàn)出統(tǒng)計(jì)學(xué)意義,無法對患者的PFS進(jìn)行分層躯肌。
????????為了進(jìn)一步驗(yàn)證7-基因算法作為TCGA隊(duì)列中治療反應(yīng)的預(yù)測性生物標(biāo)志物的性能者春,作者在TCGA驗(yàn)證隊(duì)列中進(jìn)行了單變量和多變量的Cox回歸分析。在單變量分析中清女,7-基因算法的HR所顯示的PFS的預(yù)測能力為16.9钱烟,而癌癥分期的HR為1.2,輔助治療的HR為3.0×10?7嫡丙。在多變量分析中拴袭,調(diào)整了癌癥分期和輔助療法后,7-基因算法的HR值為16.9迄沫,這與單變量分析相似稻扬。癌癥分期和輔助治療的HR值在單變量分析中也相似。有趣的是羊瘩,7-基因算法預(yù)測PFS的HR值在TCGA隊(duì)列中比在MSK隊(duì)列中高泰佳。與在MSK隊(duì)列中觀察到的情況類似,TCGA隊(duì)列中的點(diǎn)陣圖顯示尘吗,治療應(yīng)答和無應(yīng)答的7-基因算法分類得分有統(tǒng)計(jì)學(xué)上的顯著差異(圖7)逝她。這進(jìn)一步顯示了7-基因算法區(qū)分進(jìn)展期和非進(jìn)展期患者的能力。TCGA隊(duì)列的所有評估結(jié)果與MSK隊(duì)列獲得的結(jié)果一致睬捶,證實(shí)了7-基因算法在預(yù)測治療后癌癥進(jìn)展方面的高準(zhǔn)確性黔宛。
05、預(yù)測mCRC患者治療反應(yīng)的7-基因算法的評估
????????在471名CRC患者中擒贸,有388名患者在MSK隊(duì)列中有轉(zhuǎn)移性疾病臀晃。在臨床實(shí)踐中,沒有預(yù)測性生物標(biāo)志物可用于預(yù)測mCRC患者的治療反應(yīng)介劫。因此徽惋,作者想研究7-基因算法是否可用于預(yù)測這388名mCRC患者的反應(yīng)。進(jìn)行了K-M圖和對數(shù)排名分析座韵,發(fā)現(xiàn)在mCRC隊(duì)列中险绘,根據(jù)7-基因算法得分分層的亞組之間的PFS存在統(tǒng)計(jì)學(xué)上的顯著差異。在診斷時(shí)原發(fā)腫瘤中7-Gene Algorithm得分高的mCRC患者與得分低的患者相比PFS明顯較差(圖8A)誉碴。與在MSK隊(duì)列總?cè)丝谥杏^察到的情況類似宦棺,通過使用病理指標(biāo)分層的亞組之間的PFS沒有統(tǒng)計(jì)學(xué)上的顯著差異,包括癌癥分期(I/II期與III/IV期)和輔助治療(治療與不治療)(圖8B黔帕,C)代咸。同時(shí),按原發(fā)腫瘤使用手術(shù)(手術(shù)與不手術(shù))和MSI類型(穩(wěn)定與不穩(wěn)定)分層的亞組之間的PFS差異很小成黄,但有統(tǒng)計(jì)學(xué)意義(圖8D侣背,E)白华。
????????為了進(jìn)一步評估7-基因算法是否可以作為一個(gè)獨(dú)立的預(yù)測性生物標(biāo)志物來預(yù)測mCRC患者在診斷場合的治療反應(yīng),作者通過使用單變量和多變量的Cox比例危險(xiǎn)回歸分析來評估7-基因算法作為mCRC患者PFS的獨(dú)立生物標(biāo)志物的預(yù)測價(jià)值贩耐。單變量分析顯示,7-基因算法對mCRC PFS的預(yù)測能力用HR表示為16.9厦取。多變量分析顯示潮太,7-基因算法對mCRC PFS的預(yù)測能力為17.6爱榔,與癌癥分期(I/II期與III/IV期)涩馆、輔助治療(治療與不治療)、原發(fā)腫瘤的手術(shù)(手術(shù)與不手術(shù))搬素、MSI類型有關(guān)霎箍。這些臨床指標(biāo)在單變量和多變量Cox分析中都沒有表現(xiàn)出作為mCRC患者PFS的預(yù)測性生物標(biāo)志物的統(tǒng)計(jì)學(xué)意義奇钞。有趣的是,7-基因算法預(yù)測mCRC患者PFS的預(yù)測HR值遠(yuǎn)遠(yuǎn)高于其在MSK隊(duì)列總?cè)巳褐械念A(yù)測HR值漂坏,這是用單變量和多變量分析確定的景埃。7-基因算法可作為一種預(yù)測性生物標(biāo)志物,在首次診斷場合對mCRC患者進(jìn)行分層和預(yù)測治療反應(yīng)顶别。
四谷徙、結(jié)論
????????作者建立并比較了7-基因算法與現(xiàn)有的臨床和組織病理學(xué)指標(biāo)來預(yù)測CRC的治療反應(yīng)。這種生物標(biāo)志物模型具有很大的優(yōu)勢驯绎,可以在大型患者群中進(jìn)一步發(fā)展和驗(yàn)證完慧。基于ML的算法的效用將對改善臨床實(shí)踐中的個(gè)性化醫(yī)療和降低CRC的死亡率有很大的好處剩失。