基于基因突變ML模型對CRC患者的治療反應(yīng)進(jìn)行分層和預(yù)測(IF6+)

Gene-Mutation-Based Algorithm for Prediction of Treatment Response in Colorectal Cancer Patients

基于基因突變的算法用于預(yù)測結(jié)直腸癌患者的治療反應(yīng)

發(fā)表期刊:Cancers (Basel)

發(fā)表日期:2022 Apr 18

DOI:? 10.3390/cancers14082045

期刊相關(guān)信息

一裤纹、背景

????????結(jié)直腸癌(CRC)是全球最流行的癌癥之一蠕啄,也是癌癥相關(guān)死亡的主要原因,初次診斷的患者中約有20%患有轉(zhuǎn)移性CRC(mCRC)婚瓜。病理評估的高變異性限制了它們的臨床準(zhǔn)確性,并造成了有針對性的治療決策和預(yù)測治療結(jié)果的錯(cuò)誤刑棵。重要的是要考慮到CRC的高度異質(zhì)性和復(fù)雜性巴刻,特別是mCRC的原發(fā)和轉(zhuǎn)移性病變,在多個(gè)致癌基因中存在功能增益突變蛉签,在多個(gè)腫瘤抑制因子中存在功能缺失胡陪,這些都參與了增殖、生存和侵襲碍舍。

????????基于機(jī)器學(xué)習(xí)(ML)的算法和通過使用CT或MR成像和切片上的組織形態(tài)學(xué)開發(fā)的模型在臨床決策中變得有用柠座。目前,基于ML的預(yù)測模型已經(jīng)成為預(yù)測CRC疾病轉(zhuǎn)移和治療反應(yīng)的有力工具乒验。新技術(shù)的快速發(fā)展使我們能夠從每個(gè)病人的原發(fā)腫瘤中獲得大量的基因組愚隧、表觀基因組和影像學(xué)數(shù)據(jù),基于人工智能的ML工具不僅對數(shù)據(jù)處理而且對癌癥的早期檢測和預(yù)后也特別有用。

二狂塘、材料與方法

1.數(shù)據(jù)來源

1) 結(jié)直腸癌MSK隊(duì)列:從cBioportal獲得了471名在紀(jì)念斯隆凱特琳醫(yī)院治療的不可切除的結(jié)直腸癌(CRC)患者的數(shù)據(jù)

2) TCGA Firehose Legacy的結(jié)直腸癌隊(duì)列:在隨訪的221名患者中录煤,共有191名有基因突變和治療后癌癥進(jìn)展/復(fù)發(fā)的信息,組成了TCGA隊(duì)列

2.實(shí)驗(yàn)流程

圖1????實(shí)驗(yàn)流程

三荞胡、實(shí)驗(yàn)結(jié)果

01妈踊、開發(fā)7種基因的算法

????????由于RAS-RAF-MEK-ERK和PI3K/Akt/PTEN/mTOR途徑的基因突變以及TP53和APC主要參與CRC治療反應(yīng),作者想研究這些途徑的基因突變情況是否可用于預(yù)測治療反應(yīng)泪漂。治療后的疾病進(jìn)展是治療反應(yīng)的一個(gè)主要指標(biāo)廊营;因此,研究了是否可以建立一個(gè)基于基因突變的ML模型作為生物標(biāo)志物萝勤,在診斷場合對CRC患者的治療反應(yīng)進(jìn)行分層和預(yù)測露筒。根據(jù)MSK隊(duì)列中447名患者的臨床數(shù)據(jù),將患者分為兩個(gè)亞組:(i)應(yīng)答組:患者在50個(gè)月內(nèi)一線化療后沒有疾病進(jìn)展敌卓;(ii)無應(yīng)答組:患者在50個(gè)月內(nèi)一線化療后出現(xiàn)疾病進(jìn)展慎式。然后利用隨機(jī)森林機(jī)器學(xué)習(xí)分類篩選,測試候選基因的各種突變情況組合是否能夠區(qū)分應(yīng)答者和非應(yīng)答者趟径。一種被稱為7-基因算法的算法由七個(gè)基因的突變譜組成:KRAS瘪吏、BRAF、ERBB2蜗巧、MAP2K1掌眠、TSC2、TP53和APC幕屹,與所有其他基于基因突變的測試算法相比蓝丙,使用邏輯回歸分析確定的分類準(zhǔn)確率最高。7-基因算法的敏感性為83%香嗓,特異性為98%迅腔,區(qū)分應(yīng)答者和非應(yīng)答者的表現(xiàn)準(zhǔn)確性AUC為0.98(圖2A)。

????????作者比較了7-基因算法與臨床和病理風(fēng)險(xiǎn)指標(biāo)之間的表現(xiàn)準(zhǔn)確性靠娱,包括癌癥分期、輔助治療掠兄、原發(fā)腫瘤的手術(shù)和MSI像云。Logistic回歸分析顯示,癌癥分期對區(qū)分應(yīng)答者和非應(yīng)答者的效用AUC值為0.5(圖2B)蚂夕。輔助治療的敏感性為0%迅诬,AUC為0.41;原發(fā)腫瘤手術(shù)的敏感性為0%婿牍,AUC為0.41侈贷;MSI的敏感性為0%,AUC為0.34(圖2C-E)等脂。當(dāng)7-基因算法與所有這些參數(shù)結(jié)合在一起時(shí)俏蛮,癌癥分期撑蚌、輔助治療、原發(fā)腫瘤手術(shù)和MSI搏屑,其敏感性和AUC值仍與單獨(dú)的7-基因算法相似(圖2F)争涌。這些數(shù)據(jù)表明,7-基因進(jìn)展算法作為區(qū)分一線化療應(yīng)答和無應(yīng)答的分類器具有統(tǒng)計(jì)學(xué)意義辣恋;但是亮垫,當(dāng)使用臨床和病理指標(biāo),包括癌癥分期伟骨、輔助治療饮潦、原發(fā)腫瘤的手術(shù)和MSI作為分類器對患者進(jìn)行分層時(shí),沒有統(tǒng)計(jì)學(xué)意義携狭。

圖2????ROC曲線

02继蜡、評估7-基因算法用于預(yù)測MSK隊(duì)列治療后的無進(jìn)展生存期

????????為了評估7-基因算法是否可以作為生物標(biāo)志物來預(yù)測MSK隊(duì)列的無進(jìn)展生存期(PFS),作者進(jìn)行了對數(shù)秩分析暑中。K-M圖顯示壹瘟,根據(jù)7基因算法評分分層的亞組之間的PFS存在統(tǒng)計(jì)學(xué)上的顯著差異。診斷時(shí)原發(fā)腫瘤的7基因算法評分高的患者與得分低的患者相比鳄逾,PFS明顯較差(圖3A)稻轨。

????????接下來,研究了臨床和病理指標(biāo)雕凹,包括癌癥分期(I/II期與III/IV期)和輔助治療(治療與不治療)殴俱,原發(fā)腫瘤的手術(shù)(手術(shù)與不手術(shù)),以及MSI類型(穩(wěn)定與不穩(wěn)定)枚抵,是否可以用來預(yù)測MSK隊(duì)列的PFS线欲。K-M圖與log-rank分析顯示,根據(jù)癌癥分期汽摹、治療方法和MSI類型的狀況分層的亞組之間的PFS沒有統(tǒng)計(jì)學(xué)上的顯著差異(圖3B,C,E)李丰,而根據(jù)原發(fā)腫瘤的手術(shù)狀態(tài)分層的亞組之間有小的但有統(tǒng)計(jì)學(xué)意義的差異(圖3D)。

圖3????K-M生存分析

????????作為與該算法的比較逼泣,作者研究了7-基因算法中每個(gè)單獨(dú)基因的突變狀態(tài)是否可用來預(yù)測PFS趴泌。進(jìn)行了K-M分析,比較診斷時(shí)確定的原發(fā)腫瘤中每個(gè)基因有突變型和野生型的患者的PFS拉庶。根據(jù)每個(gè)基因突變狀態(tài)分層的突變組和WT組之間的PFS沒有統(tǒng)計(jì)學(xué)上的顯著差異嗜憔。同時(shí),原發(fā)腫瘤中BRAF或APC突變的患者與這些單個(gè)基因?yàn)閃T的患者之間存在著統(tǒng)計(jì)學(xué)上的顯著差異氏仗。這些數(shù)據(jù)表明吉捶,與MSK隊(duì)列中的每個(gè)單獨(dú)基因相比,7-基因算法可能被用作預(yù)測無進(jìn)展生存期(PFS)的生物標(biāo)志物,具有更好的精確性呐舔。

????????作者進(jìn)一步進(jìn)行了點(diǎn)陣圖分析币励,以說明7-基因算法的分類分?jǐn)?shù)在MSK隊(duì)列中治療應(yīng)答和無應(yīng)答病人之間的分布。該圖顯示兩組患者之間的7-基因算法得分有統(tǒng)計(jì)學(xué)上的顯著差異(圖4)滋早。綜合來看榄审,邏輯回歸分析、Kaplan-Meier圖和點(diǎn)陣圖的結(jié)果是一致的杆麸,表明7-基因算法作為預(yù)測治療反應(yīng)的生物標(biāo)志物的準(zhǔn)確表現(xiàn)搁进。

圖4????7-基因算法作為區(qū)分患者亞群的分類器的性能的點(diǎn)陣分析

03、7-基因進(jìn)展算法用于預(yù)測治療后的進(jìn)展情況

????????為了進(jìn)一步評估7-基因算法是否可以作為獨(dú)立的預(yù)測性生物標(biāo)志物來預(yù)測首次診斷時(shí)CRC的治療反應(yīng)昔头,作者根據(jù)MSK隊(duì)列的PFS進(jìn)行了單變量和多變量的Cox比例風(fēng)險(xiǎn)回歸分析饼问。單變量分析顯示,7-基因算法對PFS的預(yù)測能力揭斧,如用風(fēng)險(xiǎn)比(HR)表示莱革,為7.5;而癌癥分期的HR值為1.3讹开,輔助治療的HR為1.1盅视,手術(shù)的HR為0.8,MSI的HR為0.7旦万。這些數(shù)據(jù)表明闹击,與其他臨床和病理指標(biāo)相比,7-基因進(jìn)展算法的HR要高得多成艘,在預(yù)測PFS方面具有統(tǒng)計(jì)學(xué)意義赏半。為了進(jìn)一步證實(shí)7-基因算法對PFS的預(yù)測價(jià)值與臨床指標(biāo)的關(guān)系,進(jìn)行了多變量的Cox分析淆两。7-基因算法作為一個(gè)獨(dú)立的生物標(biāo)志物預(yù)測PFS的HR為8.9断箫,而癌癥分期的HR為1.1,輔助治療的HR為1.1秋冰,手術(shù)的HR為0.7仲义,MSI的HR為0.6。這些結(jié)果表明剑勾,7-基因算法有很大的潛力作為PFS的預(yù)測性生物標(biāo)志物光坝。

對7基因算法和臨床病理學(xué)因素的單變量和多變量Cox回歸分析

04、7-基因進(jìn)展算法用于預(yù)測治療后的進(jìn)展情況

????????為了驗(yàn)證7-基因算法對治療后進(jìn)展的預(yù)測甥材,作者使用了一個(gè)有119名患者的TCGA隊(duì)列(圖1)。在這個(gè)隊(duì)列中性含,119名患者中有30人對治療有反應(yīng)洲赵,沒有進(jìn)展/復(fù)發(fā)。使用與MSK隊(duì)列相同的隨機(jī)森林機(jī)器學(xué)習(xí)算法,利用7個(gè)基因的突變情況叠萍,將每個(gè)患者分為無進(jìn)展的治療應(yīng)答或有進(jìn)展的治療無應(yīng)答芝发。邏輯回歸分析顯示,7-基因算法在區(qū)分應(yīng)答和無應(yīng)答患者群體方面表現(xiàn)出很高的準(zhǔn)確性苛谷,敏感性為96%辅鲸,特異性為77%,AUC為0.97(圖5A)腹殿。與在MSK隊(duì)列中觀察到的情況類似独悴,臨床和病理參數(shù),包括癌癥分期锣尉、新輔助治療刻炒、手術(shù)和MSI,在區(qū)分應(yīng)答者和非應(yīng)答者方面沒有表現(xiàn)出高的特異性和高的AUC值(圖5B自沧,C)坟奥。通過使用7-基因算法與上述所有臨床指標(biāo)相結(jié)合,進(jìn)行邏輯回歸分析拇厢。數(shù)據(jù)顯示爱谁,在TCGA隊(duì)列中,7-基因算法與所有臨床指標(biāo)一起使用孝偎,在區(qū)分治療的應(yīng)答者和非應(yīng)答者方面的表現(xiàn)仍與單獨(dú)使用7-基因算法相似(圖5D)访敌。

圖5????ROC曲線

????????為了進(jìn)一步驗(yàn)證7-基因算法作為治療反應(yīng)預(yù)測性生物標(biāo)志物的性能,使用TCGA隊(duì)列進(jìn)行了K-M分析邪媳。與使用MSK隊(duì)列觀察到的情況類似捐顷,診斷時(shí)原發(fā)腫瘤中7-基因算法得分高的患者與得分低的患者相比,其PFS明顯較差(圖6A)雨效。作者研究了臨床和病理指標(biāo)迅涮,包括癌癥分期(I/II期與III/IV期)和輔助治療(治療與不治療),是否可用于預(yù)測TCGA隊(duì)列的PFS徽龟。K-M圖與對數(shù)分析顯示叮姑,根據(jù)癌癥分期或治療方法的狀態(tài)分層的亞組之間的PFS沒有統(tǒng)計(jì)學(xué)上的顯著差異(圖6B,C)。

圖6????K-M生存分析

????????作為比較据悔,在MSK和TCGA隊(duì)列中传透,也通過K-M圖評估了算法中七個(gè)基因的突變狀態(tài)對PFS的預(yù)測能力。在這個(gè)隊(duì)列中极颓,KRAS朱盐、ERBB2、TSC2和TP53的突變對PFS沒有統(tǒng)計(jì)學(xué)意義菠隆,WT MAP2K1和MAP2K1突變患者的PFS有明顯差異兵琳。結(jié)果顯示狂秘,大多數(shù)單個(gè)基因突變沒有表現(xiàn)出統(tǒng)計(jì)學(xué)意義,無法對患者的PFS進(jìn)行分層躯肌。

????????為了進(jìn)一步驗(yàn)證7-基因算法作為TCGA隊(duì)列中治療反應(yīng)的預(yù)測性生物標(biāo)志物的性能者春,作者在TCGA驗(yàn)證隊(duì)列中進(jìn)行了單變量和多變量的Cox回歸分析。在單變量分析中清女,7-基因算法的HR所顯示的PFS的預(yù)測能力為16.9钱烟,而癌癥分期的HR為1.2,輔助治療的HR為3.0×10?7嫡丙。在多變量分析中拴袭,調(diào)整了癌癥分期和輔助療法后,7-基因算法的HR值為16.9迄沫,這與單變量分析相似稻扬。癌癥分期和輔助治療的HR值在單變量分析中也相似。有趣的是羊瘩,7-基因算法預(yù)測PFS的HR值在TCGA隊(duì)列中比在MSK隊(duì)列中高泰佳。與在MSK隊(duì)列中觀察到的情況類似,TCGA隊(duì)列中的點(diǎn)陣圖顯示尘吗,治療應(yīng)答和無應(yīng)答的7-基因算法分類得分有統(tǒng)計(jì)學(xué)上的顯著差異(圖7)逝她。這進(jìn)一步顯示了7-基因算法區(qū)分進(jìn)展期和非進(jìn)展期患者的能力。TCGA隊(duì)列的所有評估結(jié)果與MSK隊(duì)列獲得的結(jié)果一致睬捶,證實(shí)了7-基因算法在預(yù)測治療后癌癥進(jìn)展方面的高準(zhǔn)確性黔宛。

圖7????7-基因算法作為區(qū)分患者亞群的分類器的性能的點(diǎn)陣分析

05、預(yù)測mCRC患者治療反應(yīng)的7-基因算法的評估

????????在471名CRC患者中擒贸,有388名患者在MSK隊(duì)列中有轉(zhuǎn)移性疾病臀晃。在臨床實(shí)踐中,沒有預(yù)測性生物標(biāo)志物可用于預(yù)測mCRC患者的治療反應(yīng)介劫。因此徽惋,作者想研究7-基因算法是否可用于預(yù)測這388名mCRC患者的反應(yīng)。進(jìn)行了K-M圖和對數(shù)排名分析座韵,發(fā)現(xiàn)在mCRC隊(duì)列中险绘,根據(jù)7-基因算法得分分層的亞組之間的PFS存在統(tǒng)計(jì)學(xué)上的顯著差異。在診斷時(shí)原發(fā)腫瘤中7-Gene Algorithm得分高的mCRC患者與得分低的患者相比PFS明顯較差(圖8A)誉碴。與在MSK隊(duì)列總?cè)丝谥杏^察到的情況類似宦棺,通過使用病理指標(biāo)分層的亞組之間的PFS沒有統(tǒng)計(jì)學(xué)上的顯著差異,包括癌癥分期(I/II期與III/IV期)和輔助治療(治療與不治療)(圖8B黔帕,C)代咸。同時(shí),按原發(fā)腫瘤使用手術(shù)(手術(shù)與不手術(shù))和MSI類型(穩(wěn)定與不穩(wěn)定)分層的亞組之間的PFS差異很小成黄,但有統(tǒng)計(jì)學(xué)意義(圖8D侣背,E)白华。

圖8????K-M生存分析

????????為了進(jìn)一步評估7-基因算法是否可以作為一個(gè)獨(dú)立的預(yù)測性生物標(biāo)志物來預(yù)測mCRC患者在診斷場合的治療反應(yīng),作者通過使用單變量和多變量的Cox比例危險(xiǎn)回歸分析來評估7-基因算法作為mCRC患者PFS的獨(dú)立生物標(biāo)志物的預(yù)測價(jià)值贩耐。單變量分析顯示,7-基因算法對mCRC PFS的預(yù)測能力用HR表示為16.9厦取。多變量分析顯示潮太,7-基因算法對mCRC PFS的預(yù)測能力為17.6爱榔,與癌癥分期(I/II期與III/IV期)涩馆、輔助治療(治療與不治療)、原發(fā)腫瘤的手術(shù)(手術(shù)與不手術(shù))搬素、MSI類型有關(guān)霎箍。這些臨床指標(biāo)在單變量和多變量Cox分析中都沒有表現(xiàn)出作為mCRC患者PFS的預(yù)測性生物標(biāo)志物的統(tǒng)計(jì)學(xué)意義奇钞。有趣的是,7-基因算法預(yù)測mCRC患者PFS的預(yù)測HR值遠(yuǎn)遠(yuǎn)高于其在MSK隊(duì)列總?cè)巳褐械念A(yù)測HR值漂坏,這是用單變量和多變量分析確定的景埃。7-基因算法可作為一種預(yù)測性生物標(biāo)志物,在首次診斷場合對mCRC患者進(jìn)行分層和預(yù)測治療反應(yīng)顶别。

四谷徙、結(jié)論

????????作者建立并比較了7-基因算法與現(xiàn)有的臨床和組織病理學(xué)指標(biāo)來預(yù)測CRC的治療反應(yīng)。這種生物標(biāo)志物模型具有很大的優(yōu)勢驯绎,可以在大型患者群中進(jìn)一步發(fā)展和驗(yàn)證完慧。基于ML的算法的效用將對改善臨床實(shí)踐中的個(gè)性化醫(yī)療和降低CRC的死亡率有很大的好處剩失。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末屈尼,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子拴孤,更是在濱河造成了極大的恐慌脾歧,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,185評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件乞巧,死亡現(xiàn)場離奇詭異涨椒,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)绽媒,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,652評論 3 393
  • 文/潘曉璐 我一進(jìn)店門蚕冬,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人是辕,你說我怎么就攤上這事囤热。” “怎么了获三?”我有些...
    開封第一講書人閱讀 163,524評論 0 353
  • 文/不壞的土叔 我叫張陵旁蔼,是天一觀的道長锨苏。 經(jīng)常有香客問我,道長棺聊,這世上最難降的妖魔是什么伞租? 我笑而不...
    開封第一講書人閱讀 58,339評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮限佩,結(jié)果婚禮上葵诈,老公的妹妹穿的比我還像新娘。我一直安慰自己祟同,他們只是感情好作喘,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,387評論 6 391
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著晕城,像睡著了一般泞坦。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上砖顷,一...
    開封第一講書人閱讀 51,287評論 1 301
  • 那天贰锁,我揣著相機(jī)與錄音,去河邊找鬼择吊。 笑死李根,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的几睛。 我是一名探鬼主播房轿,決...
    沈念sama閱讀 40,130評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼所森!你這毒婦竟也來了囱持?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,985評論 0 275
  • 序言:老撾萬榮一對情侶失蹤焕济,失蹤者是張志新(化名)和其女友劉穎纷妆,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體晴弃,經(jīng)...
    沈念sama閱讀 45,420評論 1 313
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡掩幢,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,617評論 3 334
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了上鞠。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片际邻。...
    茶點(diǎn)故事閱讀 39,779評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖芍阎,靈堂內(nèi)的尸體忽然破棺而出世曾,到底是詐尸還是另有隱情,我是刑警寧澤谴咸,帶...
    沈念sama閱讀 35,477評論 5 345
  • 正文 年R本政府宣布轮听,位于F島的核電站骗露,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏血巍。R本人自食惡果不足惜萧锉,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,088評論 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望藻茂。 院中可真熱鬧驹暑,春花似錦、人聲如沸辨赐。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,716評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽掀序。三九已至,卻和暖如春惭婿,著一層夾襖步出監(jiān)牢的瞬間不恭,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,857評論 1 269
  • 我被黑心中介騙來泰國打工财饥, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留换吧,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,876評論 2 370
  • 正文 我出身青樓钥星,卻偏偏與公主長得像沾瓦,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子谦炒,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,700評論 2 354

推薦閱讀更多精彩內(nèi)容