Cisplatin resistance-related multi-omics differences and the establishment of machine learning models
順鉑耐藥性相關(guān)的多組學(xué)差異和機(jī)器學(xué)習(xí)模型的建立
發(fā)表期刊:J Transl Med
發(fā)表日期:2022 Apr 11
DOI:? 10.1186/s12967-022-03372-0
一、背景
????????順鉑是由M. Peyrone在1844年首次合成的景鼠,其化學(xué)結(jié)構(gòu)在1893年由Alfred Werner首次闡明仲翎。然而,該化合物直到20世紀(jì)60年代才得到充分的科學(xué)調(diào)查铛漓,當(dāng)時(shí)羅森伯格發(fā)現(xiàn)它能夠抑制大腸桿菌的細(xì)胞分裂溯香,這增加了它用于癌癥化療的可能性。1978年浓恶,順鉑成為FDA批準(zhǔn)的第一個(gè)用于癌癥治療的鉑類化合物玫坛,后來(lái)它成為最重要的抗癌藥物之一。
????????對(duì)于其藥理機(jī)制包晰,一般來(lái)說(shuō)湿镀,它們會(huì)損傷DNA,導(dǎo)致細(xì)胞周期停滯和細(xì)胞死亡伐憾,通常是通過(guò)細(xì)胞凋亡勉痴。然而,副作用和耐藥性是順鉑的兩個(gè)固有挑戰(zhàn)树肃,限制了其應(yīng)用和效果蒸矛。在許多常見的腫瘤類型中,如NSCLC胸嘴,基于鉑類的DNA損傷劑的療效是有限的雏掠,導(dǎo)致只有約三分之一的患者得到好處。
二劣像、材料與方法
1.數(shù)據(jù)來(lái)源
(1)細(xì)胞系的詳細(xì)信息從Cancer Dependency Map和CCLE下載乡话,包括IC50值、細(xì)胞系來(lái)源耳奕、體細(xì)胞突變绑青、mRNA表達(dá)、miRNA表達(dá)和代謝物
(2)從TCGA中下載了用順鉑治療的肺腺癌患者的信息(TCGA-LUAD)吮铭,以及他們的基因表達(dá)數(shù)據(jù)
(3)NSCLC A549和H358細(xì)胞來(lái)自美國(guó)類型培養(yǎng)集
2.實(shí)驗(yàn)流程
(1)差異分析:對(duì)低IC50組和高IC50組之間的體細(xì)胞突變时迫、RNA、miRNA和代謝物數(shù)據(jù)進(jìn)行了差異分析
(2)GO谓晌、KEGG和GSVA分析:研究與鉑反應(yīng)明顯相關(guān)的蛋白質(zhì)的生物學(xué)意義
(3)模型:根據(jù)LASSO的結(jié)果,采用Logistic回歸癞揉、分類和回歸樹(CART)以及C4.5決策樹分類算法纸肉,利用發(fā)生率來(lái)確定因變量的類別溺欧;使用逐步回歸法選擇變量
(4)細(xì)胞培養(yǎng)和細(xì)胞毒性試驗(yàn)、RNA干擾柏肪、RNA制備和qRT-PCR分析姐刁、Western blot分析
(5)單一腫瘤和免疫細(xì)胞:使用與先前研究中描述的相同方法來(lái)測(cè)試順鉑敏感性相關(guān)基因
三、實(shí)驗(yàn)結(jié)果
1.順鉑細(xì)胞IC50值的分組和概述
????????最終有661個(gè)細(xì)胞系入選烦味,并有完整的mRNA聂使、microRNA表達(dá)和代謝物的數(shù)據(jù)。根據(jù)CCLE數(shù)據(jù)庫(kù)給出的反映對(duì)化療藥物敏感性的IC50值谬俄,即半數(shù)抑制濃度柏靶,將它們分為3組。該值越低溃论,敏感性越強(qiáng)屎蜓。在本研究中,將前1/3(220個(gè))的低IC50值(IC50≤10.4)定義為敏感組钥勋,后1/3(220個(gè))的低IC50值(IC50≥26.2)被納入非敏感組(圖1)炬转。
????????顯然,對(duì)順鉑的耐藥性在不同的癌癥中是不同的算灸。在Depmap數(shù)據(jù)庫(kù)中扼劈,作者成功地根據(jù)癌癥來(lái)源對(duì)不同的腫瘤細(xì)胞系進(jìn)行分類,從而得到相關(guān)癌癥的順鉑的平均IC50值菲驴。圖S1顯示荐吵,有6種癌癥的平均IC50值超過(guò)100,包括肺腺癌(LUAD)谢翎、間皮瘤(MESO)捍靠、甲狀腺癌(THCA)等,這意味著這些類型的癌癥患者對(duì)順鉑這種最常見的化療藥物產(chǎn)生耐藥的可能性較大森逮。
2.體細(xì)胞突變差異
????????將體細(xì)胞突變數(shù)據(jù)與藥物敏感性數(shù)據(jù)相匹配后榨婆,研究了低IC50和高IC50組之間體細(xì)胞突變特征的差異。如圖2A和B所示褒侧,雖然兩個(gè)體細(xì)胞突變的瀑布圖和這些基因的共存集在一定程度上是相似的良风,但不難發(fā)現(xiàn),在順鉑耐藥組(高IC50)中闷供,TP53的突變排在第一位(10%)烟央,高于順鉑敏感組(低IC50組)的突變率。正如以前所報(bào)道的歪脏,TP53突變只出現(xiàn)在順鉑耐藥的腫瘤中疑俭,特別是在原發(fā)性縱隔非血清腫瘤中。因此可以得出結(jié)論婿失,TP53突變與順鉑耐藥密切相關(guān)钞艇。相反啄寡,MUT5在低IC50組有較高的突變率。作者還檢查了用"drugInteractions "功能從藥物基因相互作用數(shù)據(jù)庫(kù)中編譯的藥物-基因相互作用哩照,大多數(shù)藥物都與TTN和TP53有關(guān)挺物,這在兩組細(xì)胞中差異較小。
3.不同水平基因功能分析的差異分析
????????為了進(jìn)一步研究?jī)山M細(xì)胞之間的差異飘弧,作者從不同層面對(duì)兩組細(xì)胞系進(jìn)行了差異性分析识藤。首先,在mRNA水平次伶,發(fā)現(xiàn)1348個(gè)mRNA在兩組間有差異表達(dá)痴昧,其中順鉑耐藥組有1個(gè)下調(diào)(SLFN1),35個(gè)上調(diào)(TMEM4SB学少、CLDN3剪个、KLK6、IRF5版确、ZBTB38等)(圖3A)扣囊。同樣,在miRNA水平上绒疗,如圖3B所示侵歇,發(fā)現(xiàn)80個(gè)差異表達(dá)的miRNA,11個(gè)下調(diào)(miR-194吓蘑、miR-206惕虑、miR-215等),12個(gè)上調(diào)(miR-144磨镶、miR-16溃蔫、miR-129-3p等)。然而琳猫,對(duì)于代謝物伟叛,只有15種代謝物,如尿素脐嫂、絲氨酸统刮、肌肽、N-氨基甲酰-β-丙氨酸账千、胱硫醚等的表達(dá)在兩組之間有明顯的差異(圖3C)侥蒙。在甲基化方面,沒有一個(gè)差異甲基化位點(diǎn)與差異表達(dá)的基因密切相關(guān)(圖3D)匀奏。
????????作者首先根據(jù)CCLE數(shù)據(jù)對(duì)之前發(fā)現(xiàn)的1348個(gè)差異表達(dá)的mRNAs進(jìn)行了GO分析鞭衩。基因功能富集分析顯示,20個(gè)GO功能組在低IC50組和高IC50組之間表現(xiàn)出明顯的差異醋旦,包括肌動(dòng)蛋白結(jié)合恒水、細(xì)胞外基質(zhì)結(jié)構(gòu)成分会放、GTP酶結(jié)合饲齐、鳥嘌呤核苷酸交換因子活性等(圖5A)。對(duì)于基于這些mRNAs的KEGG(圖5B)咧最,兩組之間有10條路徑不同捂人。PI3K-Akt信號(hào)通路,差異最明顯矢沿,基因比例最高滥搭,其次是癌癥中的蛋白多糖,焦點(diǎn)粘附等捣鲸。 接下來(lái)瑟匆,為了進(jìn)一步總結(jié)通路和功能的差異,使用GSVA總共總結(jié)出643條基因通路圖(圖5C)栽惶,其中大部分與耐藥有關(guān)愁溜,包括瑞金他莫昔芬耐藥、EGFR信號(hào)24HR外厂、吉非替尼耐藥冕象、KIM-MIC擴(kuò)增靶點(diǎn)等。
4.模型構(gòu)建和評(píng)估
????????首先,應(yīng)用glmnet R軟件包幔亥,以確定DEGs與IC 50高或低有關(guān)耻讽。在1348個(gè)mRNA中選出6個(gè)FOXA2、BATF3紫谷、SIX1齐饮、HOXA1、ZBTB38笤昨、IRF5作為順鉑耐藥性的相關(guān)特征(圖4A祖驱,B),然后建立相關(guān)的logistic模型(圖4C)瞒窒。
????????接下來(lái)獲得了IC50的預(yù)測(cè)值捺僻,階梯函數(shù)被用來(lái)實(shí)現(xiàn)逐步回歸。從結(jié)果中可以發(fā)現(xiàn),6個(gè)變量中有3個(gè)通過(guò)了顯著性檢驗(yàn)匕坯,成為構(gòu)建模型的相對(duì)重要的變量束昵。雖然模型中的每個(gè)變量都通過(guò)了顯著性檢驗(yàn),但有必要確保整個(gè)模型是顯著的葛峻。因此锹雏,對(duì)該模型進(jìn)行了Chi-Squared檢驗(yàn)。隨著這些變量從第一個(gè)到最后一個(gè)逐一加入到模型中术奖,模型最終通過(guò)了顯著性檢驗(yàn)礁遵,表明由這些變量組成的模型是有意義和正確的。
????????最后采记,檢驗(yàn)了這些基因是否不僅與順鉑耐藥性有關(guān)佣耐,而且與患者的生存期也有聯(lián)系。此外唧龄,根據(jù)TCGA數(shù)據(jù)庫(kù)的數(shù)據(jù)兼砖,它們的表達(dá)水平與不同腫瘤患者的預(yù)后有一定關(guān)系,包括乳腺癌既棺、卵巢癌讽挟、肺癌和胃癌等(圖5)。事實(shí)上援制,BATF3戏挡、IRF5和ZBTB38也有助于評(píng)估乳腺癌和卵巢癌患者的化療反應(yīng)。
????????同樣地晨仑,作者建立了miRNA預(yù)測(cè)模型褐墅。從LASSO回歸中,得出4個(gè)重要的miRNA洪己,miR-203妥凳、miR-200c、miR-148a和miR-142-5p答捕。經(jīng)過(guò)階梯函數(shù)逝钥,剩下miR-203和miR-200c,它們都通過(guò)了Chi-Squared檢驗(yàn)的顯著性檢驗(yàn)拱镐,表明由這些變量組成的模型是有意義且正確的艘款。
5.BATF3、IRF5沃琅、ZBTB38的表達(dá)與A549和H358細(xì)胞及腫瘤樣本中順鉑的敏感性有關(guān)
????????為了檢驗(yàn)在細(xì)胞水平上BATF3哗咆、IRF5、ZBTB38的表達(dá)與順鉑敏感性的因果關(guān)系益眉,人類癌癥細(xì)胞系A(chǔ)549和H358(非小細(xì)胞肺癌)中分別轉(zhuǎn)染BATF3靶向晌柬、IRF5靶向和ZBTB38靶向的siRNA姥份。所有的siRNA介導(dǎo)的沉默被證明是高效的,并能維持3天或更長(zhǎng)時(shí)間年碘。與模擬沉默細(xì)胞相比澈歉,IRF5 和 ZBTB38 沉默細(xì)胞對(duì)順鉑的敏感性至少降低,而 BATF3 沉默細(xì)胞對(duì)順鉑的敏感性增加(圖6A, B)屿衅。
????????共選取6例接受完全順鉑新輔助化療的食管鱗狀細(xì)胞癌(ESCC)患者傲诵,其中新輔助化療不敏感(NACT-NON-SEN)腫瘤樣本4例凯砍,新輔助化療敏感(NACT-SEN)腫瘤樣本2例(圖7A)。采用RECIST標(biāo)準(zhǔn)評(píng)價(jià)NACT效應(yīng)的有效性拴竹。同樣,選擇了5名LUAD患者剧罩,其中3名是NACT-SEN(3名CR栓拜,1名PR),2名是NACT-NON-SEN(圖7B)惠昔。
????????在LUAD中幕与,BATF3在NACT-SEN組中顯著下調(diào),而NRAT-SEN組中IRF5镇防,ZBTB38在惡性上皮細(xì)胞簇中的表達(dá)顯著高于NACT-NON-SEN組(用EPCAM和SOX4標(biāo)記(圖7)啦鸣。在ESCC中,BATF3来氧,IRF5诫给,ZBTB38在LYZ和C1QB標(biāo)記的9801個(gè)惡性細(xì)胞中表現(xiàn)出相同的趨勢(shì)(圖7C)。
四啦扬、結(jié)論
????????體細(xì)胞突變中狂、mRNA表達(dá)、miRNA表達(dá)和代謝物的差異都與順鉑耐藥性有關(guān)扑毡。作者建立的基于BATF3胃榕、IRF5、ZBTB38三個(gè)基因表達(dá)的模型瞄摊,可以幫助預(yù)測(cè)接受鉑類藥物勋又,特別是包括順鉑在內(nèi)的化療藥物的癌癥患者的反應(yīng)和預(yù)后。