摘要
背景:急性骨髓性白血病(AML)是一種異質(zhì)性疾病两嘴,具有復(fù)發(fā)性基因突變和與疾病相關(guān)的基因表達(dá)中的變異晰甚,可能對(duì)預(yù)后預(yù)測(cè)有用捕发。
方法:從GEO,TCGA和TARGET數(shù)據(jù)庫(kù)下載AML的數(shù)據(jù)贰军。通過(guò)LASSO分析鑒定預(yù)后代謝基因以建立代謝模型。通過(guò)與時(shí)間有關(guān)的接收器工作特性曲線和曲線下面積(AUC)量化模型的預(yù)后準(zhǔn)確性。生存分析通過(guò)對(duì)數(shù)秩檢驗(yàn)進(jìn)行制肮。通過(guò)基因集富集分析(GSEA)評(píng)估了不同代謝風(fēng)險(xiǎn)狀態(tài)下的富集途徑。
結(jié)果:我們鑒定了九個(gè)基因递沪,以構(gòu)建高危與低危組中較短生存期的預(yù)后模型豺鼻。該預(yù)后模型顯示出良好的預(yù)測(cè)效果,在訓(xùn)練款慨,成人外部和小兒外部隊(duì)列中儒飒,AUC的5年總生存率分別為0.78(0.73-0.83),0.76(0.62-0.89)和0.66(0.57-0.75)檩奠。多變量分析表明桩了,在訓(xùn)練,成人外部和兒童外部隊(duì)列中埠戳,代謝特征具有獨(dú)立的預(yù)后價(jià)值井誉,危險(xiǎn)比分別為2.75(2.06-3.66),1.89(1.09-3.29)和1.96(1.00-3.84)整胃。與經(jīng)典預(yù)后因素的預(yù)測(cè)相比颗圣,將代謝特征和經(jīng)典預(yù)后因素相結(jié)合可改善5年總生存期預(yù)測(cè)(p<0.05)。GSEA揭示大多數(shù)途徑與代謝相關(guān),表明潛在的機(jī)制在岂。
結(jié)論:我們發(fā)現(xiàn)了AML中代謝功能異常荚藻,并建立了預(yù)測(cè)AML患者生存的預(yù)后模型。
方法
數(shù)據(jù)集和數(shù)據(jù)收集
從相應(yīng)的數(shù)據(jù)集中檢索并下載了三個(gè)AML隊(duì)列的基因表達(dá)譜洁段。從GEO數(shù)據(jù)庫(kù)(http://www.ncbi.nlm.nih.gov/geo/)下載GSE37642(16)數(shù)據(jù)集的原始微陣列數(shù)據(jù)应狱,并在不同陣列之間進(jìn)行了標(biāo)準(zhǔn)化。來(lái)自TCGA-LAML數(shù)據(jù)集和TARGET-AML數(shù)據(jù)集的RNA-seq數(shù)據(jù)可從UCSX Xena網(wǎng)站(https://xenabrowser.net/datapages/)
代謝基因集的構(gòu)建和驗(yàn)證
該GSE37642數(shù)據(jù)集用作訓(xùn)練隊(duì)列以構(gòu)建代謝風(fēng)險(xiǎn)模型祠丝。TCGA-LAML和TARGET-AML數(shù)據(jù)集分別用作成人和兒童AML驗(yàn)證隊(duì)列疾呻。根據(jù)訓(xùn)練隊(duì)列中確定的統(tǒng)一公式為每個(gè)患者生成代謝風(fēng)險(xiǎn)評(píng)分。根據(jù)survminer軟件包確定的最佳代謝風(fēng)險(xiǎn)評(píng)分標(biāo)準(zhǔn)写半,將患者進(jìn)一步分為高危和低危組岸蜗。
GSEA
使用GSEA v4.0.2軟件(http://software.broadinstitute.org/gsea/login.jsp)來(lái)鑒定潛在的生物學(xué)途徑,并使用c2.cp.kegg.v7.0比較高代謝風(fēng)險(xiǎn)組和低代謝風(fēng)險(xiǎn)組.symbols基因集叠蝇。使用來(lái)自c2.cp.kegg.v7.0.symbols的代謝途徑相關(guān)基因集為GSE37642數(shù)據(jù)集生成了代謝特征璃岳。僅包括驗(yàn)證隊(duì)列以進(jìn)行豐富的途徑分析。標(biāo)稱(chēng)p <0.05被認(rèn)為具有統(tǒng)計(jì)學(xué)意義悔捶×蹇叮基因云生物技術(shù)信息(GCBI)和cytoscape 3.7.2用于探索模型相關(guān)的代謝蛋白與其他已知相關(guān)蛋白之間的相互作用。
統(tǒng)計(jì)分析
繪制了隨時(shí)間變化的接收器操作特征(ROC)曲線蜕该,以評(píng)估三個(gè)隊(duì)列中代謝信號(hào)的預(yù)測(cè)性能犁柜。使用生存ROC軟件包計(jì)算ROC曲線下的面積(AUC)√玫總生存期(OS)定義為主要結(jié)局馋缅,并計(jì)算為診斷或研究因任何原因死亡的日期。使用“生存”軟件包繪制Kaplan–Meier曲線绢淀,并使用對(duì)數(shù)秩檢驗(yàn)進(jìn)行比較萤悴。通過(guò)單變量和多變量Cox分析探討了臨床和遺傳信息對(duì)預(yù)后的影響。諾模圖用于可視化和整合OS的代謝特征和經(jīng)典獨(dú)立危險(xiǎn)因素皆的,年齡和遺傳風(fēng)險(xiǎn)評(píng)分覆履,并通過(guò)校準(zhǔn)評(píng)估其一致性。AUC用于評(píng)估和比較候選因素的預(yù)后價(jià)值祭务。所有統(tǒng)計(jì)分析均使用R軟件(版本3.6.0)和SPSS 24.0版軟件(SPSS内狗,Inc.,美國(guó)伊利諾伊州芝加哥)進(jìn)行义锥。p <0·05被認(rèn)為具有統(tǒng)計(jì)學(xué)意義。