Systematic profiling of immune signatures identifies prognostic predictors in lung adenocarcinoma
在鑒別肺腺癌患者與預(yù)后相關(guān) immune signatures
發(fā)表期刊:Cellular Oncology
發(fā)表日期:2020 May 28
影響因子:5.52
DOI: 10.1007/s13402-020-00515-7
01—研究背景
世界范圍內(nèi),肺癌是死亡率較高的癌癥之一窿给,其中肺腺癌(LUAD)是主要的分子亞型苹享。盡管在過去十年中對LUAD的分子機制和臨床管理有了很大的提高阅悍,如小分子抑制劑如酪氨酸激酶抑制劑(TKIs)可顯著改善患者預(yù)后,但是通過靶向藥物治療會使患者產(chǎn)生異質(zhì)性反應(yīng)和耐藥性宾毒。盡管近年來前普,免疫治療法在癌癥治療方面取得了很大的進展,如免疫抑制性PD-1酥艳,PDL1或CTLA4等免疫檢查點抑制劑在抵抗多種惡性腫瘤取得顯著的作用摊溶,但只有少數(shù)癌癥患者從這些治療中受益。此外玖雁,獲得性免疫藥物治療的耐藥性確實存在更扁,并且這種耐藥性的機制尚不清楚盖腕,為了更好地指導(dǎo)臨床免疫治療赫冬,在這項研究中浓镜,作者識別了與免疫檢查點抑制劑相關(guān)的生物標(biāo)志物來預(yù)測患者的生存狀況并闡明耐藥性的分子機制。
02—材料和方法
數(shù)據(jù)來源----------篩選差異基因數(shù)據(jù)集:GSE10072劲厌,GSE32863膛薛、GSE43458和TCGA RNA-seq表達譜數(shù)據(jù)訓(xùn)練集:GSE68465驗證集:GSE31210,GSE50081和GSE72094數(shù)據(jù)分析方法--------
原始數(shù)據(jù)預(yù)處理:對于GEO數(shù)據(jù)集采用分位數(shù)標(biāo)準(zhǔn)化和log2轉(zhuǎn)化补鼻,對于TCGA數(shù)據(jù)集FPKM數(shù)據(jù)采用log2(FPKM+1)進行轉(zhuǎn)化哄啄。差異基因分析:t-test并使用Benjamini-Hochberg(BH)對p值進行校正識別免疫相關(guān)基因:R 程序包RankAggreg差異基因富集分析:Cytoscape插件ClueGO卻p<0.01識別預(yù)后基因:單因素Cox回歸、一千次robsurv风范、多因素Cox回歸咨跌、R程序包survival計算ROC計算免疫評分:R程序包CIBERSORT免疫組化分析:Human Protein Atlas (HPA) 網(wǎng)站
03—結(jié)果展示
1.篩選免疫相關(guān)的gene signatures從GEO數(shù)據(jù)庫和TCGA數(shù)據(jù)庫中獲得LUAD癌癥組織和正常組織mRNA表達數(shù)據(jù),4個數(shù)據(jù)集的臨床和病理特征統(tǒng)計如表1所示硼婿。表1. GEO數(shù)據(jù)集和TCGA數(shù)據(jù)集的臨床信息統(tǒng)計
CharacteristicsGSE10072(T=58, N=49)GSE32863(T=58, N=58)GSE43458(T=80, N=30)TCGA(T=56, N=56)
AgeMedian6845-877039-86NA6642-86
SexMale35 (60.3%)13 (22.4%)NA23 (41.1%)
StageI-II43 (74.1%)45 (77.6%)NA41 (73.2%)
III-IV15 (25.9%)13 (22.4%)NA15 (26.8%)
T-腫瘤锌半;N-正常從公共數(shù)據(jù)庫中提取730個與免疫相關(guān)的基因,并從4個數(shù)據(jù)集中提取這些基因的表達譜寇漫,并用熱圖展示這些基因在四個LUAD表達譜中腫瘤樣本和正常樣本中的表達情況(圖1A-D)刊殉。然后,使用t-test進行差異分析州胳,根據(jù)閾值FDR<0.05和log2|FC|>1,在GSE10072數(shù)據(jù)集共篩選出43個免疫相關(guān)的差異基因记焊,其中14個上調(diào)基因,29個下調(diào)基因栓撞;在GSE32863數(shù)據(jù)集共篩選出82個免疫相關(guān)的差異基因遍膜,其中15個上調(diào)基因67個下調(diào)基因;在GSE43458數(shù)據(jù)集共篩選出61個免疫相關(guān)的差異基因瓤湘,其中15個上調(diào)基因46個下調(diào)基因捌归;在TCGA數(shù)據(jù)集共篩選出124個免疫相關(guān)的差異基因,其中39個上調(diào)基因85個下調(diào)基因(圖1E-H)岭粤。結(jié)果表明惜索,與正常組織相比,免疫相關(guān)的基因在腫瘤組織中大多數(shù)基因表達量降低剃浇。進一步從四個數(shù)據(jù)集提取了205個與免疫相關(guān)的差異基因(圖1I)巾兆,發(fā)現(xiàn)這些下調(diào)基因的功能都參與了免疫反應(yīng)過程,最后對這些基因進行富集分析虎囚,結(jié)果顯示這些基因參與了T細(xì)胞增殖角塑、白細(xì)胞遷移,巨噬細(xì)胞活化淘讥、NF-κB和TNF信號通路等生物學(xué)途徑圃伶,這些表明了LUAD患者組織中失調(diào)的免疫相關(guān)基因是腫瘤免疫微環(huán)境變化的基礎(chǔ)(圖1K)。注解:作者在這里篩選差異基因的方法用的是T檢驗,小伙伴們可以不常見窒朋,如果要重復(fù)他的結(jié)果可以使用limma搀罢。2. 免疫組化反映(IHC)驗證基因CD36在LUAD患者中表達的差異性在四個數(shù)據(jù)集中,使用R程序包RankAggreg刪選前25個基因稱為調(diào)節(jié)異常的免疫相關(guān)基因侥猩,閾值最小的5個基因分別是MARCO榔至,CD36,LAMP3欺劳,CFD和PLA2G1B唧取。查閱相關(guān)的文獻,發(fā)現(xiàn)基因CD36在眾多癌癥起著重要的作用划提,所以選擇基因CD36枫弟,并在四個數(shù)據(jù)集中的腫瘤和正常樣品展示mRNA的表達水平(圖2A)。接下來鹏往,作者在HPA數(shù)據(jù)集中搜索CD36基因在LUAD腫瘤樣品和正常肺樣品中的蛋白質(zhì)表達水平媒区,結(jié)果顯示有三分之二的樣本顯示在正常組織中CD36高表達,在9.1%的樣本中顯示在腫瘤樣本中高表達掸犬,其中有10個LUAD患者的樣本沒有檢測到表水平(圖2B)袜漩,這與上面四個數(shù)據(jù)集mRNA的表達水平一致。此外作者還收集了43個配對的LUAD腫瘤和正常組織樣本進行IHC分析湾碎,圖2C顯示了基因CD36沒有表達宙攻、表達量低和表達量高的染色圖像。這結(jié)果與上面的結(jié)果顯示一致介褥,CD36在正常組織比腫瘤組織中表達量中高(圖2E-F)座掘。注解:作者在這里使用箱線圖展示兩組之間的差異,小伙伴們也可以使用小提琴圖進行展示柔滔。3.在LUAD數(shù)據(jù)集中構(gòu)建與預(yù)后相關(guān)的免疫gene signature從GEO數(shù)據(jù)庫中下載帶有完整預(yù)后信息的4個數(shù)據(jù)集溢陪,分別為GSE68465、GSE72094睛廊、GSE50081和GSE31210他們的臨床信息(見表2)形真,其中GSE68465作為模型構(gòu)建的訓(xùn)練集,其他三個作為模型構(gòu)建的驗證集超全。表2 構(gòu)建基因分險模型訓(xùn)練集與驗證集臨床信息統(tǒng)計
CharacteristicsGSE68465(n=436)GSE72094(n=381)GSE50081(n=127)GSE31210(n=226)
AgeMedian6533-877038-897040-866130-76
SexMale219 (50.2%)166 (43.6%)65 (51.2%)105 (46.5%)
StageI-II369 (84.6%)311 (81.6%)127 (100%)226 (100%)
III-IV67 (15.4%)70 (18.4%)0 (0.0%)0 (0.0%)
OS (days)Median1414.058321595.051744.5
(range)60-612035-207732.85-3971.2221-3863
首先咆霜,使用訓(xùn)練集攜帶的生存數(shù)據(jù),進行單變量Cox回歸分析嘶朱,共有132個免疫相關(guān)基因與患者的預(yù)后顯著相關(guān)(p<0.05)蛾坯。然后使用robust對132個免疫相關(guān)基因進一步進行降維分析,并根據(jù)cox模型中的似然函數(shù)選擇23個基因做進一步分析疏遏。最后進行多因素cox回歸分析脉课,構(gòu)建一個包含10個基因(A2M, CCL16, CCL27, IL6R, IL6ST, LY9, OAS3, PIK3CD, S100A8 and TPSAB1)的風(fēng)險免疫基因模型救军,這10個基因中有6個基因(CCL16, IL6R, IL6ST, LY9, PIK3CD 和TPSAB1)HR小于1,為保護基因倘零,4個基因(A2M, CCL27, OAS3 and S100A8)HR>1唱遭,為危險基因見表3。表3 訓(xùn)練集的robust生存分析及多元Cox分析結(jié)果
10個基因的KM曲線如圖3B-K所示视事。盡管IL6ST, LY9 和TPSAB1的表達情況不能顯著的(p>0.05)將患者分為高低分險兩組(圖3F/G/K)胆萧,但是10個基因構(gòu)建的分險預(yù)測模型能將患者分為高低分險兩組庆揩,并且高風(fēng)險組的生存時間比低風(fēng)險短俐东,且存在顯著差異(圖3L),且10個基因在2000天的ROC曲線的AUC超過了單個基因(圖M)订晌。4.驗證風(fēng)險免疫基因模型模型為了評估風(fēng)險免疫基因模型模型對其他肺腺癌數(shù)據(jù)也具有預(yù)測效率虏辫,作者使用三個獨立的數(shù)據(jù)集來驗證風(fēng)險免疫基因模型模型的魯棒性。結(jié)果顯示锈拨,10個基因模型能顯著將患者分為高低風(fēng)險兩組砌庄,且高風(fēng)險組比低風(fēng)險組存活時間短(圖4A-C),且三個驗證集在2000天具有很高AUC奕枢,且GSE72094娄昆,GSE31210和GSE50081數(shù)據(jù)集中,在2000天的AUC分別為0.69,0.72和0.74(圖4D)缝彬,說明10個免疫相關(guān)基因分險模型能夠預(yù)測不同數(shù)據(jù)集患者的生存狀態(tài)萌焰,就有廣泛的預(yù)測性能。5.免疫相關(guān)基因分險模型與臨床信息的相關(guān)性作者進一步分析了免疫相關(guān)基因分析模型與臨床變量的相關(guān)性(圖5A)谷浅,結(jié)果顯示10個免疫風(fēng)險基因表現(xiàn)出不同的表達水平扒俯。CCL27、OAS3和S100A8在腫瘤分化較低一疯、有淋巴結(jié)轉(zhuǎn)移撼玄、TNM分期晚期的男性患者中表達量較高。而IL6R墩邀、IL6ST掌猛、CCL16、A2M眉睹、TPSAB1留潦、LY9和PIK3CD在腫瘤分化較好、無淋巴結(jié)轉(zhuǎn)移辣往、TNM分期早期的女性患者中表達量較高兔院。然作者計算了免疫分險評分與患者的性別,腫瘤分化站削,腫瘤大小坊萝,淋巴細(xì)胞轉(zhuǎn)移和TNM分期的相關(guān)性。結(jié)果顯示:腫瘤分化較低、有淋巴結(jié)轉(zhuǎn)移十偶、TNM分期晚期的男性患者的分險得分要高于其他患者(圖5B-C)菩鲜。最后,將風(fēng)險得分與臨床變量因素進行多因素cox回歸分析惦积,結(jié)果顯示免疫風(fēng)險評分是LUAD患者的獨立預(yù)后因素HR為2.46(圖5D)接校。6.免疫相關(guān)基因分險模型與免疫的相關(guān)性最后,作者還分析免疫風(fēng)險得分對免疫治療的影響狮崩。首先蛛勉,作者分析了與已經(jīng)表明免疫治療密切相關(guān)的基因,并根據(jù)風(fēng)險得分的中值將患者分為高低風(fēng)險兩組睦柴,結(jié)果顯示诽凌,在所有四個GEO數(shù)據(jù)集中,高風(fēng)險組患者的PD-L1和IDO1的表達相對較高坦敌,但CTLA4侣诵、CD4、CD8A和CD8B的表達相對較低狱窘,GSE68465缺少PD-L1表達數(shù)據(jù)(圖6A-F)杜顺。這些結(jié)果為預(yù)測患者對免疫治療的反應(yīng)提供了一些線索。眾多研究表明蘸炸,腫瘤微環(huán)境與腫瘤的發(fā)生發(fā)展密切相關(guān)躬络,解開腫瘤復(fù)雜的免疫環(huán)境可能有助于揭示腫瘤難治性和免疫治療耐藥性的潛在機制。在這里幻馁,作者使用CIBERSORT工具計算每個樣本的免疫評分洗鸵,結(jié)果顯示,高風(fēng)險和低風(fēng)險LUAD患者免疫微環(huán)境存在差異性仗嗦,這些調(diào)節(jié)LUAD免疫微環(huán)境的潛在機制提供線索(圖6G-P)膘滨。
04—結(jié)果圖
?圖1.在肺腺癌患者的正常組織和腫瘤組織中篩選差異免疫相關(guān)基因?
圖2. 使用免疫組化(IHC)驗證基因CD36 在 LUAD正常組織和腫瘤組織表達的差異性。?
圖3.鑒別與免疫相關(guān)的gene signature?
圖4.外部驗證集驗證分險模型基因?
圖5.基因分險評分與臨床信息的關(guān)系?
圖6.基因分險評分與免疫評分的關(guān)系
05—結(jié)論
作者首先使用三套GEO數(shù)據(jù)加上TCGA數(shù)據(jù)稀拐,在正常組織和腫瘤組織中篩選與免疫相關(guān)的差異基因火邓,并使用免疫組化進行驗證,然后使用差異基因德撬,在一套GEO數(shù)據(jù)中構(gòu)建基因cox比例風(fēng)險回歸和rbsurv分析構(gòu)建基因模型铲咨,并在三套外部數(shù)據(jù)集進行驗證。