今天和大家分享的是2020年4月發(fā)表在JOURNAL OF CELLULAR BIOCHEMISTRY(IF:4.237)雜志上的一篇文章《CFHR3 is a potential novel biomarker for hepatocellular carcinoma》兆龙,作者為了深入研究補體因子H相關(guān)蛋白CFHR3在肝癌中的作用催训,對TCGA來源以及ICGC來源的肝細(xì)胞癌RNA-seq數(shù)據(jù)和臨床數(shù)據(jù)進(jìn)行了全面生物信息學(xué)分析恕汇,明確了CFHR3在肝癌中的預(yù)后價值辕狰。
前言
肝細(xì)胞癌(HCC)是世界第五大最常見的惡性腫瘤,每年全球診斷出超過700,000例新病例吨述。HCC是一種異質(zhì)性疾病岖常,通常起源于肝硬化髓绽,在亞洲和非洲與乙型肝炎病毒(HBV)感染有關(guān)。外科手術(shù)的發(fā)展顯著提高了早期HCC患者的生存率叽赊,但是由于HCC病情進(jìn)展快速恋沃,大部分患者被診出時就已經(jīng)是晚期,并且只有不到30%的診出患者接受外科手術(shù)必指,總體生存率還是很低囊咏。因此,很有必要挖掘更多有利于改善治療的新靶標(biāo)塔橡。
由于缺乏對疾病機制的全面了解梅割,HCC治療方法的研究進(jìn)展緩慢。補體系統(tǒng)是先天免疫的關(guān)鍵組成部分葛家,可以促進(jìn)或抑制腫瘤發(fā)生户辞。補體因子H家族包括H因子(FH),補體因子H樣蛋白(CFHL1)和補體因子H相關(guān)蛋白1-5(CFHR1-CFHR5)癞谒。CFHR3也稱為DOWN16和FHR-3底燎,是一種補體系統(tǒng)激活的負(fù)向調(diào)節(jié)劑,在先天免疫中起著重要作用弹砚。先前的研究表明CFHR3與許多免疫系統(tǒng)疾病之間存在聯(lián)系双仍,例如非典型溶血尿毒綜合征,黃斑變性桌吃,IgA腎病和系統(tǒng)性紅斑狼瘡朱沃。但是,迄今為止茅诱,CFHR3在肝癌中的作用尚不清楚逗物。
材料與方法
1、患者數(shù)據(jù)
作者從TCGA和ICGC數(shù)據(jù)庫中下載HCC患者的臨床數(shù)據(jù)以及RNA-seq表達(dá)數(shù)據(jù)让簿,剔除了部分臨床病理數(shù)據(jù)不足或基因表達(dá)值為“ 0”的患者數(shù)據(jù)敬察。
2、統(tǒng)計分析
作者使用R(v.3.6.0)軟件進(jìn)行統(tǒng)計分析尔当。利用Wilcoxon秩和檢驗分析HCC隊列中正常組織和腫瘤之間CFHR3表達(dá)水平的差異莲祸。使用Kolmogorov-Smirnov檢驗和邏輯回歸分析CFHR3表達(dá)與臨床病理特征之間的關(guān)系蹂安。
3、生存分析
生存分析計算TCGA和ICGC隊列的總體生存(OS)锐帜,并使用Kaplan-Meier生存曲線衡量判斷準(zhǔn)確性田盈。還使用單因素和多因素Cox回歸比較CFHR3和其他臨床特征的預(yù)后價值。CFHR3表達(dá)的臨界值由所有組的中值確定缴阎。使用R軟件包“ survivalROC”允瞧,確定ROC曲線,曲線下面積(AUC)和C指數(shù)蛮拔,以評估基因?qū)φw生存的預(yù)測價值述暂。
4、ESTIMATE算法
使用R包“ESTIMATE” 計算每個隊列的ESTIMATE分?jǐn)?shù)建炫,然后將患者根據(jù)ESTIMATE分?jǐn)?shù)中位數(shù)分為高或低兩組畦韭。
5、基因集富集分析
利用GSEA2‐2.2.3以及MSigDB v6.2進(jìn)行肛跌,基于默認(rèn)的富集參數(shù)艺配,每次分析重復(fù)1000次,選取FDR< 0.25 且family‐wise error rate <0.05的基因集衍慎。
結(jié)果
1转唉、臨床病理特征
表1列出了TCGA和ICGC數(shù)據(jù)庫中患者的臨床特征。TCGA患者的59%(n = 377)和ICGC患者的41%(n = 260)均分為I稳捆,II赠法,III和IV期。TCGA隊列中有255名男性眷柔,ICGC中有192名男性期虾。在TCGA隊列中,患有I驯嘱,II镶苞,III和IV期的患者人數(shù)分別為175、87鞠评、86和5茂蚓,在ICGC隊列中分別為40、117剃幌、80和23聋涨。
2、肝癌中CFHR3表達(dá)水平
為了評估TCGA和ICGC隊列中HCC患者CFHR3的表達(dá)水平负乡,作者進(jìn)行了Wilcoxon秩和檢驗(圖1)牍白。發(fā)現(xiàn)TCGA隊列中腫瘤組織中的CFHR3表達(dá)水平遠(yuǎn)低于正常組織(P <.001;圖1A)抖棘,同時腫瘤組織中CFHR3的表達(dá)水平顯著低于癌旁組織(P <.001茂腥;圖1B)狸涌。ICGC隊列的結(jié)果與TCGA結(jié)果一致,即腫瘤組織中CFHR3的表達(dá)水平低于正常組織(P <0.001最岗;圖1C)帕胆。
作者接下來比較了兩個隊列中低分期(I&II期)和高分期(III&IV期)肝癌患者的CFHR3表達(dá)水平(圖2)。
邏輯回歸單變量分析顯示般渡,CFHR3高表達(dá)表現(xiàn)出良好的預(yù)后特征(表2)懒豹。TCGA隊列中高CFHR3表達(dá)與以下特征顯著相關(guān),如高分期(I vs III: OR = 0.6驯用,P = 0.0001)脸秽,等級(G1 vs G3:OR = 0.68,P = .003)晨汹,等級(G1 vs G4:OR =0. 68豹储,P = 0.218),T分類(T1 vs T2: OR = 0.64淘这,P = 0.0825),T分類(T1 vs T3: OR = 0.64巩剖,P = 0.0001)铝穷。在TCGA隊列中,IV期只有5例患者佳魔,并且I期和IV期之間沒有顯著差異(I vs IV曙聂,OR = 1.21,P =0 .0183)鞠鲜。結(jié)果表明宁脊,CFHR3低表達(dá)的HCC可能比CFHR3高表達(dá)的HCC預(yù)后更差。
3贤姆、CFHR3表達(dá)量作為HCC預(yù)后的價值
作者通過Kaplan–Meier曲線分析了不同分期和CFHR3不同表達(dá)量的生存率差異榆苞。結(jié)果顯示,在TCGA(P <0.0001;圖3A)和ICGC(P <0.0001;圖3D)中霞捡,CFHR3低表達(dá)的患者的生存率低于CFHR3高表達(dá)的患者坐漏。此外,在TCGA的I和II期(P <0.034碧信;圖3B)和ICGC(P =0.002赊琳;圖3E)隊列中,發(fā)現(xiàn)CFHR3高表達(dá)的患者的生存率高于CFHR3低表達(dá)的患者砰碴。CFHR3高表達(dá)的患者在TCGA隊列的第三和第四階段(P = 0.013躏筏;圖3C)和ICGC隊列的第三和第四階段(P = 0.056;圖3F),存活率更高呈枉。單變量分析還證實了CFHR3作為預(yù)后生物標(biāo)志物的可能性趁尼。如表3所示檐什,CFHR3在TCGA(P = 0.0007)和ICGC(P = 0.001)隊列中具有預(yù)后意義。與低表達(dá)患者相比弱卡,CFHR3高表達(dá)的HCC患者有更好的預(yù)后(表2)乃正。多元分析與這些結(jié)果一致(圖4)。
4婶博、CFHR3作為HCC生物標(biāo)志物的有效性研究
為了評估CFHR3作為HCC生物標(biāo)志物的有效性瓮具,作者進(jìn)一步了TCGA和ICGC隊列的ROC曲線中的Uno C指數(shù)和AUC值(圖5A和5B)。在亞組分析中凡人,CFHR3在兩個獨立隊列的所有I期名党,II期以及III期和IV期患者中均具有穩(wěn)定的AUC值(TCGA:0.66、0.63挠轴、0.62和ICGC:0.66传睹、0.73、0.63岸晦;圖5A欧啤,5B)。在TCGA和ICGC隊列中時間相關(guān)的AUC值顯示出一致的模式(圖5C和5D)启上。
為了比較AUC和C指數(shù)邢隧,作者分析了其他預(yù)后基因,包括SAC3D1冈在,AP2M1倒慧,MKI67和GPC3。利用ROC曲線評估TCGA和ICGC隊列中這些基因的預(yù)后能力(圖6A-J)包券。TCGA隊列中SAC3D1和MKI67在2年和3年內(nèi)的AUC值均大于CFHR3的AUC值纫谅。但是在CFGA3的TCGA隊列中,0.5年和5年的AUC值優(yōu)于其他基因的AUC值溅固。在ICGC隊列中付秕,CFHR3與其他基因相比顯示出更高的AUC值。此外发魄,與其他已建立的預(yù)后基因表達(dá)相比盹牧,CFHR3在TCGC和ICGC隊列中顯示出更高的C指數(shù)值(表4)±祝總之汰寓,CFHR3在肝癌患者中表現(xiàn)出良好的分類準(zhǔn)確性和預(yù)測能力。
5苹粟、ESTIMATE分析
為了探究高風(fēng)險和低風(fēng)險HCC人群在ESTIMATE有滑,免疫和基質(zhì)評分方面的差異,作者分析了TCGA和ICGC人群中CFHR3的差異表達(dá)嵌削。結(jié)果表明毛好,低危人群的ESTIMATE值望艺,免疫和基質(zhì)評分均高于高危人群(P <0.01)(圖7A和7B)。
6肌访、CFHR3與生物學(xué)通路和功能之間的關(guān)系
作者利用GSEA分析TCGA數(shù)據(jù)集找默,以明確CFHR3低表達(dá)和高表達(dá)之間的功能和生物學(xué)通路。分析表明吼驶,CFHR3低表達(dá)表型由許多關(guān)鍵通路組成惩激,并與腫瘤發(fā)生有關(guān)。高風(fēng)險組中富集了所有通路蟹演,包括細(xì)胞周期风钻,Wnt信號通路,結(jié)腸直腸癌酒请,癌癥通路骡技,Notch信號通路,VEGF信號通路和P53信號通路羞反。另外布朦,CFHR3高表達(dá)組還發(fā)現(xiàn)了補體和凝血級聯(lián)以及初級膽汁酸的生物合成這兩個通路的富集(圖8和表5)。
總結(jié)
本篇文章的作為單基因生信分析文章苟弛,主要的思路是首先利用Wilcoxon秩和檢驗分析了TCGA以及ICGC隊列中癌組織和正常組織喝滞、癌旁組織之間CFHR3的表達(dá)差異,然后利用Kaplan‐Meier生存曲線比較兩個隊列中HCC高低分期之間CFHR3的表達(dá)差異膏秫,利用單變量分析進(jìn)一步明確CFHR3的表達(dá)差異與臨床預(yù)后特征之間的相關(guān)性,這時確定了CFHR3低表達(dá)顯示較差的預(yù)后做盅。接下來缤削,通過Kaplan–Meier生存曲線分析了不同分期和CFHR3不同表達(dá)量的生存率差異,驗證CFHR3的預(yù)后價值吹榴。同時亭敢,利用ROC生存分析檢驗CFHR3預(yù)測的有效性。最后利用ESTIMATE分析和GSEA富集分析展示了CFHR3高表達(dá)和低表達(dá)之間免疫和基質(zhì)評分方面的差異以及富集通路的差異图筹。
該文章可謂完美復(fù)現(xiàn)單基因分析的思(tao)路帅刀,就是表達(dá)特征+預(yù)后價值+免疫浸潤,然后再加點功能相關(guān)的分析远剩,然后4分+文章就到手啦扣溺,是不是很心動,如果你也有感興趣的腫瘤和基因想要進(jìn)行類似的研究瓜晤,快來聯(lián)系我們吧锥余。