今天跟大家分享的是2020年1月發(fā)表在CancerCell International(IF:3.439)雜志上的一篇文章Overexpression of kinesin superfamily members as prognostic biomarkers of breastcancer.在文章中作者使用來自多個數(shù)據(jù)集的數(shù)據(jù)進行了全面的生物信息學(xué)分析,來探索KIFs的預(yù)后價值以及潛在功能通路以及調(diào)控機制。
Overexpression of?kinesin superfamily members as?prognostic biomarkers of?breast?cancer過表達的肌動蛋白超家族分子作為乳腺癌預(yù)后生物標志物
https://space.bilibili.com/400148106
一.研究背景
長期以來松申,驅(qū)動蛋白超家族(KIFs)對乳腺癌的發(fā)生發(fā)展具有重大影響纬黎,但是預(yù)后價值比較差蒸眠。作者的研究旨在證明驅(qū)動蛋白超家族成員作為乳腺癌的預(yù)后生物標志物和治療靶標的價值球涛。
二.分析流程
三.結(jié)果解讀
1.乳腺癌中的KIFs表達譜
圖1a:熱圖展示了TCGA-BRCA數(shù)據(jù)中KIFs所有成員的表達情況和臨床特征。
聚類分析發(fā)現(xiàn)铃辖,大多數(shù)KIFs在腫瘤組織中過表達新思。
圖1b:TCGA-BRCA和匹配的GTEx-breast正常樣本中20個KIFs的表達情況窖梁。
KIF17,KIF26A夹囚,KIF7纵刘,KIFC3在TCGA-BRCA中的表達低于對應(yīng)正常樣本。
其余16個在TCGA-BRCA中的表達顯著高于對應(yīng)正常樣本荸哟。
圖1.驅(qū)動蛋白超家族在乳腺癌中的表達譜
2.與生存相關(guān)的KIFs的高表達預(yù)示預(yù)后較差
作者將來自GEO和METABRIC的數(shù)據(jù)相結(jié)合假哎,使用3951名患者的大型隊列探討KIFs在乳腺癌中的預(yù)后價值。
圖2a:20個失調(diào)KIFS的生存分析鞍历。
11個高表達的KIFs(KIF10舵抹,KIF11,KIF14劣砍,KIF15惧蛹,KIF18A,KIF18B秆剪,KIF20A赊淑,KIF23,KIF2C仅讽,KIF4A,KIFC1)組別的OS(總生存期)钾挟、RFS(無復(fù)發(fā)生存期)洁灵、DMFS(無遠處生存期)差。
圖2b:使用TCGA-BRCA數(shù)據(jù)集對OS和RFS進行的KIF17和KIF4A生存分析作驗證。
TCGA-BRCA中高表達的KIF17(紅線)具有更好的OS徽千,與GEO和METABRIC的數(shù)據(jù)結(jié)果一致苫费;
TCGA-BRCA中高表達的KIF4A(黑線)的OS較差,也與GEO和METABRIC的數(shù)據(jù)結(jié)果相近双抽。
圖2.乳腺癌中20種KIFs的生存分析
3.構(gòu)建基于6個KIFs的 risk score
圖3a:根據(jù)Cvfit圖百框,當選取KIF數(shù)為6個時,lambda值最小牍汹。
表明基于6個KIFs構(gòu)建的風險評分模型在準確性和簡便性方面均最佳铐维。
作者篩取了KIF10,KIF15慎菲,KIF18A嫁蛇,KIF18B,KIF20A露该,KIF4A來構(gòu)建風險評分模型睬棚。
圖3b:OS相關(guān)的11個KIFs的LASSO回歸。
依據(jù)LASSO回歸和Cvfit圖解幼,作者最后篩選KIF10抑党,KIF15,KIF18A撵摆,KIF18B新荤,KIF20A,KIF4A來構(gòu)建risk score模型台汇。
基于6-KIFs的risk scoe算法如下:
Rs = 0.30Exp(KIF10) ? 0.21Exp(KIF15) ? 0.21Exp(KIF18A) ? 0.12Exp(KIF18B) +0.02Exp(KIF20A) +0.26Exp(KIF4A)
其中苛骨,Exp(X):基因X的表達水平
圖3c:6個KIFs對應(yīng)的LASSO indexes 。
圖3d:通過KM生存分析對基于6-KIFs的風險評分進行驗證苟呐。
在TCGA-BRCA和來自GEO和METABRIC數(shù)據(jù)中痒芝,較高的風險評分的OS差。
圖3e:基于患者的基本信息牵素、病理信息严衬、臨床信息和基于6-KIFs的risk score構(gòu)建的Nomogram圖。
圖3f:使用校準圖進行驗證笆呆,來評估模型的準確性请琳。
顯示在5年和8年生存預(yù)測中均具有較好的準確性。
圖3.OS相關(guān)的KIFs的LASSO回歸和構(gòu)造的列線圖
4.乳腺癌患者KIFs的mRNA和蛋白表達上調(diào)
作者用自己的30對乳腺癌患者和正常樣本隊列數(shù)據(jù)來驗證上述基于6-KIFs構(gòu)建risk socre模型赠幕。
圖4a:與正常樣本相比俄精,6個KIFs在腫瘤樣本中均過表達。
圖4b:TCGA-BRCA和GTE-x正常兩組乳腺組織的免疫組化分析顯示榕堰,乳腺癌樣本中6個KIFs的蛋白水平顯著上調(diào)竖慧。
圖4.qRT-PCR與免疫組化
5.乳腺癌中MSX1為KIFs的轉(zhuǎn)錄因子
為了探索6個KIFs的上游調(diào)控機制嫌套,對推測的轉(zhuǎn)錄調(diào)控因子進行了生物信息學(xué)富集。
圖5a:6個KIFs和轉(zhuǎn)錄因子(NKX6.1圾旨,IRF7踱讨,PBX1,PAX2砍的,RFX1痹筛,MSX1)的相關(guān)性分析。
6個轉(zhuǎn)錄因子都與6個KIFs呈負相關(guān)廓鞠。PAX2帚稠,RFX1和MSX1顯示出更顯著的相關(guān)性。
圖5b:與配對的GTE-x正常樣品相比诫惭,TCGA-BRCA中MSX1顯著下調(diào)翁锡。
圖5c:利用GEO和METABRIC數(shù)據(jù),作生存分析夕土。
MSX1低表達組(黑線)的OS和RFS較差馆衔。
圖5.6個KIFs轉(zhuǎn)錄因子的富集
6.GO和KEGG富集分析
圖6a:upset圖展示6個KIFs的共表達基因。6個KIFs交集的229個共表達基因怨绣,用于KEGG富集分析角溃。
圖6b:KEGG富集分析顯示主要富集的通路為:“細胞周期”,“卵母細胞減數(shù)分裂”等篮撑。
圖6c-d:6個KIFs的GO分析减细。
分析發(fā)現(xiàn)這6個KIFs主要富集在“核分裂”,“DNA復(fù)制”赢笨,“染色體分離”未蝌,“有絲分裂核分裂”,“作用于DNA的催化活性”等茧妒。
圖6.6個KIFs的GO和KEGG富集分析
小結(jié)
??????作者使用來自多個數(shù)據(jù)集的數(shù)據(jù)進行了全面的生物信息學(xué)分析萧吠,來探索KIFs的預(yù)后價值以及潛在功能通路、調(diào)控機制桐筏。
首先纸型,作者在乳腺癌和正常組織之間共鑒定出20種差異表達的KIFs,其中4種下調(diào)梅忌,16種過表達狰腌。而通過KM分析顯示11種KIFs的過表達時,OS較差牧氮。然后琼腔,通過LASSO回歸生成的基于6-KIFs的risk score進行了進一步的分析,并構(gòu)建了Nomogram圖蹋笼,驗證了模型的預(yù)測效果展姐。此外躁垛,通過qRT-PCR和免疫組化方法驗證了所篩選的6種KIFs的表達譜剖毯。而且揭示了MSX1可能是潛在轉(zhuǎn)錄因子圾笨,該因子負調(diào)節(jié)乳腺癌中KIFs的表達。還進行了GO和KEGG分析逊谋,以探討KIFs在乳腺癌中的潛在功能通路擂达。
作者的這項研究一定程度上證明了KIFs成員乳腺癌的預(yù)后生物標志物和治療靶標的價值。不過胶滋,發(fā)現(xiàn)的20種顯著差異表達的KIFs板鬓,僅有KIF4A被進一步確定為與OS相關(guān)。此外究恤,MSX1調(diào)控KIFs表達的機制也幾乎無涉及俭令,這也需要進一步的研究。