雜志:Frontiers in Immunology
**影響因子: **7
研究概述:
骨關(guān)節(jié)炎(OA)是最普遍的關(guān)節(jié)疾病。線粒體功能障礙與 OA 的發(fā)病機(jī)制有關(guān)潦匈。該研究的主要目的是揭示線粒體在驅(qū)動(dòng) OA 發(fā)展的機(jī)制中的關(guān)鍵作用阱高。作者從GEO數(shù)據(jù)庫中獲得了7個(gè)批量RNA-seq數(shù)據(jù)集,并分析了OA中與線粒體相關(guān)的差異表達(dá)基因的表達(dá)水平茬缩,隨后利用單樣本基因集富集分析(ssGSEA)赤惊、基因集富集分析(GSEA)和加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析(WGCNA)分析來探索與這些基因相關(guān)的功能機(jī)制。作者利用七種機(jī)器學(xué)習(xí)算法來識(shí)別中心線粒體相關(guān)基因并開發(fā)預(yù)測(cè)模型凰锡,鑒定出9個(gè)樞紐線粒體相關(guān)基因未舟。進(jìn)一步的分析包括通路富集、免疫浸潤掂为、基因-疾病關(guān)系發(fā)現(xiàn)這些基因主要與巨噬細(xì)胞有關(guān)处面。無監(jiān)督共識(shí)聚類確定了兩種線粒體相關(guān)的OA亞型,它們主要與代謝相關(guān)菩掏。單細(xì)胞分析表明魂角,它們均在單細(xì)胞中表達(dá),并隨細(xì)胞分化而變化智绸。最后通過RT-PCR實(shí)驗(yàn)驗(yàn)證野揪,樞紐基因在OA中均有顯著表達(dá)访忿。
研究結(jié)果:
篩選OA中與線粒體相關(guān)的差異基因
作者整合了7個(gè)RNA-seq數(shù)據(jù),在消除批次效應(yīng)后進(jìn)行差異分析斯稳,篩選到245個(gè)線粒體相關(guān)差異基因(DEG)海铆,以DEG進(jìn)行ssGESA富集評(píng)分,發(fā)現(xiàn)OA中線粒體活性顯著降低挣惰。GSEA分析進(jìn)一步驗(yàn)證了這一點(diǎn)(圖1E)卧斟。富集分析顯示,線粒體相關(guān)DEGs在磷酸核糖代謝過程憎茂、線粒體基因表達(dá)乌庶、線粒體轉(zhuǎn)運(yùn)等過程中顯著富集(圖1F)贝或。WGCNA分析表明,黑色模塊與線粒體評(píng)分之間存在顯著相關(guān)性(圖1G)。圖 1H 顯示了黑色模塊中每個(gè)基因的模塊隸屬關(guān)系 (MM) 和基因顯著性 (GS)魄藕。黑色模塊中基因的BP 和 KEGG 分析均顯示星压,在細(xì)胞因子介導(dǎo)的信號(hào)通路缩搅、細(xì)胞粘附的正調(diào)控等過程中凌埂,黑色模塊中的基因顯著富集(圖 1I)。黑色模塊中基因的蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)如圖 1J 所示馋评。
機(jī)器學(xué)習(xí)識(shí)別中心線粒體相關(guān) DEG
作者使用七種機(jī)器學(xué)習(xí)算法來獨(dú)立識(shí)別前30個(gè)線粒體相關(guān)的DEGs(圖2A-H)放接,隨后,以上七個(gè)機(jī)器學(xué)習(xí)結(jié)果取交集留特,產(chǎn)生了九個(gè)與中心線粒體相關(guān)的 DEG透乾,即 SLC25A37、MTHFD2磕秤、SIRT4乳乌、DNAJC15、ETFDH市咆、PDK4汉操、CARS2、FKBP8 和 NFS1(圖 2I)蒙兰。熱圖顯示了OA和對(duì)照樣品中SLC25A37磷瘤、MTHFD2、SIRT4搜变、DNAJC15采缚、ETFDH、PDK4挠他、CARS2扳抽、FKBP8和NFS1的表達(dá)模式(圖2J)。箱形圖說明了這些基因在OA和對(duì)照樣品中的表達(dá)水平(圖2K)。這些基因的相關(guān)性和蛋白質(zhì)-蛋白質(zhì)相互作用信息分別顯示在圖2L和M中贸呢。功能相似性分析顯示镰烧,PDK1在這些基因中占有重要地位(圖2N)。這些基因的染色體位置如圖2O所示楞陷。
諾瓦圖和神經(jīng)網(wǎng)絡(luò)模型構(gòu)建
在前面七個(gè)機(jī)器學(xué)習(xí)模型中怔鳖,作者發(fā)現(xiàn)隨機(jī)森林模型表現(xiàn)出最高的AUC值(圖3A)和良好的靈敏度和特異性(圖3B)。隨機(jī)森林模型的AUC為0.968(圖3C)固蛾,表明其能夠準(zhǔn)確識(shí)別OA患者结执。內(nèi)部驗(yàn)證進(jìn)一步證實(shí)了模型的可靠性(圖3D)。作者還依據(jù)模型構(gòu)建了特征評(píng)分諾瓦圖(圖3E)艾凯。校準(zhǔn)曲線驗(yàn)證了諾瓦圖在診斷OA中的準(zhǔn)確性(圖3F)献幔。決策曲線分析(DCA)表明,諾瓦圖在臨床應(yīng)用中為OA患者提供了一定的益處(圖3G)览芳。在構(gòu)建神經(jīng)網(wǎng)絡(luò)模型期間,圖 3H 顯示了 100 次訓(xùn)練迭代中每一次的準(zhǔn)確率和損失率鸿竖。如Kappa檢驗(yàn)(圖3I)所示沧竟,混淆矩陣表現(xiàn)出良好的一致性。圖 3J 顯示了預(yù)測(cè)結(jié)果和實(shí)際結(jié)果之間的比較缚忧。神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)如圖 3K 所示悟泵。該模型的AUC為0.961,顯示出高診斷性能(圖3L)闪水。
樞紐線粒體相關(guān)DEGs的富集分析
除SLC25A37外糕非,MTHFD2、SIRT4球榆、DNAJC15朽肥、ETFDH、PDK4持钉、CARS2衡招、FKBP8和NFS1在線粒體通路中均被顯著激活(圖4A)。圖4B提供了使用KEGG通路基因集作為中心線粒體相關(guān)DEGs的背景基因集時(shí)顯示出顯著富集的前六條通路的詳細(xì)信息每强。圖 4C 說明了中心線粒體相關(guān) DEG 與標(biāo)志性通路基因集之間的相關(guān)性始腾。
免疫浸潤分析
圖5A中的熱圖描繪了中心線粒體相關(guān)DEGs與免疫細(xì)胞之間的相關(guān)性。在散點(diǎn)圖中顯示了具有顯著相關(guān)性的后續(xù)結(jié)果選擇空执,提供了每個(gè)中心線粒體相關(guān)DEG與單個(gè)免疫細(xì)胞之間相關(guān)性的詳細(xì)可視化(圖5B)浪箭。圖5C則是揭示了中心線粒體相關(guān)DEGs與免疫相關(guān)基因之間的相關(guān)性。
基因-疾病網(wǎng)絡(luò)和mRNA-miRNA網(wǎng)絡(luò)構(gòu)建
通過分析基因與疾病之間的關(guān)聯(lián)辨绊,作者構(gòu)建了一個(gè)基因-疾病網(wǎng)絡(luò)(圖6A)奶栖。對(duì)于樞紐線粒體相關(guān)的DEGs,作者選擇了五個(gè)包含最大數(shù)量的miRNA的數(shù)據(jù)庫(圖6B),并成功構(gòu)建了mRNA-miRNA網(wǎng)絡(luò)(圖6C)驼抹。
樞紐線粒體相關(guān)基因的GWAS分析
通過對(duì)GWAS數(shù)據(jù)的分析桑孩,作者確定了OA中八個(gè)中心線粒體相關(guān)基因的疾病相關(guān)區(qū)域(圖7A,B)框冀。該圖還顯示了對(duì)應(yīng)于 CARS2流椒、DNAJC15、ETFDH明也、FKBP8宣虾、MTHFD2、NFS1温数、PDK4绣硝、SIRT4 和 SLC25A37 的單核苷酸多態(tài)性 (SNP) 疾病相關(guān)區(qū)域(圖 7C-K)。
共識(shí)聚類分析
作者根據(jù)中心線粒體相關(guān)的DEGs對(duì)OA樣本進(jìn)行了共識(shí)聚類分析(圖8A-D)撑刺,可將OA樣本劃分為兩個(gè)不同的亞型鹉胖。 在亞型 1 中,CD8 T 細(xì)胞的表達(dá)顯著降低够傍,而 M0 巨噬細(xì)胞的表達(dá)顯著升高(圖 8E)甫菠。藥物分析顯示,STOCK1N.35696冕屯、fasudil寂诱、MK.886和X4.5.dianilinophthalimide是治療亞型1患者的前五大潛在藥物(圖8F),而氯貝特安聘、MS.275痰洒、NU.1025、伊馬替尼和butein是治療亞型2患者的前五大適用藥物(圖8G)浴韭。圖8H和8I分別說明了亞型中涉及的一些生物過程和KEGG通路丘喻。文章圖9則是對(duì)不同亞型進(jìn)行了蛋白通路分析。
WGCNA亞型分析
利用亞型 1 和亞型 2 的信息念颈,作者進(jìn)行了 WGCNA 分析(圖 9A-B)仓犬。在這些模塊中,藍(lán)色模塊與亞型的相關(guān)性最強(qiáng)(圖9C)舍肠。模塊間的相關(guān)性如圖 9D 所示搀继。模塊性狀分析集中在藍(lán)色模塊上,顯示了該模塊內(nèi)基因的MM和GS分布(圖9E)翠语。圖10F則是對(duì)藍(lán)色模塊中基因進(jìn)行了GO和KEGG富集分析叽躯。此外作者還利用人體組織表達(dá)圖譜-Harmonizome數(shù)據(jù)庫分析了中樞線粒體相關(guān)基因的表達(dá)情況(見文章圖11)。
單細(xì)胞數(shù)據(jù)以及實(shí)驗(yàn)檢測(cè)中樞線粒體相關(guān)基因的分布和表達(dá)情況
圖10A描繪了OA中不同細(xì)胞類型中樞紐線粒體相關(guān)基因的分布和表達(dá)情況肌括。在細(xì)胞分化過程中点骑,SIRT4酣难、DNAJC15、NFS1黑滴、FKBP8憨募、SLC25A37、CARS2袁辈、MTHFD2菜谣、ETFDH和PDK4的表達(dá)模式發(fā)生了變化(圖10B)。最后作者構(gòu)建了人軟骨細(xì)胞驗(yàn)證模型晚缩,利用RT-PCR分別檢測(cè)了正常情況下和炎癥中所篩選的中樞紐線粒體相關(guān)基因的表達(dá)情況(見文章圖13)尾膊。
研究總結(jié)
在這項(xiàng)研究中,作者系統(tǒng)地分析了OA中與線粒體代謝相關(guān)的基因荞彼。通過差異表達(dá)分析冈敛,鑒定出一組與線粒體代謝相關(guān)的差異表達(dá)基因。使用7種機(jī)器學(xué)習(xí)算法鸣皂,確定了9個(gè)中樞線粒體代謝相關(guān)基因抓谴。 基于以上九個(gè)基因,作者進(jìn)一步分析了他們與標(biāo)志信號(hào)通路寞缝,免疫細(xì)胞癌压,疾病,之間的相關(guān)性第租,探討了它們的單核苷酸多態(tài)性措拇,篩選了基因相關(guān)的miRNA我纪,檢測(cè)了這些基因的表達(dá)和分布情況慎宾。 此外,作者還依據(jù)樞紐基因進(jìn)行共識(shí)聚類浅悉,將OA分類為兩個(gè)亞型趟据,并預(yù)測(cè)了兩個(gè)亞型各自適合的潛在藥物。這篇文章是各種分析手段的集合术健,可以幫助生信入門小白加強(qiáng)對(duì)于一些基本分析手段目的和在線數(shù)據(jù)庫的認(rèn)識(shí)汹碱。