影響因子:7.3
研究概述:作為血管炎的主要亞群,抗中性粒細胞胞漿抗體相關血管炎(AAV)是一種相對罕見的自身免疫性疾病谬泌,影響腎臟功能滔韵。由AAV引起的腎小球腎炎稱為ANCA相關性腎小球腎炎(ANCA-GN)。NETs(中性粒細胞胞外核外陷阱)NET可能參與AAV的發(fā)生和發(fā)展掌实。當AAV中的核染色體作為NETs從細胞的外層空間擠出時陪蜻,它可以誘發(fā)一種新型的細胞死亡,稱為NETosis贱鼻。本研究中宴卖,加權基因共表達網絡分析(WGCNA)用于識別與ANCA-GN中臨床性狀相關的模塊,與NETs相關基因相交邻悬,并識別差異表達的NETs(DE-NETs)症昏。DE-NET用于構建NETosisScore模型,該模型用于將樣本分為高風險組和低風險組父丰。探索了這些群體的基因表達肝谭、免疫微環(huán)境和生物功能。通過三種機器學習方法篩選了NETosis相關基因(NRG)蛾扇,并探索了其潛在的生物功能攘烛、免疫細胞入侵和臨床價值。QPCR在ANCA-GN患者的全血樣本中驗證了大多數NRG的差異表達镀首,為干預提供了新的見解坟漱。
目前最新的機器學習思路是使用100多種機器學習組合進行建模或者篩選關鍵基因更哄,這種方法在腫瘤中已經發(fā)表多篇1區(qū)文章芋齿,例如
**[最新1區(qū)8+純生信须眷,結合10種機器學習算法構建模型,換個腫瘤可重復沟突!]
如果這種思路在非腫瘤中使用,勢必會給文章提高檔次捕传!
研究結果:
流程圖
一惠拭、WGCNA構建和hub模塊識別
作者將兩個數據集GSE108109和GSE104948合并為一個隊列進行進一步分析,選擇了β = 9(無尺度R2 = 0.9)的軟閾值(圖2A)庸论,密切相關的模塊使用0.25的聚類高度閾值進行合并职辅,并顯示在聚類樹下方(圖2B),確定了與ANCA-GN相關的三個模塊(圖2C)聂示。這三個模塊中的基因與已知的NETs基因集相交域携,黃色模塊與NETs的交集最多(圖2E),發(fā)現黃色模塊和ANCA-GN組之間存在顯著的正相關性鱼喉。此外秀鞭,根據黃色模塊中的散點圖,GS和MM之間也發(fā)現了顯著的相關性(圖2D)扛禽。因此锋边,黃色模塊被確定為與ANCA-GN的NETosis最相關的模塊。從圖2F可以看出编曼,ANCA-GN和對照組之間的差異豆巨,最后,18個DE-NET被納入了研究掐场。
二往扔、DE-NET的功能分析
GO富集分析中,“白細胞介素-6生產的積極調節(jié)”熊户、“細胞因子生產的積極調節(jié)”和“白細胞介素-8生產的積極調節(jié)”主要富集在生物過程(BP)中萍膛,白細胞介素-8主要富集在生物過程中(BP),“分泌顆粒膜”嚷堡、“三級顆霖韵郏”和“富集ficolin?1?的顆粒”主要富集于細胞組成中(CC)麦到,而“水解酶活性主要富集在分子功能(MF)中(圖3A)绿饵。在KEGG富集分析中,“中性粒細胞胞外陷阱形成”瓶颠、“toll樣受體信號通路”和“金黃色葡萄球菌感染”主要富集(圖3B)拟赊,這表明炎癥因子產生和toll樣受體信號通路可能參與ANCA-GN中NETosis的形成。
三粹淋、NETosisScore模型的構建和驗證
基于18DE-NET的ssGSEA得分中位數構建了NETosis評分(NETosisScore)吸祟,64名患者被分為高風險和低風險組(圖4A)瑟慈。通過主成分分析(PCA)可以清楚地區(qū)分高風險和低風險群體之間的分布(圖4B)。從兩組的NETosisScore分布圖中可以看出屋匕,隨著評分的增加葛碧,高風險組的患者數量逐漸增加(圖4C)。所有DE-NET在高風險組和低風險組之間都有顯著的差異表達(圖4D)过吻。NETosisScore可以顯著區(qū)分正常對照組和ANCA-GN患者(p=2.3e-10)进泼,與正常對照組相比,ANCA-GN患者的NETosisScore更高(圖4E)纤虽;訓練集中NETosisScore的ROC曲線下的面積為0.920(p<0.001)(圖4H)乳绕。在E-MTAB-1994集(p=0.003)和GSE104954集(p=0.00017)(圖4G)中,ANCA-GN組的NETosisScore不僅在統(tǒng)計學上明顯高于對照組逼纸,而且在E-MTAB-1994集(p<0.001)中發(fā)現ROC曲線的面積為0.797(圖4I)和GSE104954集(圖4J)為0.825洋措。
四、兩種NETosisScore亞型的免疫學特征和生物途徑
作者比較了高風險組和低風險組之間的免疫細胞浸潤豐度杰刽,與低風險組相比菠发,高風險組的免疫細胞浸潤量更高。激活的CD4 T細胞贺嫂、中央CD4記憶T細胞和效應CD4記憶T細胞在兩個亞組中都有顯著的差異表達雷酪,高危組的水平較高(圖5A),NETosisScore與幾個CD4 T細胞呈正相關(圖5B)涝婉。Treg細胞在高危NETosisScore組中表現出最顯著的相關性和最高的相關系數(圖5C)哥力。
在高風險組中,主要是細胞對生物刺激墩弯、白細胞介素-6產生吩跋、白細胞遷移和吞噬作用的反應(圖5D),而在低風險組中渔工,主要是α氨基酸代謝锌钮、單羧酸分解代謝和有機酸分解代謝(圖5E)。B細胞受體信號通路引矩、細胞因子-細胞因子受體相互作用梁丘、Toll樣受體信號通路和NOD樣受體信號通路在高風險組中富集,而其他途徑旺韭,如賴氨酸降解氛谜、組氨酸代謝和脂肪酸代謝,在低風險組中更集中(圖5F)区端。
五值漫、NETosis相關基因的鑒定
作者使用SVM-RFE算法根據18個DE-NET篩選出8個基因(圖6A,B)织盼。接下來應用隨機森林樹算法來識別七個基因(圖6C杨何,D)峦睡,Lasso回歸確定了10個NRG(圖6E门烂,F)。隨后熏挎,三種機器學習算法的結果取交集作岖,最后六個重要基因被確定為ANCA-GN潛在生物標志物的NRG(CYBB安券、ITGB2金度、ITGAM并鸵、TLR2、TLR7和LILRB2)(圖6G)捌蚊。
六、NRGs的免疫特性和相互作用功能分析
使用28種免疫細胞浸潤或免疫反應來探索ANCA-GN組和對照組之間的免疫特征差異(圖7A)近弟,ANCA-GN組的CCR缅糟、巨噬細胞、T細胞抑制和TIL水平明顯高于健康對照組(圖7B)祷愉。
通過GO/KEGG富集對26個相關基因分析窗宦,富集的生物過程(BP)包括調節(jié)白細胞介素-8的產生和調節(jié)白細胞細胞介素-6的產生,以及細胞對生物刺激的反應二鳄。最富集的細胞成分(CC)是分泌顆粒膜赴涵、質膜組成部分和三級顆粒。分子功能(MF)類別富含肽結合订讼、DNA結合轉錄因子活性的正調控以及以氧為受體作用于NAD(P)H的氧化還原酶活性(圖7D)髓窜。KEGG分析顯示,toll樣受體信號通路欺殿、模式識別受體信號通路和NIK/NFκB信號通路主要富集(圖7E)寄纵。
七、線譜圖的構建和臨床腎功能分析
基于訓練集(GSE104948和GSE108109)中6個NRG(CYBB脖苏、ITGB2程拭、ITGAM、TLR2棍潘、TLR7和LILRB2)的表達水平構建了ANCA-GN的臨床診斷模型(圖8A)恃鞋。校準曲線顯示了ANCA-GN的實際風險和預測風險之間的最小差異(圖8B)。DCA表明亦歉,當DCA曲線的高風險閾值為0-1時恤浪,該模型明顯高于其他單個NRG(圖8C)。ROC曲線顯示肴楷,模型曲線(AUC)下的面積約為0.984资锰,高于任何其他單個基因的AUC(圖8D)。校準曲線阶祭、DCA曲線分析和模型ROC曲線的AUC結果與訓練數據集一致(圖8E-G)绷杜。
Spearman相關分析顯示直秆,隨著腎功能的下降,6個NRG的表達水平增加鞭盟,所有NRG都與GFR呈正相關圾结。TLR2和GFR之間發(fā)現了最強的相關性(圖8H)。所有6個NRG都與Scr水平呈負相關(圖8I)齿诉。
八筝野、NRG的獨立數據集驗證
進行獨立數據集驗證,在GSE104954(p<0.001)(圖9A)和E-MTAB-1944(p<0.001)(圖9B)中檢測到了六個NRG的差異表達粤剧。在訓練數據集中歇竟,所有NRG都表現出高水平的診斷準確性,如ROC曲線(AUC)下的區(qū)域所示抵恋,這些區(qū)域都大于0.90(圖9C-H)焕议。
九、qPCR和免疫組織化學染色
qPCR結果表明弧关,除ITGB2外盅安,與健康對照組相比,ANCA-GN患者的所有NRG都明顯過度表達世囊,ANCA-GN組和健康組之間的表達水平在統(tǒng)計學上顯著(圖10A-F)别瞭。
對ANCA-GN患者和腎透明細胞癌患者鄰近腎組織中腎組織中NRG的免疫組織化學染色(圖10G),證實NRG在ANCA-GN中明顯過度表達株憾,可能在ANCA-GN中發(fā)揮重要作用蝙寨。
研究總結:本研究通過全面的生物信息學分析系統(tǒng)地探索了ANCA-GN的潛在機制。與此同時嗤瞎,這項研究還篩選了一些關鍵基因和重要通路籽慢,這可能有助于在ANCA-GN中找到新的生物標志物或治療靶點。為了更有針對性地探索ANCA-GN的病理生理機制猫胁,還需要進一步的動物和臨床分子生物學實驗來驗證這項研究的結果箱亿。