影響因子:8.786
研究概述:
阿爾茨海默裁馈(AD)是一種嚴重的進行性神經(jīng)退行性疾病,其特征是淀粉樣蛋白-β(Abeta)斑塊過度積累谐岁,神經(jīng)功能障礙和認知障礙醋奠。本文采用ssGSEA、LASSO回歸和WGCNA算法詳細地評估AD患者的免疫微環(huán)境模式伊佃,使用SHAP和LIME算法分析機器學習模型的結(jié)果窜司。接著使用了四個單獨的GEO數(shù)據(jù)庫進行外部驗證,并根據(jù)區(qū)分基因的表達確定了免疫微環(huán)境的不同亞型航揉。隨后使用無監(jiān)督聚類估計免疫微環(huán)境的亞組塞祈,對這些亞型之間的免疫微環(huán)境、增強功能和途徑以及治療藥物的變化進行了進一步的研究帅涂。最后织咧,使用AlzData和泛癌數(shù)據(jù)庫以及RT-PCR分析驗證了特征基因的表達。
流程圖:
研究結(jié)果:
一漠秋、免疫細胞浸潤
作者比較了組合數(shù)據(jù)集中每組28個免疫細胞亞群的富集評分差異:AD患者中B細胞浸潤率較高笙蒙,包括活化B細胞,未成熟B細胞和記憶B細胞庆锦。同時捅位,AD患者表現(xiàn)出較高的T細胞評分,包括中樞記憶CD4+T細胞、效應(yīng)記憶CD8+T細胞艇搀、自然殺傷T細胞尿扯、調(diào)節(jié)性T細胞、1型T輔助細胞和17型T輔助細胞焰雕。自然殺傷細胞衷笋,巨噬細胞,肥大細胞矩屁,MDSC辟宗,中性粒細胞和樹突狀細胞在AD患者中也有更高的細胞評分(圖2A,B)吝秕。
作者評估了GSE122063中28個免疫細胞評分的差異泊脐。結(jié)果顯示,除活化B細胞烁峭、活化CD8+T細胞容客、CD56bright自然殺傷細胞、中樞記憶CD8+T細胞约郁、γδT細胞缩挑、2型T輔助細胞外,其余22個免疫細胞富集評分在對照組和AD組之間表現(xiàn)出顯著差異(圖2C鬓梅,D)调煎。
結(jié)合以上結(jié)果副硅,作者最終在AD患者中鑒定了13種差異表達的免疫細胞蜘腌,包括中樞記憶CD4 T細胞弧岳,效應(yīng)記憶CD8 T細胞薄嫡,未成熟B細胞迹蛤,巨噬細胞氨鹏,肥大細胞争拐,MDSC粮坞,記憶B細胞艘绍,自然殺傷細胞赤拒,自然殺傷T細胞,中性粒細胞诱鞠,漿細胞樣樹突狀細胞挎挖,調(diào)節(jié)性T細胞,1型T輔助細胞和17型T輔助細胞航夺,表明浸潤免疫細胞的改變與AD病理密切相關(guān)蕉朵。
作者使用LASSO回歸算法,從上述13個免疫細胞亞群中最終確定了6個系數(shù)非零的最優(yōu)的與AD進展相關(guān)的特征性免疫細胞(漿細胞樣樹突狀細胞阳掐、17型T輔助細胞始衅、未成熟B細胞冷蚂、自然殺傷細胞、MDSC和中性粒細胞)(圖2E-G)汛闸。
二蝙茶、免疫微環(huán)境相關(guān) DEGs 的鑒定
- 根據(jù)組合數(shù)據(jù)集的表達譜進行WGCNA,確定AD患者中與上述六種特征性免疫細胞亞型相關(guān)的核心模塊诸老。根據(jù)PickSoftThreshold函數(shù)將軟閾值b設(shè)置為4時隆夯,無標度拓撲網(wǎng)絡(luò)和連通性最有效(圖3A)。通過分層聚類算法將聚類樹分為11個不同顏色的基因模塊(圖3B)别伏。
2.綠黃色模塊(986個基因)與未成熟B細胞(R=0.67)蹄衷,MDSC(R=0.72)、自然殺傷細胞(R=0.75)畸肆、中性粒細胞(R=0.34)和17型T輔助細胞(R= 0.64)的正相關(guān)性最高宦芦。而藍色模塊(2426個基因)與未成熟B細胞(R= -0.7)宙址、MDSC (R= -0.62)轴脐、自然殺傷細胞(R= -0.68)、中性粒細胞(R= -0.59)抡砂、17型T輔助細胞(R= -0.73)呈最高負相關(guān)(圖3C)大咱。
- 因此作者選擇綠黃和藍色模塊內(nèi)的基因進行進一步分析。經(jīng)過交叉最終從ImmPort和innateDB數(shù)據(jù)集中鑒定出26個由綠黃模塊相關(guān)基因注益、AD碴巾、免疫相關(guān)基因共享的免疫微環(huán)境相關(guān)的DEGs(圖3D)。此外丑搔,我們還在藍色模塊中確定了5個與免疫微環(huán)境相關(guān)的DEG(圖3E)厦瓢。
- 與這31個免疫微環(huán)境相關(guān)DEG的表達水平相比,對照組和AD組之間產(chǎn)生了獨特的免疫微環(huán)境特征啤月。AD患者的HSP90AB1和PPP3R1表達水平明顯低于非AD對照組煮仇,其余29個DEG在AD患者中的表達水平明顯高于非AD對照組(圖3F,G)谎仲,表明這些免疫微環(huán)境相關(guān)的DEGs可能與AD進展密切相關(guān)浙垫。
三、免疫微環(huán)境相關(guān)DEG的相關(guān)性和功能富集分析
- 作者根據(jù)基因表達數(shù)據(jù)描繪了31種與免疫微環(huán)境相關(guān)的DEGs相互作用的綜合景觀郑诺,并確定了4種不同的模式夹姥。這些DEGs大多數(shù)表現(xiàn)出較強的協(xié)同效應(yīng)(圖4A)。
2. 31種與免疫微環(huán)境相關(guān)的DEGs與28種免疫細胞亞群之間的相關(guān)性模式結(jié)果(圖4B)一致強調(diào)了這些免疫微環(huán)境相關(guān)的DEGs與免疫細胞顯著相關(guān)辙诞,表明免疫微環(huán)境的改變可能是促進AD進展的重要病理生理機制辙售。
- 功能富集分析顯示,這些免疫微環(huán)境相關(guān)DEGs主要富集在生物學功能上(圖4C)飞涂。KEGG富集分析表明圾亏,免疫介導(dǎo)的信號通路十拣、多種人類疾病、經(jīng)典信號通路等與這些免疫微環(huán)境相關(guān)的DEGs密切相關(guān)志鹃。(圖4D)
四夭问、機器學習模型的開發(fā)和估計
1.為了確定預(yù)測AD的最佳機器學習模型,作者將組合數(shù)據(jù)集中436個樣本(247個正常樣本和189個AD樣本)隨機分為訓練隊列(70%曹铃,N=305)和測試隊列(30%缰趋,N=131)。選取31個免疫微環(huán)境相關(guān)DEG的表達譜作為輸入變量陕见,建立XGBoost秘血、CatBoost、SVM评甜、LightGBM灰粮、LR和RF等6個機器學習模型來預(yù)測結(jié)果。
2.訓練隊列中忍坷,多個機器學習模型(準確率粘舟、AUC、召回率佩研、精度柑肴、F1、kappa和MCC)在訓練隊列中的表現(xiàn)如下圖S2A所示旬薯。LightGBM模型的準確率(0.797)晰骑、AUC(0.858)、召回率(0.736)绊序、精密度(0.792)硕舆、F1(0.759)、kappa(0.585)和MCC(0.591)最高骤公。SVM模型精密度(0.731)最低抚官,AUC(0.808)最低。
- 測試隊列中淋样,XGBoost 模型性能最佳耗式,其AUC值為0.86 (CatBoost: 0.84, SVM: 0.80, LightGBM: 0.85, LR: 0.76, RF: 0.80), P-R值為0.83 (CatBoost: 0.83, SVM: 0.77, LightGBM: 0.82, LR: 0.68, RF: 0.76)(上圖S2A-E和下圖5A-C)趁猴。
4.計算準確性刊咳、召回率、精密度儡司、F1娱挨、kappa 和 MCC后,圖5C結(jié)果顯示XGBoost模型優(yōu)于其他模型捕犬,LightGBM模型性能次之跷坝。因此酵镜,后續(xù)預(yù)測選擇XGBoost和LightGBM模型。
五柴钻、機器學習模型的全局和局部解釋
1.通過SHAP值闡明每個特征變量對預(yù)測模型的影響淮韭。基于 XGBoost 模型的 SHAP 匯總圖對特征變量的重要性排序表明贴届,對 XGBoost 模型貢獻最大的前 5 個變量是 CXCR4靠粪、PPP3R1、HSP90AB1毫蚓、CXCL10 和 S100A12(圖6A)占键。
- 采用 SHAP 依賴分析來描述單個特征變量如何影響 XGBoost 預(yù)測模型的結(jié)果(圖 6B)。特征變量的 SHAP 值越高元潘,AD 的可能性就越大畔乙。
3.LightGBM模型中最重要的5個變量與XGBoost模型中的變量一致(圖6C)。SHAP 依賴分析也用于解釋每個特征變量對 LightGBM 模型輸出的影響(圖6D)翩概。
- 圖6E-I介紹了關(guān)于影響XGBoost模型結(jié)果的前5個免疫微環(huán)境相關(guān)DEG的更詳細信息牲距。總體而言氮帐,PPP3R1和HSP90AB1的低表達水平對AD的發(fā)展有重要影響嗅虏,此外洛姑,高水平的CXCR4上沐,CXCL10和S100A12與AD進展密切相關(guān)。
采用SHAP和LIME算法楞艾,通過從測試集中抽取患者和正常人來解釋AD的個體化預(yù)測参咙。SHAP中,粗體數(shù)字對應(yīng)于概率預(yù)測(f(x))硫眯,基值表示沒有模型輸入的預(yù)測蕴侧。右側(cè)的藍色條表示正常預(yù)測,左側(cè)的粉紅色條表示 AD 概率增加的預(yù)測两入。
圖7A净宵、C分別為基于SHAP力圖和LIME算法的正常情況。
①基于XGBoost模型預(yù)測AD概率為11%裹纳。
②XGBoost模型預(yù)測增強AD發(fā)病的特征變量是:IL1R2表達1.18择葡,CXCL2表達1.01,IL4R表達1.69剃氧,TNFAIP3表達2.26敏储,C5AR1表達1.17。
③降低AD風險的特征變量包括CXCR4朋鞍,PPP3R1已添,CXCL10妥箕,GBP2和S100A12。
④XGBoost 模型是當前樣本預(yù)測結(jié)果的對照更舞,與樣本的實際結(jié)果一致畦幢。
- 圖7B、D分別為基于SHAP力圖和LIME算法的AD案例缆蝉。
①基于 XGBoost 模型的預(yù)測AD 概率為 94%呛讲。
②患者CXCR4(4.86)、NFKBIA(4.89)返奉、PPP3R1(3.00)贝搁、HSP90AB1(4.47)、IL4R(1.79)升高導(dǎo)致AD風險增加芽偏,而S100A12(1.97)雷逆、CXCL10(0.76)、IL1R2(1.92)污尉、FCER1G(0.34)膀哲、IFITM1(4.36)表達可降低AD風險。
③XGBoost模型的預(yù)期輸出是AD被碗,實際結(jié)果也是AD某宪。
- 圖7E描述了測試隊列中所有正常和AD腦組織樣本的全局解釋。
六锐朴、特征基因的選擇和驗證
基于平均SHAP值兴喂,作者交叉了XGBoost和LightGBM預(yù)測模型中的前5個特征變量,最終確定了兩模型共有的5個特征基因(CXCR4焚志,PPP3R1衣迷,HSP90AB1,CXCL10和S100A12)酱酬。
利用ROC曲線分析評估每個特征基因在內(nèi)部數(shù)據(jù)集中預(yù)測AD進展的診斷能力壶谒。
訓練集中ROC曲線的AUC值CXCR4為0.792,PPP3R1為0.713膳沽,HSP90AB1為0.678汗菜,CXCL10為0.647,S100A12為0.667(圖8A)挑社。
測試集中ROC曲線的AUC值CXCR4為0.774陨界,PPP3R1為0.697,HSP90AB1為0.687滔灶,CXCL10為0.645普碎,S100A12為0.648(圖8B)。
聯(lián)合集中ROC曲線的AUC值CXCR4為0.787录平,PPP3R1為0.707麻车,HSP90AB1為0.681缀皱,CXCL10為0.645,S100A12為0.661(圖8C)动猬。
3.另外使用三個外部驗證數(shù)據(jù)集啤斗,進一步驗證這五個特征基因的診斷效果(圖8D-F)。
通過這五個特征基因來構(gòu)建AD發(fā)展預(yù)測工具赁咙,即列線圖钮莲,每個特征變量的值與一個分數(shù)點相關(guān),將所有特征變量的得分相加得到總得分彼水,代表AD發(fā)病風險(圖8G)崔拥。
校準曲線證實了列線圖診斷AD的準確性(圖8H)。DCA顯示列線圖的臨床應(yīng)用為AD患者帶來了一定的臨床益處(圖8I)凤覆。
七链瓦、AD患者免疫微環(huán)境中的亞型的鑒定
1.為闡明AD中免疫微環(huán)境相關(guān)的表達模式,作者采用共識聚類算法盯桦,根據(jù)5個特征基因?qū)?89個AD腦組織樣本進行分組慈俯。基于結(jié)果拥峦、CDF 圖贴膘、CDF 曲線面積的相對變化和一致的聚類評分,選擇 k = 2 作為最佳值略号,將 189 名患者分為兩種不同的亞型刑峡,其中亞型 1有112 個樣本,亞型2有 77 個樣本(圖 9A–D)璃哟。
2. tSNE分析表明亞型1和2之間存在明顯差異(圖9E)氛琢。亞型之間9個特征基因的表達存在明顯的異質(zhì)性(圖9F)喊递。差異分析表明随闪,在亞型1和2之間發(fā)現(xiàn)了1055個上調(diào)和609個下調(diào)的DEG(圖S3)。
作者使用MSigDB數(shù)據(jù)庫中的基因集來描述豐富的生物功能和信號通路骚勘,并進行GSVA以估計每位患者的評分:在亞型1中铐伴,與免疫應(yīng)答相關(guān)的生物學功能高度富集,包括肥大細胞活化俏讹、免疫應(yīng)答当宴、細胞趨化性、細胞因子介導(dǎo)的信號通路和炎癥反應(yīng)(白細胞細胞遷移泽疆、趨化性和粘附)户矢;亞型2的生物學功能主要參與囊泡的轉(zhuǎn)運、代謝過程殉疼、氧化磷酸化和線粒體內(nèi)膜的組織梯浪。
與此一致捌年,亞型1富集的途徑始終與免疫應(yīng)答相關(guān),包括B細胞受體信號通路挂洛,細胞因子-細胞因子受體相互作用礼预,腸道IgA的產(chǎn)生,缺口信號通路和TGF-β信號傳導(dǎo)虏劲。而在亞型2中托酸,神經(jīng)退行性疾病和代謝相關(guān)途徑被激活。
八柒巫、免疫微環(huán)境亞型間免疫特征的鑒別
1.首先比較了每個亞型內(nèi)28個免疫細胞亞群的差異励堡。
與亞型2組相比,亞型1組患者的T細胞浸潤率更高堡掏,包括中樞記憶CD4+T細胞念秧、中樞記憶CD8+T細胞、效應(yīng)記憶CD4+T細胞布疼、自然殺傷T細胞摊趾、調(diào)節(jié)性T細胞、1型T輔助細胞和17型T輔助細胞游两。
同時砾层,包括活化B細胞、未成熟B細胞和記憶B細胞在內(nèi)的多個B細胞贱案,以及包括自然殺傷細胞肛炮、巨噬細胞、肥大細胞宝踪、MDSC侨糟、中性粒細胞在內(nèi)的先天免疫細胞在亞型1組的免疫微環(huán)境中也有較高的富集評分(圖10A,B)瘩燥。
- 關(guān)于每個亞型之間免疫特征的差異(圖10C)秕重。
在亞型1中,所有免疫共刺激基因和幾乎所有與抗原呈遞和細胞粘附相關(guān)的免疫基因都始終高表達厉膀。同時溶耘,亞型1也表現(xiàn)出免疫共抑制劑,配體服鹅,受體和其他相關(guān)基因的表達增強凳兵。
- 此外,還比較了每種免疫微環(huán)境亞型的免疫評分企软,亞型1患者的免疫評分高于其他亞型(圖10D)庐扫。結(jié)合上述結(jié)果最終將亞型1確定為免疫亞型,亞型2為代謝亞型。
九形庭、相關(guān)性分析和治療靶點預(yù)測
1.為進一步探索這5個特征基因的功能杰妓,作者利用外部數(shù)據(jù)集GSE106241(其中包括更詳細的臨床信息)來闡明這些特征基因與AD病理生物標志物之間的相關(guān)性。HSP90AB1與α分泌酶活性(R=-0.37)碘勉,β分泌酶活性(R=-0.46)和AD臨床分期(R=-0.28)呈負相關(guān)(圖11A-C)巷挥。而CXCL10與β分泌酶活性呈正相關(guān)(R=-0.46)(圖11D)。
2. PPP3R1也表現(xiàn)出與α-分泌酶(R =-0.32)验靡,β-分泌酶(R=-0.57)倍宾,γ-分泌酶(R=-0.37)和Aβ-42水平(R=-0.28)的活性負相關(guān)(圖11E-H)。
此外胜嗓,圖11I描述了有關(guān)這五個特征基因的其他信息高职,例如蛋白質(zhì)-蛋白質(zhì)相互作用,預(yù)測轉(zhuǎn)錄因子辞州,miRNA和針對這五個特征基因的多種藥物怔锌。最后使用CMap探索靶向免疫亞型1和代謝亞型2的潛在治療藥物。
小分子化合物的CMap評分越低变过,它就越有可能具有治療疾病的能力埃元。MK-866、花生四烯基三氟甲烷媚狰、TTNPB岛杀、伏立諾他和 STOCKIN-3584 是亞型 1 中 CMap 評分最低的前五種小分子化合物(圖 11J),而 TTNPB崭孤、Butein类嗤、PHA-00816795和 STOCKIN-3584 是代謝亞型 2 相關(guān)的小分子化合物(圖 11K)。亞型1和亞型2共享三種常見的小分子化合物辨宠,包括花生四烯基三氟甲烷遗锣,TTNPB和STOCKIN-3584。CMap評分表明嗤形,MK-866和花生四烯基三氟甲烷分別是靶向免疫亞型1和代謝亞型2的最佳治療藥物精偿。
十、特征基因差異表達的外部驗證
1.利用在線工具AlzData數(shù)據(jù)庫派殷,與正常對照組相比还最,AD患者海馬體和皮質(zhì)組織中CXCR4的表達顯著增加,而HSP90AB1和PPP3R1的表達明顯降低毡惜。
2.在AD患者的顳葉皮層和額葉皮層中也觀察到CXCL10表達的顯著增加。但正常人與AD患者在不同大腦區(qū)域中S100A12的表達差異并不顯著(圖12A-E)斯撮。
3.在20種癌癥類型和相鄰正常組織之間進行泛癌分析经伙,CXCR4、PPP3R1、HSP90AB1帕膜、CXCL10和S100A12的表達水平在多種類型的癌組織中顯著升高(圖12F)枣氧。
4.在與33種癌癥類型的患者生存顯著相關(guān)的特征基因中,所有特征基因都與至少三種癌癥類型的患者的總生存期密切相關(guān)(圖12G)垮刹。
- 最后進行RT-PCR分析驗證這5個特征性免疫微環(huán)境相關(guān)基因的表達譜达吞。與腦組織樣本數(shù)據(jù)集的結(jié)果類似,CXCR4荒典、CXCL100和S100A12在AD皮質(zhì)神經(jīng)元中的表達水平明顯更高酪劫,而HSP1AB3和PPP1R12基因表達顯著下調(diào)(圖12H)。
研究總結(jié):
本研究解釋了免疫微環(huán)境狀態(tài)與AD發(fā)病機制之間的緊密關(guān)系寺董。作者從六種中選擇兩種較優(yōu)的機器學習方法覆糟,LightGBM和XGBoost,使用SHAP和LIME算法解釋機器學習模型遮咖,鑒定出5個免疫微環(huán)境相關(guān)的特征基因(CXCR4滩字,PPP3R1,HSP90AB1御吞,CXCL10和S100A12)麦箍,這些基因與AD病理生物標志物密切相關(guān),能夠可靠地預(yù)測AD的進程陶珠。
此外内列,基于這些特征差異基因,本文為AD提出了一個全新的分子分類背率,包括免疫和代謝亞型话瞧。每種亞型都顯示出不同的富集功能和途徑、免疫細胞浸潤寝姿、免疫學特征和治療藥物交排。這些結(jié)果為腦組織中免疫微環(huán)境與AD患者預(yù)后和分類之間的關(guān)系提供了新的視角。