影響因子:7.31
關(guān)于非腫瘤生信侣肄,我們也解讀過很多
目前非腫瘤中結(jié)合熱點(diǎn)基因集,免疫浸潤醇份,機(jī)器學(xué)習(xí)稼锅,分型的分析是比較先進(jìn)的。有需要的分析的朋友歡迎交流A欧住矩距!
研究概述:
心房顫動(AF)是缺血性卒中的主要危險(xiǎn)因素,而僅憑臨床特征和神經(jīng)影像學(xué)表現(xiàn)都不能可靠地分類心源性栓塞性卒中(CE)畔濒。本研究旨在確定在心房顫動相關(guān)心源性栓塞性卒中(AF-CE)患者中具有診斷價(jià)值的新型潛在生物標(biāo)志物剩晴,區(qū)分AF-CE與其他類型缺血性卒中。
研究者對AF和CE的共同的DEGs進(jìn)行綜合分析后,使用LASSO和SVM-RFE兩種機(jī)器學(xué)習(xí)算法確定了三個(gè)診斷標(biāo)志物C1QC赞弥、VSIG4 和 CFD毅整。然后采用RT-qPCR分析了3種診斷標(biāo)志物的表達(dá)水平,發(fā)現(xiàn)水平高低可用于區(qū)分AF-CE患者與正常對照組绽左,并可有效區(qū)分AF-CE和LAA卒中悼嫉。之后使用臨床樣本驗(yàn)證結(jié)果,并使用ROC曲線分析確定這些特征標(biāo)志基因的診斷價(jià)值拼窥。最終得出C1QC戏蔑、VSIG4 和 CFD 可作為 AF-CE 的獨(dú)立因素和診斷標(biāo)準(zhǔn)。最后建立了列線圖模型鲁纠、開發(fā)了在線預(yù)測工具总棵。
研究結(jié)果:
一、差異表達(dá)基因的鑒定
1. 在與CE相關(guān)的GSE58294 (GPL570)數(shù)據(jù)集中改含,與對照組相比情龄,在中風(fēng)后三個(gè)時(shí)間點(diǎn)(<3 h(圖1a)、5 h(圖1b)和24 h(圖1c)分別篩選DEGs捍壤。同時(shí)骤视,從GSE41177中獲得13962個(gè)AF相關(guān)的DEGs (圖1d)。
2. GSE58294數(shù)據(jù)集中不同時(shí)間點(diǎn)的DEGs結(jié)果的交集有418個(gè)DEGs (圖1e)鹃觉。該交集中的DEGs交叉得到316個(gè)AF-CE基因(圖1f)专酗。
3. 將GSE58294和GSE41177數(shù)據(jù)集合并為訓(xùn)練集,移除批處理效果后使用limma包獲得13個(gè)AF-CE相關(guān)的DEGs基因(AP000525.9盗扇、POM121L9P祷肯、TIMM8A、MCEMP1粱玲、C1QC躬柬、LOC100996760拜轨、BCL2A1抽减、S100A12、VSIG4橄碾、OLAH卵沉、ANKRD22、BMX法牲、CFD)史汗,其中9個(gè)基因上調(diào),4個(gè)基因下調(diào)(圖1g)拒垃。
二停撞、功能相關(guān)分析
1. 使用Metascape在線工具進(jìn)行功能標(biāo)注。結(jié)果表明:AF-CE相關(guān)的DEGs標(biāo)志性富集于氧化應(yīng)激誘導(dǎo)的衰老、氧化應(yīng)激反應(yīng)的調(diào)控戈毒、氧化應(yīng)激反應(yīng)的調(diào)控艰猬、細(xì)胞程序性死亡、上皮細(xì)胞增殖的調(diào)控埋市、VEGFA-VEGFR2信號通路冠桃、補(bǔ)體和凝血級聯(lián)、雌激素信號通路道宅、snRNA 3’端加工食听、MHC II類蛋白復(fù)合物組裝、細(xì)胞對生長因子刺激反應(yīng)的調(diào)控污茵、肌肉結(jié)構(gòu)發(fā)育樱报、白細(xì)胞介素-12的產(chǎn)生、癌癥中的蛋白多糖泞当、水楊酸與甘氨酸的偶聯(lián)以及附肢形態(tài)發(fā)生(圖2a)肃弟。
2. DO富集分析結(jié)果顯示,AF-CE相關(guān)的DEGs主要與免疫介導(dǎo)的炎癥性疾病(肝炎零蓉、乙肝笤受、丙肝)和女性生殖系統(tǒng)疾病(女性生殖器官癌、卵巢上皮性癌敌蜂、卵巢表面惡性上皮間質(zhì)腫瘤箩兽、卵巢癌、泌尿系統(tǒng)癌)相關(guān)(圖2B)章喉。
三汗贫、利用LASSO和SVM-RFE算法選擇診斷標(biāo)記
1. 使用兩種不同的算法(LASSO和SVM-RFE)從組合訓(xùn)練集(GSE58294和GSE41177)中篩選特征基因。SVM-RFE算法結(jié)果表明秸脱,當(dāng)特征數(shù)為13落包,包含前文所述13個(gè)AF-CE相關(guān)的DEGs時(shí)分類器誤差最小(圖3a、 b)摊唇。
2. LASSO算法經(jīng)過十倍交叉驗(yàn)證咐蝇,選取10個(gè)基因,分別為AP000525.9巷查、TIMM8A有序、S100A12、LOC100996760岛请、VSIG4旭寿、C1QC、BCL2A1崇败、OLAH盅称、BMX、CFD(圖3c、 d)缩膝。
3. 最終選擇LASSO和SVM-RFE算法之間共有的7個(gè)特征基因(LOC100996760搭幻、VSIG4、C1QC逞盆、BCL2A1檀蹋、OLAH、BMX和CFD)進(jìn)一步分析(圖3e)云芦。7個(gè)特征基因的ROC分析AUC值均大于0.8俯逾,提示這7個(gè)基因可作為AF-CE患者的診斷標(biāo)志物(圖3f)。
4. 為進(jìn)一步驗(yàn)證這7個(gè)候選診斷基因的可靠性和可重復(fù)性舅逸,作者合并了兩個(gè)數(shù)據(jù)集(GSE115574和GSE14975)作為驗(yàn)證集桌肴。結(jié)果顯示,CFD (P < 0.05)琉历、VSIG4 (P < 0.01)和C1QC (P < 0.05)在AF和SR之間存在差異(圖4a坠七、b)。
5. 圖4c 的ROC分析顯示旗笔,三基因組合模型(C1QC+VSIG4+CFD)的AUC為0.794彪置,高于單個(gè)基因的AUC:C1QC(0.672),VSIG4 (0.688)蝇恶,CFD( 0.671)拳魁,組合模型具有較高的診斷價(jià)值。
6. 而動脈粥樣硬化數(shù)據(jù)集GSE20129中C1QC撮弧、VSIG4和CFD的表達(dá)無明顯差異(圖4d -f)潘懊。從上述結(jié)果來看,特征生物標(biāo)志物VSIG4贿衍、C1QC和CFD具有較高的診斷準(zhǔn)確性授舟。
四、特征生物標(biāo)志物的通路分析
為確定VSIG4贸辈,C1QC和CFD的生物學(xué)相關(guān)性释树,作者從PathCards數(shù)據(jù)庫進(jìn)行富集分析。
結(jié)果表明裙椭,候選特征生物標(biāo)志物主要富集于免疫應(yīng)答凝集素誘導(dǎo)補(bǔ)體通路躏哩、纖維蛋白凝塊形成(凝血級聯(lián)反應(yīng))、C4和C2激活劑的產(chǎn)生揉燃、先天免疫系統(tǒng)、補(bǔ)體通路筋栋、補(bǔ)體和凝血級聯(lián)炊汤、對血小板胞質(zhì)Ca升高的反應(yīng)2+和脂肪生成(圖5a)。
故認(rèn)為VSIG4,C1QC和CFD可能與AF-CE的調(diào)節(jié)細(xì)胞免疫反應(yīng)有關(guān)抢腐,而細(xì)胞免疫反應(yīng)又反過來影響AF-CE的風(fēng)險(xiǎn)姑曙。
五、免疫細(xì)胞浸潤
1. 作者計(jì)算了GSE58294數(shù)據(jù)集中患者樣本迈倍、腦卒中后<3伤靠、5和24h患者樣本與對照樣本之間免疫細(xì)胞浸潤分布的差異。
①與對照組相比啼染,AF-CE組在腦卒中后<3宴合、5、24 h中性粒細(xì)胞升高迹鹅;5 h 呈現(xiàn)M0卦洽、M2巨噬細(xì)胞升高;24 h 呈現(xiàn)T細(xì)胞γ δ和M2巨噬細(xì)胞升高斜棚。靜息樹突狀細(xì)胞在腦卒中后3 h和5 h顯著降低阀蒂。
②幼稚CD4 T細(xì)胞在腦卒中后3h較低,嗜酸性粒細(xì)胞在腦卒中后5h較低弟蚀,CD8 T細(xì)胞和靜息NK細(xì)胞在腦卒中后24小時(shí)較低蚤霞。(P 均< 0.05)
2. 對三個(gè)特征生物標(biāo)志物,發(fā)現(xiàn)CFD(圖5b)與中性粒細(xì)胞呈正相關(guān)义钉,與幼稚B細(xì)胞争便、幼稚CD4 T細(xì)胞和靜息NK細(xì)胞呈負(fù)相關(guān)。C1QC(圖5c)與中性粒細(xì)胞和靜息肥大細(xì)胞呈正相關(guān)断医,與靜息樹突狀細(xì)胞呈負(fù)相關(guān)滞乙。VSIG4(圖5d)與中性粒細(xì)胞呈正相關(guān),與中性粒細(xì)胞鉴嗤、 T濾泡輔助細(xì)胞斩启、靜息樹突狀細(xì)胞和嗜酸性粒細(xì)胞呈負(fù)相關(guān)。這些結(jié)果與通路分析的結(jié)果一致醉锅。
六兔簇、臨床樣本中診斷基因的表達(dá)
為進(jìn)一步證實(shí),作者收集53份臨床血樣(20例LAA患者硬耍,20例CE患者和13例對照)進(jìn)行qRT-PCR分析垄琐,檢測C1QC、VSIG4和CFD的表達(dá)经柴。如圖6a-c所示狸窘,與健康對照相比,CE組和LAA組C1QC和VSIG4表達(dá)明顯升高坯认,而CFD表達(dá)降低翻擒。
七氓涣、C1QC、VSIG4 和 CFD 作為潛在AF-CE 生物標(biāo)志物的評估
1. 構(gòu)建ROC曲線以評價(jià)候選診斷基因的診斷準(zhǔn)確性陋气。(AUC越接近于1劳吠,真實(shí)性越高)
對照組CT與CE患者比較結(jié)果:(95%可信區(qū)間和p值見于圖片,下同)
C1QC(圖6d)的AUC為0.7885巩趁,VSIG4(圖6e)的AUC為0.8769痒玩,CFD(圖6f)的AUC為0.8250。
2. 對照組與LAA患者比較結(jié)果:C1QC(圖6g)的AUC為0.8632议慰,VSIG4 (圖6h)的AUC為0.8423蠢古,CFD(圖6i)的AUC為0.9219。
3. CE患者與LAA患者比較結(jié)果:C1QC(圖6j)的AUC為0.7350褒脯,VSIG4(圖6k)的AUC為0.9675便瑟,CFD(圖6l)的AUC為0.7575。
4. 這些結(jié)果表明番川,C1QC到涂、VSIG4和CFD表達(dá)在區(qū)分對照組、CE和LAA患者方面具有很大的價(jià)值颁督,且對所分析的兩種腦卒中亞型具有特異性践啄。因此C1QC、VSIG4和CFD可能是AF-CE的診斷生物標(biāo)志物沉御。
八屿讽、AF-CE診斷列線圖和在線預(yù)測工具的構(gòu)建和評估
1. 基于3個(gè)診斷基因(C1QC、CFD和VSIG4)吠裆,使用“RMS”包構(gòu)建診斷AF-CE的列線圖(圖7a)伐谈。為更直觀地評估列線圖模型的臨床效果,基于決策曲線分析(DCA)生成的曲線計(jì)算了臨床影響曲線试疙。AF-CE列線圖(圖7b)具有良好的區(qū)分效果诵棵,曲線下面積AUC為0.969(95%CI:0.940-0.991)。紅色表示的高風(fēng)險(xiǎn)曲線與藍(lán)色表示的真陽性患者曲線非常接近祝旷。這表明列線圖模型能夠且可以接受準(zhǔn)確預(yù)測區(qū)別(圖7c)履澳。
2. DCA表明,C1QC+CFD+VSIG4曲線遠(yuǎn)高于灰線怀跛,這解釋了列線圖模型的高精度(圖7d)距贷。此外,還構(gòu)建了校準(zhǔn)曲線以確定列線圖模型的預(yù)測能力吻谋。AF-CE的實(shí)際風(fēng)險(xiǎn)和預(yù)測風(fēng)險(xiǎn)之間幾乎沒有差異忠蝗,表明預(yù)測AF-CE的準(zhǔn)確性很高(圖7e)。
3. 此外作者開發(fā)了一種在線預(yù)測工具用于臨床應(yīng)用滨溉,基于構(gòu)建的列線圖預(yù)測AF-CE的風(fēng)險(xiǎn)什湘。將候選診斷基因(C1QC长赞,CFD和VSIG4)的表達(dá)水平輸入在線預(yù)測工具晦攒,結(jié)果表明所有AF-CE患者測試樣本得分接近100%闽撤,而健康對照接近0%,這表明預(yù)測軟件具有較高的描繪精度脯颜。
九哟旗、臨床病理參數(shù)(包括年齡、性別栋操、TIA闸餐、心源性疾病、心悸矾芙、呼吸困難舍沙、高血壓、吸煙剔宪、左心房直徑和糖尿卜髡 )與候選疾病生物標(biāo)志物之間的相關(guān)性
1. C1QC表達(dá)與年齡>60歲、糖尿病史葱绒、高血壓史感帅、以及當(dāng)前或近期吸煙呈正相關(guān),而與患者其他臨床病理參數(shù)無相關(guān)性(P > 0.05)地淀。
2. 對于CFD的表達(dá)失球,在上述臨床病理特征均有顯著差異:糖尿病史與較低的CFD表達(dá)相關(guān),女性表達(dá)低于男性帮毁,高血壓史者表達(dá)較低实苞。(P < 0.05)
3. VSIG4表達(dá)明顯增高在高血壓史、心源性疾病史烈疚、心悸史黔牵、吸煙者、年齡> 60歲胞得、女性荧止。(P < 0.05)
研究總結(jié):
本研究首次探索了特定的基于血液的生物標(biāo)志物C1QC、VSIG4 和 CFD阶剑,可通過機(jī)器學(xué)習(xí)快速診斷AF-CE患者跃巡,這可能有助于支持治療計(jì)劃和二級預(yù)防計(jì)劃。此外牧愁,這些生物標(biāo)志物主要富集在免疫系統(tǒng)和補(bǔ)體通路中素邪,可能為進(jìn)一步研究奠定基礎(chǔ)。