DNA methylation predicts the outcome of COVID-19 patients with acute respiratory distress syndrome
DNA甲基化可預(yù)測COVID-19急性呼吸窘迫綜合征患者的結(jié)局
發(fā)表期刊:J Transl Med
發(fā)表日期:2022 Nov 12
影響因子:8.440
DOI:? 10.1186/s12967-022-03737-5
一、研究背景
????????COVID-19是一種新型冠狀病毒膀捷,于2019年底在中國武漢首次發(fā)現(xiàn)线得,2020年3月被世界衛(wèi)生組織(WHO)宣布為大流行病即彪。兩年后,檢測到幾個變種黔州,有超過500萬例死亡記錄姨涡。嚴(yán)重的COVID-19感染患者常常出現(xiàn)呼吸衰竭础爬,可能需要機(jī)械通氣,與高達(dá)50%的死亡率有關(guān)马靠。已經(jīng)確定了危重病人結(jié)局的幾個預(yù)測因素奄抽。它們主要包括臨床變量、生化標(biāo)志物和并發(fā)癥甩鳄。感染期間逞度,宿主細(xì)胞的DNA甲基化可以被改變,從而調(diào)節(jié)免疫反應(yīng)妙啃。
????????表觀遺傳學(xué)指的是研究不依賴DNA序列的基因活動調(diào)節(jié)和表達(dá)變化第晰。DNA甲基化是表觀遺傳學(xué)的標(biāo)志之一,涉及到在胞嘧啶環(huán)的5′碳上共價添加一個甲基。甲基化與基因表達(dá)呈反比關(guān)系茁瘦。
二品抽、材料與方法
1、數(shù)據(jù)來源
在四個時間點(T)進(jìn)行隨訪:第7天(T2)甜熔、第14天(T3)圆恤、第21天(T4)和第60天(后T4)
2、分析流程
1) PBMCs分離和DNA提取
2) EPIC850甲基化質(zhì)量控制腔稀、數(shù)據(jù)過濾和歸一化
3) 免疫細(xì)胞種群的估計:R中的FlowSorted Blood EPIC包被用來估計來自歸一化甲基化數(shù)據(jù)的細(xì)胞類型組成盆昙,包括T淋巴細(xì)胞(CD4 +和CD8 +)、B細(xì)胞(CD19 +)和單核細(xì)胞(CD14 +)焊虏、NK細(xì)胞(CD56 +)以及中性粒細(xì)胞淡喜;使用R中broom包中的lm和glance函數(shù),確定了確定免疫細(xì)胞比例之間差異的準(zhǔn)確模型
4) 甲基化分析和組間比較
5) 預(yù)測結(jié)果:對CpGs進(jìn)行單變量Cox比例風(fēng)險分析诵闭,以確定與患者生存有關(guān)的甲基化位點炼团;使用R中的生存包,用K-M分析來估計兩組基因的生存差異疏尿,通過cox比例風(fēng)險模型來估計兩組之間的差異瘟芝;使用pROC軟件包對甲基化被用于預(yù)測生存的邏輯回歸模型進(jìn)行ROC分析
三、實驗結(jié)果
01 - 入院時COVID-19患者與對照組之間的甲基化差異
????????作者首先進(jìn)行了PCA分析褥琐,以確定數(shù)據(jù)集中是否存在人群分層的情況锌俱。主成分1(PC1)解釋了13.5%的變異。相比之下敌呈,PCA 2解釋了9.3%的變異贸宏,沒有觀察到與COVID-19或?qū)φ战M參與者或種族有關(guān)的人群結(jié)構(gòu)化。
????????在COVID-19中磕洪,免疫細(xì)胞的比例經(jīng)常是可變的吭练;因此,進(jìn)行去卷積法褐鸥,根據(jù)過濾和歸一化的數(shù)據(jù)估計每個樣本中免疫細(xì)胞的比例线脚。使用線性模型,隨后尋找在組間有明顯差異的細(xì)胞比例叫榕』虢模基于AIC的最佳模型,CD8 T細(xì)胞晰绎、CD4 T細(xì)胞和B細(xì)胞在COVID-19患者和對照組之間存在明顯差異寓落。與對照組相比,COVID-19患者的CD8和CD4 T細(xì)胞明顯降低荞下,B細(xì)胞明顯升高(圖2A)伶选。
????????為了研究CpG甲基化水平的變化是否與COVID-19感染有關(guān)史飞,首先通過測試臨床協(xié)變量和免疫細(xì)胞比例,建立了最佳線性模型仰税。共測試了11個不同的模型构资,根據(jù)AIC標(biāo)準(zhǔn),三種免疫細(xì)胞類型(CD8 T細(xì)胞陨簇、CD4 T細(xì)胞和B細(xì)胞)比例對CpGs的數(shù)量貢獻(xiàn)最大吐绵;因此,它們被納入差異甲基化分析的最終模型河绽。與對照組相比己单,在COVID-19患者中檢測到33.3%的差異甲基化CpG(750874中共有133335個;71527個低甲基化耙饰,61808個高甲基化)(圖3)纹笼。基因相關(guān)的不同甲基化CpGs占0.7%(1054/133335)苟跪,而啟動子相關(guān)的CpGs更為豐富廷痘,占14.4%(19238/133335),表明其在基因調(diào)控中的潛在作用削咆。觀察到的甲基化變化與20822個獨特的基因有關(guān)牍疏。
????????為了確定分析的可重復(fù)性蠢笋,作者將觀察結(jié)果與以前發(fā)表的數(shù)據(jù)進(jìn)行了比較(圖4)拨齐。首先,調(diào)查了以前在預(yù)測COVID-19嚴(yán)重程度方面顯示出極大準(zhǔn)確性的44個CpG位點在COVID-19和對照組之間是否存在差異昨寞。代表6個基因的9個CpG瞻惋,包括IFI44L(cg13452062)、DDO(cg02872426)援岩、SGMS1(cg10188795)歼狼、CXCR2(cg19225688)、CCDC6(cg04736673)享怀、CDC42BPB(cg02003183)羽峰、cg06601098、cg11671940和cg18523915也在本研究中被差異甲基化添瓷。此外梅屉,在相同的基因中發(fā)現(xiàn)了不同的甲基化CpG,但與Castro de Moura等人的研究報告中的位點不同鳞贷,這些基因包括:AIM2和HLA-C基因中的兩個CpG坯汤,以及以下每個基因中的一個CpG位點:CELF4, CEP85L, KIFAP3, LCE1C, LHX6, MOBKL2A, PM20D1, PM20D1, SORCS1, UBAP2L, UBE2W, VIM, ZNF385D。
????????此外搀愧,作者檢查了以前報道的COVID-19相關(guān)的基因是否有明顯的CpG甲基化變化惰聂。在Castro de Moura等人報道并在其他研究中重復(fù)的40個基因中疆偿,在COVID-19患者的39個基因中檢測到220個CpG,107個超甲基化搓幌,113個低甲基化(圖3杆故、4)。這些基因包括免疫反應(yīng)溉愁、病毒進(jìn)入反番、病毒復(fù)制、血液凝固叉钥、肺細(xì)胞中的蛋白質(zhì)結(jié)合罢缸、泛素連接酶和ACE2相關(guān)基因。作者進(jìn)一步進(jìn)行路徑富集分析投队,以測試顯著甲基化的CpGs之間的關(guān)系枫疆。發(fā)現(xiàn)免疫相關(guān)途徑的明顯富集,包括干擾素-γ和干擾素-α反應(yīng)敷鸦、早期雌激素反應(yīng)息楔、頂端表面和紫外線反應(yīng)。這些途徑在COVID-19患者中出現(xiàn)低甲基化扒披,表明許多免疫相關(guān)基因可能被誘導(dǎo)表達(dá)值依。有絲分裂紡錘體途徑是COVID-19患者中唯一的高甲基化途徑。
????????還使用與CpGs相同的模型進(jìn)行了差異甲基化區(qū)域(DMR)分析碟案,其中在COVID-19患者中發(fā)現(xiàn)了4788個低甲基化愿险,包含≥5個CpGs的簇,跨越5723個基因价说。還檢測到總共4347個低甲基化區(qū)域辆亏,覆蓋5072個基因,表明DMRs橫跨一個以上的基因鳖目。為了確定DMR分析檢測到的基因之間的關(guān)系扮叨,進(jìn)行了通路富集分析。作者發(fā)現(xiàn)干擾素-α反應(yīng)和Kras信號通路在COVID-19中低甲基化的明顯富集领迈。相反彻磁,有絲分裂紡錘體途徑超甲基化,顯示出與單個CpG分析的相似性狸捅。
????????3名COVID-19患者在T2時死亡衷蜓,5名在T3時死亡,4名在T4時死亡薪贫,12名在T4后死亡恍箭,即60天內(nèi)最初納入的100名患者中有24名死亡(24%)。死亡的病人平均比康復(fù)的病人大11歲瞧省。正如預(yù)期的那樣扯夭,他們有更多的鼻腔感染鳍贾,更有可能接受體外膜氧合(ECMO)。但是他們并沒有患更多的心血管疾病交洗。
02 - COVID-19組中基線和最后記錄的時間點之間DNA甲基化變化的相互比較
????????作者比較了納入時的免疫細(xì)胞含量和甲基化特征與死亡或康復(fù)前最后記錄的甲基化特征骑科。在恢復(fù)期,與他們的基線免疫細(xì)胞含量相比构拳,檢測到更高比例的CD4 T細(xì)胞和更低比例的中性粒細(xì)胞(圖2B)咆爽。此外,確定了11989個低甲基化和22082個高甲基化的CpGs(圖5A)置森,涉及到多個途徑斗埂。高甲基化的CpGs在炎癥反應(yīng)、干擾素-α反應(yīng)凫海、血紅素代謝呛凶、通過NF-kB的TNF-alfa信號傳導(dǎo)、雌激素早期反應(yīng)行贪、Kras信號傳導(dǎo)漾稀、uv反應(yīng)dn、il2 stat5信號傳導(dǎo)建瘫、有絲分裂主軸崭捍、干擾素-gamma反應(yīng)、IL6 jak stat3信號傳導(dǎo)啰脚、頂端連接和成肌途徑中富集殷蛇。低甲基化的CpGs在異體移植排斥、有絲分裂紡錘體和myc靶點v1途徑中富集拣播。在死亡的病人中晾咪,基線和死亡前最后記錄的時間點之間的免疫細(xì)胞比例沒有差異(圖3)收擦。令人驚訝的是贮配,與在那些康復(fù)的患者中觀察到的變化相比,這些患者表達(dá)的差異性甲基化變化的數(shù)量比他們的基線值少塞赂。檢測到3150個低甲基化和3652個高甲基化的CpGs(圖5B)泪勒。經(jīng)FDR校正后,與這些甲基化變化相關(guān)的途徑?jīng)]有明顯變化宴猾。
????????作者還進(jìn)行了DMR分析圆存,考慮了有五個或更多CpGs的區(qū)域。在康復(fù)的病人中仇哆,有310個相對于363個基因的高甲基化區(qū)域和82個相對于102個基因的低甲基化區(qū)域沦辙。在FDR校正后,沒有明顯的路徑讹剔。然而油讯,一些與免疫有關(guān)的详民、在單個CpGs分析中具有顯著性的路徑也顯示出DMR意義。還測試了是否有DMRs與死亡明顯相關(guān)陌兑,確定了35個區(qū)域沈跨,包括45個基因,在死亡的病人中被高甲基化兔综。在同一對比中饿凛,只有三個區(qū)域是低甲基化的,它們跨越了四個基因(即GNAS软驰、MEST涧窒、RP1-309F20.3)。盡管如此锭亏,沒有發(fā)現(xiàn)與這些DMR變化有關(guān)的重要途徑杀狡。
03 - 兩組之間在納入和隨訪結(jié)束時的DNA甲基化差異的內(nèi)部比較
????????作者比較了死亡的COVID-19患者和恢復(fù)到基線水平的患者。首先測試了模型贰镣,包括臨床協(xié)變量的不同組合呜象,以確定比較免疫細(xì)胞比例差異的最佳模型。根據(jù)這一標(biāo)準(zhǔn)碑隆,不含協(xié)變量的模型(mod7恭陡;細(xì)胞比例~死亡/恢復(fù))被選為最佳模型,并被用于數(shù)據(jù)分析上煤。沒有發(fā)現(xiàn) "死亡 "和"恢復(fù) "患者在基線或最后一個時間點的免疫細(xì)胞有明顯的差異休玩。接下來通過測試不同的協(xié)變量,建立了這些組的差異化甲基化比較的最佳模型劫狠。模型 "none"(沒有任何協(xié)變量)根據(jù)兩個標(biāo)準(zhǔn)適合大多數(shù)的CpGs拴疤,因此這個模型被選為后續(xù)分析。
????????CpG位點或區(qū)域表明独泞,基線(基線死亡與基線恢復(fù))的甲基化變化對結(jié)果沒有明顯影響呐矾。然而,在最后一個時間點比較相同的病人懦砂,結(jié)果是死亡的病人與康復(fù)的病人相比蜒犯,有1478個低甲基化和1557個高甲基化的CpG(圖5C)。此外荞膘,在190個基因附近的156個區(qū)域發(fā)現(xiàn)了高甲基化的DMRs罚随,在133個基因中發(fā)現(xiàn)了102個低甲基化的區(qū)域。沒有基于DMR途徑的基因的重要途徑羽资,在這個比較中淘菩,也沒有發(fā)現(xiàn)任何免疫細(xì)胞比例的差異。
????????Castro de Moura等人發(fā)表的研究預(yù)測了嚴(yán)重的COVID-19病例的44個CpGs屠升,與之相比潮改,作者發(fā)現(xiàn)有5個CpGs僅在康復(fù)的病人的基線和最后的時間點之間存在差異费奸。沒有一個在死亡的病人和他們的基線之間有差異(圖4)。四個CpG(cg11671940进陡;RP11-351M16.3愿阐,cg10188795;SGMS1趾疚,cg17515347和cg24145401缨历;AIM2)與基線相比是高甲基化的,一個是低甲基化的(cg06601098)糙麦,它不屬于任何基因區(qū)域辛孵。在Castro de Moura等人的嚴(yán)重COVID-19病例中,除了一個CpG是低甲基化的赡磅,其他都是低甲基化的魄缚。它們在康復(fù)的病人中都有明顯的高甲基化,表明它們有可能改善結(jié)果焚廊。在Castro de Moura等人的研究中冶匹,cg06601098是一個例外,它在康復(fù)的嚴(yán)重COVID-19患者中被低甲基化咆瘟。然而嚼隘,在比較康復(fù)患者與死亡患者的最后一個時間點時,這些變化都不明顯袒餐。
????????此外飞蛹,還從以前的研究中發(fā)現(xiàn)了40個候選基因的CpGs變化。在此灸眼,觀察到康復(fù)者在最后一個時間點與基線相比卧檐,有29個高甲基化和31個低甲基化的CpGs(圖6)。死亡的病人有7個高甲基化和8個低甲基化的CpG焰宣。其中一個CpGs(TMPRSS2基因中的cg16371860)在康復(fù)者和死亡者中都有明顯的低甲基化霉囚;因此,作為康復(fù)的潛在標(biāo)志物宛徊,它可能沒有多大意義佛嬉。將最后一個時間點的康復(fù)者和死亡者與已發(fā)表的數(shù)據(jù)進(jìn)行比較,沒有發(fā)現(xiàn)Castro de Moura等人的任何重要CpG闸天。然而,作者從40個候選基因中發(fā)現(xiàn)了9個CpGs斜做,包括死亡患者中兩個低甲基化的CpGs(啟動子相關(guān)的OAS1苞氮;cg18217049,和TMPRSS2瓤逼;cg19020860)笼吟。還看到死亡患者中有三個高甲基化的CpGs库物,來自STAT3(cg17833746,cg24312520贷帮,cg24718015)戚揭,一個來自O(shè)AS2(cg19371652),一個來自LZTFL1(cg09709426)撵枢,還有一個是來自TBK1基因(cg13540592)(圖6)民晒。
04 - 關(guān)鍵的COVID-19疾病誘發(fā)的差異性甲基化的時間過程
????????為了確定甲基化隨時間的變化,作者分析了所有四個時間點的死亡或在第60天(T4后)康復(fù)的患者锄禽。首先潜必,研究了死亡和康復(fù)的病人在免疫細(xì)胞動態(tài)方面是否有差異。使用樣條函數(shù)的免疫細(xì)胞比例分析確定了中性粒細(xì)胞的顯著變化沃但,中性粒細(xì)胞在后來死亡的病人中顯示出T3和T4的突然增加磁滚。相反,那些康復(fù)的患者則表現(xiàn)出相反的情況(圖7A)宵晚,表明這些細(xì)胞在臨床結(jié)果中的關(guān)鍵重要性垂攘。
????????作者發(fā)現(xiàn)在49個CpG位點上,死亡的患者和康復(fù)的患者在四個時間點上的甲基化趨勢存在差異淤刃,這些位點對應(yīng)于27個基因(圖8)搜贤,其中大部分已知是調(diào)節(jié)蛋白結(jié)合的活性。在這27個基因中钝凶,19個已經(jīng)在COVID-19中報道過仪芒,要么是病毒進(jìn)入和與受體結(jié)合,要么是臨床預(yù)測耕陷,如疾病的嚴(yán)重程度或其與末端器官損傷的關(guān)系掂名。
????????在COVID-19中沒有報道的基因中,有兩個已知在免疫系統(tǒng)中起作用:DEFB116和DEFB115哟沫。這些基因?qū)儆讦?防御素系統(tǒng)饺蔑,它是先天免疫反應(yīng)的重要組成部分,在保護(hù)免受感染方面發(fā)揮著重要作用嗜诀。作者發(fā)現(xiàn)這些基因的CpGs在所有四個時間點上有不同的甲基化(圖7B和C)猾警。DEFB115在死亡的COVID-19患者中總體上甲基化程度較低,這表明在關(guān)鍵的COVID-19患者中表達(dá)可能增加隆敢。DEF116只在死亡的病人中出現(xiàn)低甲基化发皿。
05 - 對疾病結(jié)果的預(yù)測
????????作者測試了COVID-19兩組基線和結(jié)果前最后記錄的時間點之間的相互比較、兩組納入時和隨訪結(jié)束時的內(nèi)部比較所發(fā)出的所有CpGs(共40,956個)拂蝎,以及從差異甲基化的時間過程發(fā)出的CpGs穴墅。共有13個CpGs對應(yīng)于8個基因預(yù)測了結(jié)果,其中三個基因是通過比較存活患者的基線和最后一個時間點的甲基化變化發(fā)出的(PSMB9、MFHAS1和MRPS2)玄货,五個基因是通過比較死亡患者的基線和最后一個時間點發(fā)出的(MAT2B皇钞、YY1P2、ROCK1松捉、ZNF789夹界、H1F0)。
????????ROC1隘世、ZNF789和H1F0的甲基化程度較高可柿,增加了死亡風(fēng)險(圖9),而PSMB9以舒、MFHAS1趾痘、MRPS2、MAT2B和YY1P2的高甲基化會降低其風(fēng)險(圖10)蔓钟。該模型的敏感性和特異性的ROC曲線顯示永票,ZNF789(80.6%)和MRPS2(80%)的預(yù)測結(jié)果非常好,PSMB9(78.5%)滥沫、MFHAS(75.7%)侣集、H1F0(75.8%)、YY1P2(72%)和ROCK1(77.7%)基因的預(yù)測結(jié)果較好兰绣,而MAT2B(66.9%)則一般(圖9和10)世分。這些基因大多與炎癥或DNA調(diào)節(jié)有關(guān),有趣的是缀辩,這些基因中有7個在以前的COVID-19研究中被報道過臭埋。進(jìn)一步,查看了SRTING數(shù)據(jù)庫臀玄,以評估這些基因的蛋白質(zhì)相互作用瓢阴。同時,在降低死亡率的五個基因中不存在相互作用健无,在Reactome途徑中存在富集荣恐,被稱為 "凋亡執(zhí)行途徑"。
四累贤、結(jié)論
????????總的來說叠穆,作者在重癥COVID-19患者的ARDS中發(fā)現(xiàn)了一個預(yù)測臨床結(jié)果的表觀遺傳特征。雖然免疫相關(guān)的途徑臼膏,干擾素-α和-γ硼被,最初是區(qū)分重癥COVID-19的主要生物機(jī)制,但由八個基因組成的表觀遺傳學(xué)特征集預(yù)測了生存率讶请。需要進(jìn)一步的研究來闡明甲基組作為疾病生物標(biāo)志物的潛在用途祷嘶,最重要的是評估DNA甲基轉(zhuǎn)移酶屎媳、核苷抑制劑或其他藥物潛在的表觀遺傳學(xué)靶向療法在COVID-19中的應(yīng)用夺溢。