Mahmud SMH, Al-Mustanjid M, Akter F, et al. Bioinformatics and system biology approach to identify the influences of SARS-CoV-2 infections to idiopathic pulmonary fibrosis and chronic obstructive pulmonary disease patients.?Brief Bioinform. 2021;22(5):bbab115. doi:10.1093/bib/bbab115
2021年2月發(fā)表在《Briefings in Bioinformatics》(IF=11.622;中科院2區(qū))上關(guān)于新冠數(shù)據(jù)的非腫瘤純生信文章~~~生物信息學(xué)和系統(tǒng)生物學(xué)方法驗證SARS-CoV-2感染對特發(fā)性肺纖維化(IPF)和慢性阻塞性肺疾病(COPD)患者的影響
摘要
嚴(yán)重急性呼吸綜合癥冠狀病毒-2(SARS-CoV-2) 鹤耍,更廣為人知的名字是2019冠狀病毒疾病(COVID-19)验辞,已經(jīng)成為當(dāng)前人類的一個威脅稿黄。Sars-cov-2病毒的第二波已經(jīng)襲擊了許多國家,確診的COVID-19病例正在迅速蔓延跌造。這種流行病仍在經(jīng)歷可怕的階段杆怕。患有特發(fā)性肺纖維化(IPF)和慢性阻塞性肺病(COPD)是COVID-19的危險因素壳贪,但是 IPF陵珍、 COPD 和 COVID-19背后的分子機制尚不清楚。為此违施,研究者利用轉(zhuǎn)錄組分析來檢測 IPF互纯、 COPD 和COVID-19中常見的通路和分子生物標(biāo)志物,有助于理解 sars-cov-2與 IPF 和 COPD 患者之間的聯(lián)系磕蒲。
本研究利用基因表達綜合集(GEO)中的3個 RNA-seq 數(shù)據(jù)集(GSE147507留潦、 GSE52463和 GSE57148) ,檢測 IPF 和辣往、COPD 和COVID-19患者的共同的差異表達基因(DEGs) 愤兵,以尋找共同通路和候選藥物。在這三個數(shù)據(jù)集中共識別出65個共同的DEGs排吴。利用多種組合統(tǒng)計學(xué)方法和生物信息學(xué)工具構(gòu)建蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)(PPI) 秆乳,從中識別出 Hub 基因和核心模塊。此外钻哩,基于GO和KEGG通路的功能富集分析屹堰,發(fā)現(xiàn) IPF 和 COPD 與COVID-19感染的過程有一些共同的聯(lián)系。轉(zhuǎn)錄因子-基因相互作用街氢、蛋白質(zhì)-藥物相互作用以及 DEGs-miRNAs 與常見 DEGs 的共同調(diào)控網(wǎng)絡(luò)也在數(shù)據(jù)集中被確定扯键。我們認為這項研究獲得的候選藥物可能有助于COVID-19的有效治療。
流程圖
方法及結(jié)果
?1?數(shù)據(jù)收集和差異表達基因(DEGs)鑒定
從GEO數(shù)據(jù)庫獲取COVID-19珊肃、IPF和COPD的數(shù)據(jù)集荣刑。在轉(zhuǎn)錄水平的不同測試條件之間存在統(tǒng)計學(xué)意義上的顯著差異時馅笙,一個基因的特征是表達不同。此分析的關(guān)鍵作用是首先獲取數(shù)據(jù)集GSE147507厉亏、GSE52463和 GSE57148的DEGs董习,臨界值(p 值 < 0.05和 | logFC | ≥1.0)用于檢測所有數(shù)據(jù)集中的有效 DEGs。
GSE147507是COVID-19肺活檢轉(zhuǎn)錄譜數(shù)據(jù)集爱只,發(fā)現(xiàn)了1184個 DEGs (293個上調(diào)皿淋,891個下調(diào));GSE52463包含8個 IPF 肺組織樣本和7個健康對照組恬试,其數(shù)據(jù)集中發(fā)現(xiàn)了1444個 DEGs (783個上調(diào)窝趣,661個下調(diào)) ;GSE57148收集了91例正常肺功能的患者和98例 COPD 患者的數(shù)據(jù)集训柴,數(shù)據(jù)集中發(fā)現(xiàn)了1461個 DEGs (1022個上調(diào)哑舒,439個下調(diào))。
通過Venn圖從 IPF幻馁、COPD 和COVID-19數(shù)據(jù)集中確定了65個共有的DEGs散址。
2 GO和KEGG通路富集分析
利用一個全面的基因集富集網(wǎng)絡(luò)工具 EnrichR (https://maayanlab.cloud/EnrichR/)來描述DEGs 的生物學(xué)機制(生物學(xué)過程、細胞組成和分子功能)和信號通路( P值<?0.05)宣赔。
在生物學(xué)過程中预麸,干擾素 γ 介導(dǎo)(7個基因)和細胞因子介導(dǎo)的信號傳導(dǎo)途徑(15個基因)是首選的 GO 術(shù)語。γ?- 干擾素(IFN-γ)是一種細胞因子儒将,在免疫反應(yīng)中起著重要作用吏祸。IFN-γ 信號通路主要與炎癥和細胞介導(dǎo)的免疫反應(yīng)有關(guān),也與免疫監(jiān)視人類腫瘤細胞抗腫瘤細胞因子相關(guān)钩蚊。在分子功能實驗中贡翘,金屬蛋白酶(5個基因)和金屬內(nèi)肽酶活性(4個基因)是兩個最主要的 GO 途徑。金屬蛋白酶活性(MMP 組基因)影響呼吸系統(tǒng)疾病砰逻,包括 ARDS鸣驱、急性肺損傷、肺癌和肺纖維化蝠咆。在細胞組成部分踊东,內(nèi)質(zhì)網(wǎng)膜管腔側(cè)(6個基因)和 MHC 蛋白復(fù)合體(5個基因)的組成部分位于前列。對于SARS-CoV-2來說刚操,膜蛋白闸翅、穗狀糖蛋白和包膜蛋白在復(fù)制SARS-CoV-2過程中被植入內(nèi)質(zhì)網(wǎng)膜。
表2總結(jié)了生物過程菊霜、分子功能和細胞組分類別中的前10個術(shù)語坚冀。
圖3在條形圖中為每個類別線性描述了整個本體分析。
前10位 KEGG 途徑包括移植物抗宿主病(GVHD)鉴逞、同種異體移植排斥反應(yīng)记某、1型糖尿病司训、自身免疫性甲狀腺疾病、病毒性心肌炎液南、腸道免疫網(wǎng)絡(luò)的產(chǎn)生壳猜、細胞粘附分子、人 t 細胞白血病病毒1型感染以及抗原處理和呈遞贺拣。其中GVHD 是一種常見的由失調(diào)炎癥細胞因子和細胞毒性 t 細胞效應(yīng)介導(dǎo)的并發(fā)癥蓖谢。
圖4用柱狀圖表示通路富集分析結(jié)果
3?hub蛋白及其子模塊的分類
通過在線網(wǎng)站STRING基于所有DEGs構(gòu)建PPI網(wǎng)絡(luò)捂蕴,并通過Cytoscape進行可視化譬涡,以預(yù)測常見的 DEGs 的相互作用和粘附通路,如圖5所示啥辨,常見 DEGs 的 PPI 網(wǎng)絡(luò)由781個節(jié)點和968條邊組成涡匀。
通過 Cytoscape Cytohubba 插件對PPI 網(wǎng)絡(luò)分析,我們將前14個(21.54%) DEGs 列為最具影響力的基因,并構(gòu)建了一個子模塊網(wǎng)絡(luò)(圖6)溉知。hub基因為 NOTCH4陨瘩、 FLNC、 Indian hedgehog (IHH)级乍、 FOSL1舌劳、 CXCR4、 PSMB8玫荣、 DAXX甚淡、 RASD2、 EPN3捅厂、 DIRAS1贯卦、 BATF、 GDF5焙贷、 RGS4和 CD28撵割。這些hub基因可以成為潛在的生物標(biāo)志物,這也可能為研究疾病提供新的治療策略辙芍。
4 調(diào)控相關(guān)signature的確定
使用 NetworkAnalyst 平臺從 JASPAR 數(shù)據(jù)庫中定位拓撲可信的轉(zhuǎn)錄因子(tf)啡彬,NetworkAnalyst 是一個廣泛的在線平臺,用于元分析基因表達數(shù)據(jù)故硅,并深入了解生物學(xué)機制外遇、角色和解釋。Tarbase 和 mirTarbase 是 miRNA-靶基因相互作用的主要實驗有效性數(shù)據(jù)庫契吉。通過NetworkAnalyst 從 miRNA 與基因的相互作用中提取共有DEGs 相互作用的 miRNA跳仿,并將其應(yīng)用于拓撲分析中。TFs-基因和 miRNA-基因相互作用網(wǎng)絡(luò)均在 Cytoscape 進行描述捐晶。
分析TFs菲语、miRNA與DEGs的相互作用妄辩,以發(fā)現(xiàn)常見的 DEGs 的轉(zhuǎn)錄和轉(zhuǎn)錄后調(diào)節(jié)因子。轉(zhuǎn)錄因子處理轉(zhuǎn)錄的比例以及miRNA 在轉(zhuǎn)錄后水平上在基因調(diào)控和 RNA 沉默中起關(guān)鍵作用山上。
圖7展示了TFs與DEGs交互網(wǎng)絡(luò)眼耀。已鑒定的 TFs,如 FOSL1佩憾、DAXX哮伟、 HSPB6、CFB妄帘、FLNC楞黄、VARS2、TMEM238抡驼、PSMB8鬼廓、EPN3和 DNAAF1,與不同類型的呼吸系統(tǒng)疾病有關(guān)致盟。
圖8展示了miRNA與DEGs交互網(wǎng)絡(luò)碎税,預(yù)測了4個 miRNAs (hsa-mir-16-5p、 hsa-let-7e-5p馏锡、 hsa-mir-26a-5p 和 hsa-mir-146a-5p)與 IPF 和 COPD 的不同基因有關(guān)雷蹂。
5 候選藥物的鑒定
Drug Signatures database (DSigDB)?是識別與 DEGs 有關(guān)的靶向藥物的全球檔案館。利用 DSigDB 通過 Enrichr鑒定 COVID-19, IPF, and COPD的DEGs的藥物分子杯道。通過蛋白質(zhì)-藥物相互作用的評估確定受體敏感性藥物結(jié)構(gòu)匪煌。
表4顯示了 DSigDB 數(shù)據(jù)庫中用于DEGs 的有效藥物。鑒定出姜黃素蕉饼,它用于與炎癥有關(guān)的疾病虐杯。炎癥反應(yīng)表明身體對感染、毒素和傷害的保護機制昧港。人體會從免疫系統(tǒng)釋放一些化學(xué)物質(zhì)來保護受損的細胞擎椰。
6?疾病相關(guān)性的鑒定
DisGeNET 是一個全面的基因-疾病聯(lián)系數(shù)據(jù)庫,通過 NetworkAnalyst 研究了基因與疾病的關(guān)系创肥,以發(fā)現(xiàn)與常見 DEGs 相關(guān)的疾病及其慢性并發(fā)癥达舒。該研究對基因-疾病關(guān)聯(lián)性的網(wǎng)絡(luò)分析中,結(jié)果與COVID-19有關(guān)的各種類型的疾病叹侄,包括大腦巩搏、心臟、血液趾代、肝臟贯底、皮膚和不同種類的肺癌,如風(fēng)濕性關(guān)節(jié)炎撒强、精神分裂癥禽捆、皮疹笙什、異位性皮膚炎和常染色體隱性遺傳性疾病與報道的hub基因相關(guān)。
研究結(jié)論
該研究在 IPF胚想、COPD 和COVID-19的轉(zhuǎn)錄組分析的背景下琐凭,總結(jié)了這三種疾病基因之間的關(guān)系。在三個數(shù)據(jù)集中進行DEGs分析浊服,鑒定共同的基因统屈,找出 IPF、 COPD 和 Sars-cov-2影響肺細胞的疾病反應(yīng)牙躺。生物信息學(xué)分析表明IPF 和 COPD 患者感染 Sars-cov-2的風(fēng)險較高愁憔。利用數(shù)據(jù)集中的65個相互關(guān)聯(lián)的共有基因獲得 PPI 網(wǎng)絡(luò),并從 PPI 網(wǎng)絡(luò)中鑒定出10個最重要的hub基因述呐。通過檢索 DSigDB 數(shù)據(jù)庫,從hub基因提出多藥物分子和藥物-靶點相互作用惩淳,對 IPF蕉毯、COPD 和COVID-19的分析指出了一種鑒別各種疾病感染的方法乓搬。因此,有可能減輕 IPF 和 COPD 患者受 Sars-cov-2影響的風(fēng)險代虾。
COVID-19是一種新近發(fā)現(xiàn)的疾病进肯,關(guān)于其危險因素和疾病的研究還不多。目前棉磨,有一些疫苗可用于預(yù)防COVID-19江掩。但是在某些情況下疫苗并沒有顯示出有效性,特別是對 sars-cov-2的不同變異體乘瓤。該研究實施了轉(zhuǎn)錄組分析來檢測 IPF环形、 COPD 和COVID-19中常見的通路和分子生物標(biāo)志物,有助于理解 Sars-cov-2與 IPF 和 COPD 的聯(lián)系衙傀。在這些疾病中發(fā)現(xiàn)了10種hub蛋白抬吟。所有這些hub基因在不同的功能突變中起著至關(guān)重要的作用。驗證的 TFs 和 miRNA 與不同類型的呼吸系統(tǒng)疾病有關(guān)统抬。因此火本,我們鑒定的基因可以成為COVID-19疫苗開發(fā)的一個新的治療靶點。
參考:https://mp.weixin.qq.com/s/k7CGaUWpsQPzilYk4GJq5Q
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------I am a line!--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------