Typing characteristics of metabolism-related genes in osteoporosis
骨質(zhì)疏松癥中的代謝相關基因的類型特征
發(fā)表期刊:Front Pharmacol
發(fā)表日期:2022 Sep 15
影響因子:5.988
DOI:? 10.3389/fphar.2022.999157
一憎茂、研究背景
????????骨質(zhì)疏松癥是一種全身性的代謝性骨病锤岸,發(fā)病率不斷上升。它的特點是骨量減少拳氢,骨的微觀結構惡化蛋铆,骨脆性和骨折的風險增加。骨質(zhì)疏松癥主要表現(xiàn)為骨質(zhì)疏松性骨折刺啦,包括身體不同部位的骨折,尤其是髖部骨折玛瘸。
????????人類包括多種生物,如動物市咆,主要通過碳水化合物再来、脂肪和蛋白質(zhì)來攝取潛在的能量,但也有涉及幾種酶的特定生化級聯(lián)進行分解芒篷。在生理上,許多代謝途徑中的基因和路徑對許多細胞的代謝功能至關重要挠他。因此篡帕,這些基因和途徑的失調(diào)或失衡會導致細胞功能紊亂和各種代謝性疾病贸呢。盡管有大量證據(jù)表明骨病和代謝紊亂之間可能存在聯(lián)系拢军,但這些代謝網(wǎng)絡中的具體參與者和分子相互作用仍然不清楚。同時固蛾,組學技術促進了對各種臨床疾病的分子變化的開發(fā)和探索度陆。同時,利用基因組學懂傀、轉(zhuǎn)錄組學、蛋白質(zhì)組學和代謝組學等多組學技術沧竟,是促進臨床疾病正確治療的關鍵缚忧。
二、材料與方法
1糕非、數(shù)據(jù)來源
1) 以 "osteoporosis "和 "Homo sapiens "為關鍵詞:GSE56814(42個正常和31個骨質(zhì)疏松癥樣本)球榆、GSE56815(40個正常和30個骨質(zhì)疏松癥樣本)、GSE35959(9個正常和5個骨質(zhì)疏松癥樣本)和GSE7429(10個正常和10個骨質(zhì)疏松癥樣本)持钉;GSE35959和GSE7429微陣列數(shù)據(jù)被用作外部驗證數(shù)據(jù)集
2) 以前的研究已經(jīng)確定了2752個代謝相關的基因每强,編碼所有已知的人類代謝酶和轉(zhuǎn)運器
2 、分析流程
1) 聚類分析:使用集合相似性網(wǎng)絡融合和共識聚類算法(SNF-CC)來觀察骨質(zhì)疏松癥患者的基因表達模式和聚類識別空执;根據(jù)聚類結果繪制多組學熱圖,并用于從多組學數(shù)據(jù)中識別奶栖、驗證和可視化分子疾病亞型
2) 新陳代謝相關的骨質(zhì)疏松癥亞型的差異性基因表達譜:R語言limma包進行亞型之間的基因比較分析,并使用Venn diagram方法得出共同的代表性DEGs
3) 通路富集分析和蛋白質(zhì)圖譜的可視化:基因富集宣鄙;使用Proteomaps將差異分析中的蛋白質(zhì)數(shù)據(jù)可視化
4) 篩選與骨質(zhì)疏松癥代謝相關的特征基因:利用排名靠前的mrmr基因構建了一個SVM分類器冻晤,并應用增量特征選擇(IFS)方法來確定作為特征基因的最佳數(shù)量
5) 特征基因表達的數(shù)據(jù)驗證:驗證特征基因的表達情況,并通過繪制小提琴圖將數(shù)據(jù)可視化
6) 免疫相關物分析:xCell
三、實驗結果
01 - 骨質(zhì)疏松癥亞型的差異性基因表達譜
????????作者從Gene Expression Omnibus(GEO)數(shù)據(jù)庫下載了骨質(zhì)疏松癥患者的基因表達和臨床數(shù)據(jù)惯裕,包括GSE56814、GSE56815撑刺、GSE35959和GSE7429握玛。首先,對GSE56814和GSE56815數(shù)據(jù)集的表達譜進行主成分分析冕屯,揭示基因表達數(shù)據(jù)拂苹,如圖2A,B所示。其次瓢棒,通過整合相似性網(wǎng)絡融合和共識聚類算法(SNF-CC),在骨質(zhì)疏松癥患者隊列中計算CPI(藍線)和差距統(tǒng)計(紅線)念颈,確定了最佳的聚類數(shù)量连霉。其中,當k=3時翠语,共識矩陣熱圖仍能保持清晰明確的邊界财边,說明樣本的聚類是穩(wěn)定和穩(wěn)健的(圖2C)。將這三種骨質(zhì)疏松癥亞型定義為C1、C2和C3黑滴。最后紧索,通過主成分分析確定了三種骨質(zhì)疏松癥亞型,如圖2D所示珠漂。
????????此外媳危,作者用代謝基因熱圖繪制了代謝途徑,顯示高BMD(中位絕對偏差)組與C1亞型聚在一起待笑,低BMD組與C3亞型聚在一起(圖3A)暮蹂,繪制了不同BMDS之間三種亞型的百分比條形圖。其中仰泻,C1亞型在高BMD骨質(zhì)疏松癥患者中占較高比例,C3亞型在低BMD骨質(zhì)疏松癥患者中占較高比例慎宾,C2亞型在不同BMD骨質(zhì)疏松癥患者中占類似比例浅悉。如圖3B所示,使用R語言limma包進行亞型之間的基因差異分析术健,并繪制維恩圖以確定每個亞型的代表性基因,其中1501個在三個亞型之間共享咳促。同時勘伺,對于不同的亞型C1、C2和C3冲茸,分別確定了1351、8和158個差異表達的基因(圖3C)轴术,并繪制了火山圖。
02 - 代謝相關差異基因的多組學富集圖譜
????????為了可視化不同亞組的特征基因的富集信息的差異盖袭,并利用其他生物信息學工具確認富集分析中得到的結果彼宠,作者將三個亞組的特征基因分別上傳到網(wǎng)絡上的互動軟件proteomaps。在創(chuàng)建的蛋白圖可視化矩形中醇蝴,整個區(qū)域被劃分為代表頂級類別的彩色編碼多邊形想罕,頂級類別區(qū)域又被細分為疾病區(qū)域亞類霉涨、功能相關蛋白共享共同區(qū)域亞類和相關基因共享共同區(qū)域亞類,如圖4所示楼镐。C1亞型在代謝方面關于生物合成往枷、氨基酸代謝、脂質(zhì)和類固醇代謝的富集错洁,主要蛋白是K00718屯碴,主要基因是FUT。C2亞型在中央碳代謝导而、糖酵解途徑、K00002蛋白韵丑、基因AKR1A1方面代謝豐富虚缎。C3亞型代謝富集于多糖的生物合成、糖代謝途徑,主要蛋白為k07968享幽、k01197拾弃、k03909,主要基因為B4GALT3奔坟、HYAL2搭盾、TFPI。
03 - 骨質(zhì)疏松癥中代謝相關基因的篩選和差異性表達
????????作者可視化了不同骨質(zhì)疏松癥亞型的差異基因澜建,如圖5A所示蝌以。根據(jù)篩選出的前160個mRMR基因,通過構建100個SVM分類器并應用增量特征選擇(IFS)方法來確定作為特征基因的最佳數(shù)量跟畅,如圖5B所示徊件。當基因數(shù)量為10個時,MCC峰值為0.386虱痕,這10個基因被認為是與骨質(zhì)疏松癥的代謝有關的特征基因,包括GPR31疏橄、GATM略就、DDB2、ARMCX1窄绒、RPS6崔兴、BTBD3蛔翅、ADAMTSL4位谋、COQ6、B3GNT2和CD9掏父。隨后,根據(jù)10個候選基因在不同的骨質(zhì)疏松癥亞型中的表達情況繪制了可視化的小提琴圖赊淑。GPR31、DDB2钾挟、RPS6饱岸、ADAMTSL4和COQ6在C1和C2亞型中表達,C1>C2苫费。GATM黍衙、ARMCX1荠诬、BTBD3、B3GNT2和CD9在C1和C2亞型中表達柑贞,C1<C2。在C2和C3亞型中GATM和ARMCX1的表達棠众,C2>C3有决。ADAMTSL4和COQ6在C2和C3亞型中表達,C2<C3新荤。有趣的是台汇,在C1與C3的比較中沒有統(tǒng)計學意義篱瞎,如圖5C所示痒芝。
04 - 特征基因表達數(shù)據(jù)的驗證
????????根據(jù)GSE35959和GSE7429數(shù)據(jù)集中GPR31、GATM澄者、DDB2瞳步、ARMCX1、RPS6抱怔、BTBD3嘀倒、ADAMTSL4、COQ6测蘑、B3GNT2和CD9基因表達情況,我們繪制了小提琴圖進行數(shù)據(jù)可視化的表達驗證勇蝙。其中挨约,在綜合數(shù)據(jù)中GPR31的表達,高BMD<低BMD翁锡,如圖6A所示夕土。GPR31在GSE7429數(shù)據(jù)中表達,高BMD>低BMD角溃,DDB2在GSE7429數(shù)據(jù)中表達篮撑,高BMD>低BMD,如圖6B所示咽扇。在GSE35959數(shù)據(jù)中GPR31和DDB2表達,正常組<骨質(zhì)疏松組树埠,而ARMCX1和ADAMTSL4在GSE35959數(shù)據(jù)中表達,正常組>骨質(zhì)疏松組又碌,如圖6C所示绊袋。
05 - 免疫相關因素分析
????????最后癌别,用xCell來推斷64種免疫和基質(zhì)細胞類型的GPR31、GATM展姐、DDB2、ARMCX1教馆、RPS6擂达、BTBD3、ADAMTSL4悲敷、COQ6穗熬、B3GNT2和CD9基因丁溅。如相關圖所示,這些細胞分別由16妓柜、15涯穷、14、10拷况、17、13粟誓、27、19和24個代表細胞組成病瞳。每個基因的代表細胞主要包括NKT(自然殺傷性T細胞)悲酷、iDC(不成熟樹突狀細胞);CLP(普通淋巴祖細胞)逗柴、cDC(Xonventional樹突狀細胞)亡嫌;Th1細胞(1型T輔助細胞)、漿細胞于购、CD4 Tem(CD4效應記憶T細胞)知染、類開關記憶B細胞;肥大細胞控淡、巨噬細胞M2。CD8 T細胞辫诅,B細胞涧狮;mv內(nèi)皮細胞(微血管內(nèi)皮細胞);類開關記憶B細胞肤视,NKT(自然殺傷T細胞)涉枫;Th1細胞(1型T輔助細胞),CD4 Tem(CD4效應記憶T細胞)困后;成纖維細胞,嗜堿性細胞锯仪,MSC(間充質(zhì)干細胞)趾盐;血小板,巨核細胞救鲤,HSC(造血干細胞)久窟,如圖7所示。
四本缠、結論
????????基于對骨質(zhì)疏松癥患者基因表達的聚類分析和機器學習斥扛,作者確定了不同的代謝相關亞型和骨質(zhì)疏松癥的特征基因,這將有助于為骨質(zhì)疏松癥的代謝相關發(fā)病機制提供新思路丹锹,為后續(xù)研究提供新方向稀颁。