01? MEGENA概要
基因共表達網(wǎng)絡(luò)分析可以有效鑒定與復(fù)雜人類疾病相關(guān)的功能性共表達基因模塊。最常用的共表達網(wǎng)絡(luò)分析是加權(quán)基因共表達網(wǎng)絡(luò)分析(WGCNA)慧瘤,它將復(fù)雜生物過程的基因共表達網(wǎng)絡(luò)劃分為高度相關(guān)的幾個特征模塊坠韩,其代表著幾組高度協(xié)同變化的基因集,并可將模塊與特定的臨床特征建立關(guān)聯(lián),從中尋找發(fā)揮關(guān)鍵功能的基因怕享,幫助識別參與特定生物學(xué)過程的潛在機制以及探索候選生物標志物。但是這種方法有一定局限性镰踏,無法在單個網(wǎng)絡(luò)中共存不同級別的聚類函筋,從而無法體現(xiàn)復(fù)雜網(wǎng)絡(luò)的多尺度層次性。
為了解決這些缺點奠伪,MEGENA在拓撲領(lǐng)域采用了網(wǎng)絡(luò)嵌入范式跌帐。換句話說,一個共同表達網(wǎng)絡(luò)被嵌入在一個球面上绊率,這樣一個鏈接就不會與其他鏈接交叉谨敛。MEGENA通過:i)引入共表達相似性的質(zhì)量控制,ii)并行化嵌入式網(wǎng)絡(luò)構(gòu)建滤否,發(fā)展了一種新的聚類技術(shù)來識別平面濾波網(wǎng)絡(luò)(PFNs)中的多尺度聚類結(jié)構(gòu)脸狸。
MEGENA包括四個主要步驟:1)引入并行化、提前終止和先驗質(zhì)量控制的快速平面濾波網(wǎng)絡(luò)構(gòu)造(FPFNC)藐俺;2)引入以分辨率參數(shù)為特征的模塊結(jié)構(gòu)緊湊性的多尺度聚類分析(MCA)炊甲;3)采用多尺度中心分析(MHA)來識別高度復(fù)雜的網(wǎng)絡(luò)聚類特征關(guān)聯(lián)分析(CTA)探討聚類與臨床結(jié)果的相關(guān)性。圖1顯示了MEGENA的總體分析流程欲芹。
FPFNC主要遵循PMFG算法的網(wǎng)絡(luò)嵌入原理來構(gòu)造PFN卿啡。所有的基因?qū)κ紫韧ㄟ^一個相似性度量進行排序,量化各自的相互作用強度菱父,然后對其平面性進行迭代測試颈娜,以形成有利于包含具有較大相似性的基因?qū)Φ那度胧骄W(wǎng)絡(luò)。為了使PFN構(gòu)建在全基因組共表達網(wǎng)絡(luò)分析中具有可擴展性浙宜,MEGENA開發(fā)了兩種技術(shù)官辽。首先,通過設(shè)置基因?qū)ο嗨菩缘腻e誤發(fā)現(xiàn)率(FDR)粟瞬,在網(wǎng)絡(luò)嵌入之前篩選掉不重要的交互作用野崇。其次,提出了一種并行篩選程序(PCP)來提取更可能被嵌入的基因?qū)ψ蛹吨樱沟肍PFNC能夠更加高效地構(gòu)建網(wǎng)絡(luò)乓梨。
然后將FPFNC構(gòu)造的PFN輸入MCA鳖轰,識別多尺度聚類。MCA結(jié)合了三個不同的準則來識別局部相干簇扶镀,同時保持全局最優(yōu)分割蕴侣。首先,利用最短路徑距離(SPD)優(yōu)化簇內(nèi)緊密性臭觉。其次昆雀,利用局部路徑索引(LPI)優(yōu)化局部聚類結(jié)構(gòu)。第三蝠筑,采用整體模塊化(Q)來確定最優(yōu)劃分狞膘。具體地說,MCA采用層次分裂法什乙,通過k分裂和緊度估計兩步迭代挽封,將PFN中的復(fù)雜相互作用分解為不同分辨率的相干相互作用體。k-split通過優(yōu)化SPD臣镣、LPI和Q來識別導(dǎo)致父網(wǎng)絡(luò)最優(yōu)劃分的簇辅愿。
最后,利用MHA和CTA進行下游分析忆某。MHA首先根據(jù)已建立的平面網(wǎng)絡(luò)隨機模型確定每個集群內(nèi)的重要樞紐点待。在多個尺度上作為中心的節(jié)點稱為多尺度中心。CTA通過主成分分析和相關(guān)分析評估個體聚類與臨床結(jié)果的相關(guān)性弃舒。
02??MEGENA示例流程
1癞埠、計算相關(guān)性
2、計算PFN
在這一步中聋呢,平面濾波網(wǎng)絡(luò)(PFN)是通過取顯著相關(guān)對ijw來計算的苗踪。在使用不同的相似性度量的情況下,可以獨立地將結(jié)果格式化為列名為c(“row”坝冕、“col”徒探、“weight”)的3列數(shù)據(jù)幀瓦呼,并確保weight列的范圍在0到1之間喂窟。將此用作計算.PFN()也可以。
3央串、執(zhí)行聚類
利用MCA聚類進行多尺度聚類分析磨澡。“MEGENA.output “是用于下游分析的核心輸出质和,用于匯總和繪圖稳摄。
4、匯總結(jié)果
5饲宿、作圖
可以選取感興趣的網(wǎng)絡(luò)模塊作圖
參考文獻
[1] Zhang L, Peng TL, Wang L, Meng XH, Zhu W, Zeng Y, Zhu JQ, Zhou Y, Xiao HM, Deng HW. Network-based Transcriptome-wide Expression Study for Postmenopausal Osteoporosis. J Clin Endocrinol Metab. 2020 Aug 1;105(8):2678–91. doi: 10.1210/clinem/dgaa319. PMID: 32483604; PMCID: PMC7320836.
[2] Langfelder P, Horvath S. WGCNA: an R package for weighted correlation network analysis. BMC Bioinformatics. 2008 Dec 29;9:559. doi: 10.1186/1471-2105-9-559. PMID: 19114008; PMCID: PMC2631488.