出發(fā)點
源自Large-scale proteomic analysis of Alzheimer’s disease brain and cerebrospinal fluid reveals early changes in energy metabolism associated with microglia and astrocyte activation 這篇文章中的一幅圖,顯示如下辐益,想做類似的分析圖被济。
初步思考:
-
第一幅圖(b圖)基本上就是WGCNA分析結(jié)果中基因模塊與性狀的相關(guān)性熱圖畜号。不同點在于XY軸的擺放位置、基因模塊的功能注釋簇抵,以及上圖的熱圖展示時部分展示的是相關(guān)性/部分展示的是P值庆杜,但從整體上來看,是可以復制的碟摆,難度不是很大晃财。首先針對每個基因模塊進行功能富集分析,完成對基因模塊的功能注釋。然后構(gòu)建樣本和基因模塊的表達矩陣(關(guān)鍵函數(shù)moduleEigengenes断盛,返回值Eigengenes)罗洗,接著構(gòu)建樣本與性狀的矩陣,最后計算模塊與性狀的相關(guān)性钢猛。
第二幅圖(c圖)伙菜,從圖注上來看,展示的是不同分組條件下Eigenprotein value(其實就是Eigengenes值)的差異命迈,繪制這個圖也應該可以贩绕。
具體過程如下:
實現(xiàn)以上分析的重點步驟在第六步—模塊與性狀關(guān)聯(lián)
相關(guān)系數(shù)只能計算對應的兩列,而表達矩陣是一個表格壶愤,而非一列淑倾。方法是對一個模塊里的基因表達矩陣進行主成分分析,用第一個主成分(PC1)的的指標--特征向量(ME)代表一個模塊征椒,得到模塊MEs矩陣娇哆。
Module eigengene E: 給定模型的第一主成分,代表整個模型的基因表達譜勃救。這個是個很巧妙的梳理迂尝,我們之前講過PCA分析的降維作用,之前主要是拿來做可視化剪芥,現(xiàn)在用到這個地方垄开,很好的用一個向量代替了一個矩陣,方便后期計算税肪。
WGNCA包中moduleEigengenes()函數(shù)用于計算ME矩陣溉躲,選擇每個ME的PC1來表示,函數(shù)返回值eigengenes即返回的Samples與ME-PC1的表達矩陣(如下圖)益兄。
這個ME矩陣加上樣本的分組信息锻梳,就可以繪制如下這樣的圖。橫坐標為分組信息净捅,縱坐標為eigengenes值疑枯。
- 樣本與性狀之間的匯總表如下:
函數(shù)cor()和corPvalueStudent()可以計算每個模塊的特征向量與性狀之間的相關(guān)系數(shù)和P值,形成一個矩陣蛔六,可做熱圖荆永。
這里需要注意的是,繪圖前對每個基因模塊進行功能富集分析国章,根據(jù)富集結(jié)果完成每個模塊的功能注釋具钥。
總結(jié):該分析過程中的關(guān)鍵函數(shù)如下:
MEs0 = moduleEigengenes(datExpr, moduleColors)$eigengenes #計算eigengenes值
MEs = orderMEs(MEs0)
moduleTraitCor = cor(MEs, design , use = "p") #計算相關(guān)性
moduleTraitPvalue = corPvalueStudent(moduleTraitCor, nSamples) #計算P值
本文在于思考文中圖片如何重現(xiàn),對WGCNA分析有了解的小伙伴液兽,應該知道文中圖b是非常常見的形式骂删,特別的是:基因模塊通過富集分析完成功能注釋,可以更直觀出這些性狀和哪些基因模塊有關(guān),這些相關(guān)的基因模塊發(fā)揮的功能又是什么宁玫!而圖c是在常規(guī)WGCNA結(jié)果中不常見的粗恢,但其實它就是分析的中間過程,往往容易被忽視欧瘪。
往期回顧
R繪圖 | Cell-Type Enrichment分析探索
R繪圖|韋恩圖的常見繪制方法
R繪圖|ggplot2火山圖的繪制
R繪圖|ggplot2散點圖的繪制
R繪圖|pheatmap熱圖繪制——基礎(chǔ)篇
R繪圖|pheatmap熱圖繪制——中階篇
R繪圖|pheatmap熱圖繪制——高階篇