還是老習(xí)慣,給出官網(wǎng)教程感帅,至于你是看還是不看,它就在那里,等著你的深入研究~
https://horvath.genetics.ucla.edu/html/CoexpressionNetwork/Rpackages/WGCNA/Tutorials/
往期教程:
(一)WGCNA分析中的軟閾值
WGCNA分析圖文詳解專題中要解釋的第三張圖,所有結(jié)果中最主要的結(jié)果圖恐怕就是這張了:
官方注釋:
Figure 1: Module-trait associations. Each row corresponds to a module eigengene, column to a trait. Each cell?contains the corresponding correlation and p-value. The table is color-coded by correlatio according to the color?legend.
這張圖有這幾個部分:
1饼酿,橫坐標(biāo):表型性狀(trait)榕酒。那么胚膊,根據(jù)表型性狀是連續(xù)型變量和分類變量如何數(shù)值化?
2想鹰,縱坐標(biāo):對應(yīng)模塊紊婉,用每個模塊的eigengene來表示這個模塊。那么eigengene又是什么辑舷,怎么理解這個eigengene呢喻犁?
3,圖中的小格子:其中的數(shù)值代表什么何缓?
4肢础,每個性狀與模塊之間的相關(guān)性計算是否獨立的:即表型放在一起分析和分開單獨分析是否有不同?
小面我們來一一解讀碌廓。如有理解錯誤传轰,還請各位大俠批評指正。
1氓皱,橫坐標(biāo):表型性狀(trait)
教程中的數(shù)據(jù)如上圖路召,行代表樣本,列代表性狀重量weight(g)波材,長度length(cm)等股淡。總共有134個樣本廷区,26個性狀唯灵。
這里我截取了一小部分進行展示,一列代表一個性狀隙轻。重量和長度都是連續(xù)性變量埠帕,直接用就好。分類變量如男女玖绿,可以男1敛瓷,女0進行數(shù)值化。
2斑匪,縱坐標(biāo):對應(yīng)模塊的eigengene
官網(wǎng)給出的解釋是這個樣子的:
Eigengene呐籽,即每個模塊的第一主成分。
這里小編自己的理解就是這個模塊有134個樣本蚀瘸,n個基因狡蝶,然后用pca主成分分析對這n個基因進行降維取其第一主成分作為這個模塊的特征。
3贮勃,圖中的小格子中的數(shù)值代表什么贪惹?
這里我們得到橫坐標(biāo)的表型性狀向量和縱坐標(biāo)的每個模塊的特征代表eigengene值向量,然后就可以計算每個模塊和性狀之間的相關(guān)性了寂嘉。我們知道計算兩個向量之間的相關(guān)性有三種方法:"pearson", "kendall", "spearman"奏瞬。
官方這里采用的pearson計算方法枫绅。
核心代碼:moduleTraitCor = cor(MEs, datTraits, use = "p")
嗯,用的cor函數(shù)丝格。默認(rèn)的method=”pearson”撑瞧。那么這里圖中的小格子中的數(shù)值就代表每個性狀和每個模塊的特征值之間兩兩計算的相關(guān)性值以及對應(yīng)的pvalue棵譬。
顏色表示紅色越深显蝌,越正相關(guān);綠色越深订咸,越負(fù)相關(guān)曼尊。并且,在這里你如果理解了這個相關(guān)性的計算脏嚷,那么應(yīng)該就可以理解不同性狀之間與模塊計算相關(guān)性時是相互獨立的骆撇。
?重點,敲黑板8感稹I窠肌!
這個圖說難也不難趾唱,但是涌乳,卻是整個WGCNA分析的最主要的結(jié)果了。有個地方很關(guān)鍵甜癞,就是將臨床表型轉(zhuǎn)換為數(shù)值的trait的時候夕晓,直接涉及到了后面相關(guān)性的計算。如果轉(zhuǎn)換不合理很可能得到不好的結(jié)果喲悠咱。
今天就說到這里蒸辆,歡迎大家留言討論。我們下期再見~
參考資料:
1,https://horvath.genetics.ucla.edu/html/CoexpressionNetwork/Rpackages/WGCNA/Tutorials/
2,AGeneral Framework for Weighted Gene Co-Expression Network Analysis,?Stat Appl Genet Mol Biol.?2005;4:Article17. Epub 2005 Aug 12