測序行業(yè)的蓬勃發(fā)展脐往,帶來微生物組學(xué)日新月異的變化休吠。目前,單一組學(xué)的文章不斷“貶值”业簿,前沿研究的目光從單一組學(xué)逐步拓展至多組學(xué)對貫穿分析瘤礁,即結(jié)合多個組學(xué)的分析角度,從多個層面闡述生物學(xué)機制梅尤。
微生物多組學(xué)貫穿分析策略十分豐富:如常見的16s與宏基因組貫穿分析柜思,可以驗證物種的特征、豐富功能的探究巷燥;而16s與代謝組的貫穿分析思路同樣常見于高分文章中赡盘,通過16s探究不同處理/環(huán)境下菌群的物種組成變化,結(jié)合代謝組對應(yīng)的代謝物的變化缰揪,進而找到不同處理/環(huán)境下引發(fā)細菌豐度差異最終導(dǎo)致代謝表型差異的機制陨享。參考閱讀《選好思路和方法,給自己一篇多組學(xué)高分文章 》
在16s與代謝組貫穿分析中钝腺,相關(guān)性熱圖是一個重要的分析手段抛姑,主要用于逐一呈現(xiàn)細菌物種與代謝物間的相關(guān)性高低,是篩選潛在關(guān)聯(lián)的物種與代謝物的主要途徑艳狐,對于下游的實驗起到指導(dǎo)意義定硝。此類相關(guān)性熱圖在高分文章中頻繁出現(xiàn),足見其重要性(圖1毫目、圖2)喷斋。
圖1 物種代謝物熱圖(2015,Cell Host& Microbe蒜茴,IF=15.753 )[1]
圖2 物種代謝物熱圖(2018星爪,NatureMedicine,IF=30.641)[2]
那么粉私,該如何畫出此類高分文章中的相關(guān)性熱圖呢顽腾?這里,以16s與代謝組的數(shù)據(jù)為例诺核,向大家分享如何使用R語言進行兩個組學(xué)數(shù)據(jù)的相關(guān)性計算抄肖、繪制相關(guān)性熱圖。
1.加載R包
psych包用于計算相關(guān)性窖杀、p值等信息
library(psych)
pheatmap包用于繪制相關(guān)性熱圖
library(pheatmap)
reshape2包用于輸出數(shù)據(jù)的整合處理
library(reshape2)
2.讀入數(shù)據(jù)
讀取微生物豐度信息表
表頭需帶有分類水平漓摩、物種名稱等關(guān)鍵信息
第一列為樣本名稱信息
phy <-read.table(file = "phy.xls", sep = "t", header = T,row.names= 1)
圖3 微生物豐度信息表格
讀取代謝物信息表
met <-read.table(file = "met.xls", sep = "t", header = T,row.names= 1)
圖4 代謝物豐度信息表格
3.計算相關(guān)性、p值
計算相關(guān)性矩陣(可選:”pearson”入客、”spearman”管毙、”kendall”相關(guān)系數(shù))腿椎、p值矩陣
cor <-corr.test(phy, met, method = "pearson",adjust= "none")
提取相關(guān)性、p值
cmt <-cor$r
pmt <- cor$p
head(cmt)
head(pmt)
4.數(shù)據(jù)保存
輸出相關(guān)系數(shù)表格,第一行為代謝物信息夭咬,第一列為物種信息
cmt.out<-cbind(rownames(cmt),cmt)
write.table(cmt.out,file= "cor.txt",sep= "t",row.names=F)
圖5 相關(guān)性系數(shù)表格
輸出p值表格啃炸,第一行為代謝物信息,第一列為物種信息
pmt.out<-cbind(rownames(pmt),pmt)
write.table(pmt.out,file= "pvalue.txt",sep= "t",row.names=F)
圖6 p值表格
以關(guān)系對的形式輸出表格
第一列為物種名卓舵,第二列為代謝物名南用,第三、第四列對應(yīng)顯示相關(guān)系數(shù)與p值
df <-melt(cmt,value.name= "cor")
df$pvalue <- as.vector(pmt)
head(df)
write.table(df,file= "cor-p.txt",sep= "t")
圖7 關(guān)系對信息
5.繪制顯著性標記
對所有p值進行判斷掏湾,p< 0.01的以“*”標注裹虫,p值 0.01<p< 0.05的以“”標注
if(!is.null(pmt)){
ssmt <- pmt< 0.01
pmt[ssmt] <- '**'
smt <- pmt > 0.01& pmt < 0.05
pmt[smt] <- '*'
pmt[!ssmt&!smt]<- ''
} else{
pmt <- F
}
6.繪制相關(guān)性熱圖
自定義顏色范圍
mycol<-colorRampPalette(c("blue","white","tomato"))(800)
繪制熱圖,可根據(jù)個人需求調(diào)整對應(yīng)參數(shù)
scale=”none” 不對數(shù)據(jù)進行均一化處理 可選 "row", "column"對行、列數(shù)據(jù)進行均一化
cluster_row/col=T 對行或列數(shù)據(jù)進行聚類處理融击,可選F為不聚類
border=NA 各自邊框是否顯示恒界、顏色,可選“white”等增加邊框顏色
number_color=”white” 格子填入的顯著性標記顏色
cellwidth/height=12 格子寬度砚嘴、高度信息
pheatmap(cmt,scale = "none",cluster_row = T, cluster_col = T, border=NA,
display_numbers = pmt,fontsize_number = 12, number_color = "white",
cellwidth = 20, cellheight =20,color=mycol)
圖8 R語言繪制的物種+代謝物相關(guān)性熱圖
圖片保存十酣,代碼中輸入”filename=”,或在R語言軟件中點擊“文件-另存為” 進行保存
pheatmap(cmt,scale = "none",cluster_row = T, cluster_col = T, border=NA,
display_numbers = pmt, fontsize_number = 12, number_color = "white",
cellwidth = 20, cellheight = 20,color=mycol,filename= "heatmap.pdf")
參考文獻
[1]Kostic AD, Gevers D, Siljander H, et al. The dynamics ofthe human infant gut microbiome in development and in progression toward type 1diabetes. Cell Host Microbe. 2015;17(2):260–273.doi:10.1016/j.chom.2015.01.001
[2]Hoyles, Lesleyet al. “Molecular phenomics and metagenomics of hepatic steatosis innon-diabetic obese women.” Nature medicine vol. 24,7 (2018):1070-1080. doi:10.1038/s41591-018-0061-3
原文 https://www.sohu.com/a/366652239_278730