clusterProfiler 是一個在 R 語言中用于功能注釋分析和可視化的強大工具吗氏。它提供了多種方法來分析和解釋高通量生物學(xué)數(shù)據(jù)集晌该。gseKEGG 和 enrichKEGG 是 clusterProfiler 包中的兩個主要函數(shù)虹菲,用于不同類型的分析憋肖。以下是它們在用法和結(jié)果上的主要區(qū)別:
用法
enrichKEGG:
目標(biāo): KEGG 通路富集分析。
輸入: 一個基因列表胰苏,通常是差異表達(dá)的基因列表硕蛹。
方法: 采用超幾何檢驗或其他統(tǒng)計方法,評估在給定基因列表中,某個 KEGG 通路是否顯著富集法焰。
示例代碼:
library(clusterProfiler)
library(org.Hs.eg.db) # 人類基因注釋數(shù)據(jù)庫
gene_list <- c("gene1", "gene2", "gene3", ...) # 你的基因列表
enrich_result <- enrichKEGG(gene = gene_list, organism = 'hsa')
gseKEGG:
目標(biāo): KEGG 基因集富集分析 (GSEA)僵腺。
輸入: 排序的基因列表,通澈埃基于基因表達(dá)變化的大小排序辰如。
方法: 采用基因集富集分析(GSEA),評估在整個基因排序列表中贵试,某個 KEGG 通路是否顯著富集琉兜。
示例代碼:
library(clusterProfiler)
library(org.Hs.eg.db) # 人類基因注釋數(shù)據(jù)庫
gene_list <- sort(c("gene1" = 1.5, "gene2" = -2.0, "gene3" = 0.5, ...), decreasing = TRUE) # 排序的基因列表
gse_result <- gseKEGG(geneList = gene_list, organism = 'hsa')
結(jié)果
enrichKEGG 的結(jié)果:
返回一個包含顯著富集 KEGG 通路的信息表格。
主要輸出包括通路 ID毙玻、描述豌蟋、富集的基因數(shù)、背景基因數(shù)桑滩、p 值梧疲、調(diào)整后的 p 值等。
可以通過 barplot, dotplot, cnetplot 等函數(shù)進行可視化运准。
gseKEGG 的結(jié)果:
返回一個包含顯著富集 KEGG 通路的信息表格幌氮,以及富集得分(ES)、歸一化富集得分(NES)胁澳、p 值该互、調(diào)整后的 p 值等。
結(jié)果還包含每個通路在基因排序列表中的富集曲線韭畸。
可以通過 gseaplot, ridgeplot, cnetplot 等函數(shù)進行可視化宇智。
主要區(qū)別
分析方法:
enrichKEGG 適用于特定基因列表,使用超幾何檢驗等方法檢測顯著富集的通路胰丁。
gseKEGG 適用于排序的基因列表随橘,使用基因集富集分析(GSEA)檢測顯著富集的通路。
輸入類型:
enrichKEGG 需要一個基因列表锦庸。
gseKEGG 需要一個排序的基因列表机蔗。
結(jié)果解讀:
enrichKEGG 結(jié)果中每個通路的顯著性是基于輸入基因列表中的富集情況。
gseKEGG 結(jié)果中每個通路的顯著性是基于整個排序基因列表中的富集情況酸员。
總結(jié)來說蜒车,enrichKEGG 更適合于分析已經(jīng)篩選出的差異表達(dá)基因,而 gseKEGG 更適合于分析整個基因表達(dá)變化的排序列表幔嗦。這兩個函數(shù)提供了不同角度的功能注釋分析酿愧,可以互補使用。