相信大家對(duì)Y叔的clusterprofiler這個(gè)R包并不陌生梗夸,一般做基因富集分析的時(shí)候都會(huì)用到這個(gè)R包。這個(gè)包非常實(shí)用反症,并且畫(huà)出來(lái)的圖也很不錯(cuò)。
其實(shí)小編前面已經(jīng)花了不少篇幅給大家介紹過(guò)如何使用這個(gè)R包做GO富集分析和結(jié)果可視化铅碍,以及如何將富集結(jié)果中的gene ID轉(zhuǎn)成基因名字
?GO富集分析四種風(fēng)格展示結(jié)果—柱形圖,氣泡圖
還有計(jì)算富集倍數(shù)的三種方法
?GO和KEGG富集倍數(shù)(Fold Enrichment)如何計(jì)算
對(duì)于沒(méi)有太多基礎(chǔ)的小伙伴胞谈,小編還特地錄制了視頻進(jìn)行了詳細(xì)的講解
當(dāng)然使用clusterprofiler這個(gè)R包也可以進(jìn)行KEGG富集分析
當(dāng)然小編也將以上所有內(nèi)容整理成了一個(gè)系統(tǒng)的線上課程
我們知道一般做富集分析径密,都需要有一個(gè)注釋數(shù)據(jù)庫(kù)。里面存放了對(duì)每個(gè)基因的注釋信息享扔,告訴我們這個(gè)基因?qū)儆谀且粭lKEGG通過(guò)植袍,參與到那些生物學(xué)過(guò)程(BP)籽懦,有那些生物學(xué)功能(MF)以及屬于哪一種細(xì)胞成分(CC)。一般我們對(duì)人這個(gè)物種中的基因做富集分析的時(shí)候猫十,都會(huì)用到org.Hs.eg.db這個(gè)注釋數(shù)據(jù)庫(kù),Hs代表的是human拖云。小編也討論過(guò)如何安裝這個(gè)注釋數(shù)據(jù)庫(kù)。?加載R包org.Hs.eg.db出錯(cuò)宙项,避坑指南!
library(org.Hs.eg.db)
library(clusterProfiler)
ego <- enrichGO(gene = DEG,
OrgDb=org.Hs.eg.db,
ont = "all",
pAdjustMethod = "BH",
minGSSize = 10,
pvalueCutoff = 0.01,
qvalueCutoff = 0.01,
keyType='ENSEMBL')
那么問(wèn)題來(lái)了尤筐,對(duì)于其他的物種,如小鼠盆繁,大鼠,線蟲(chóng)等等油昂,其他物種的注釋文件該如何獲取呢?
可以從下面這個(gè)網(wǎng)頁(yè)中查找冕碟,每一行代表一個(gè)物種的注釋文件。
http://bioconductor.org/packages/release/BiocViews.html#___OrgDb
在做分析的時(shí)候我們只需要將代碼中的org.Hs.eg.db更換成相應(yīng)的物種的注釋文件就可以了安寺,例如我們換成小鼠的
library(org.Mm.eg.db)
library(clusterProfiler)
ego <- enrichGO(gene = DEG,
OrgDb=org.Mm.eg.db,
ont = "all",
pAdjustMethod = "BH",
minGSSize = 10,
pvalueCutoff = 0.01,
qvalueCutoff = 0.01,
keyType='ENSEMBL')
參考資料:
?GO富集分析四種風(fēng)格展示結(jié)果—柱形圖,氣泡圖
?GO和KEGG富集倍數(shù)(Fold Enrichment)如何計(jì)算