GO富集分析

轉(zhuǎn)錄組分析傳送門

NGS手把手教學(xué)之零基礎(chǔ)RNA-seq轉(zhuǎn)錄組分析實踐,兩套方案(2022年最新)
通路富集分析簡介
GO富集詳解 clusterProfiler包
KEGG富集詳解(待更新)
Reactome富集詳解(待更新)
富集分析結(jié)果可視化大全(待更新)

目錄

  1. GO歸類
  2. GO過表現(xiàn)分析(ORA)
  3. GO 基因集合富集分析(GSEA)
  4. 非模型生物的GO分析
  5. 可視化GO

1. GO歸類

前文提到GO分三種矮燎,molecular function (MF), biological process (BP), and cellular component (CC)琼牧。

clusterProfiler包里,groupGO() 可以用來給基因功能分類蔫仙。本例中用到了DOSE包里提供的數(shù)據(jù)集geneList 料睛。

BiocManager::install("clusterProfiler")
BiocManager::install("org.Hs.eg.db")
library(org.Hs.eg.db)
library(clusterProfiler)
data(geneList, package="DOSE")
gene <- names(geneList)[abs(geneList) > 2]
# Entrez gene ID
head(gene)

顯示gene ID

## [1] "4312"  "8318"  "10874" "55143" "55388" "991"

GO歸類

ggo <- groupGO(gene     = gene, 
               OrgDb    = org.Hs.eg.db,
               ont      = "CC", #也可以是MF,BP
               level    = 3,
               readable = TRUE)
head(ggo)
##                    ID                Description Count GeneRatio geneID
## GO:0000133 GO:0000133                 polarisome     0     0/207       
## GO:0000408 GO:0000408          EKC/KEOPS complex     0     0/207       
## GO:0000417 GO:0000417                HIR complex     0     0/207       
## GO:0000444 GO:0000444    MIS12/MIND type complex     0     0/207       
## GO:0000808 GO:0000808 origin recognition complex     0     0/207       
## GO:0000930 GO:0000930      gamma-tubulin complex     0     0/207

2. GO過表現(xiàn)分析(ORA)

clusterProfiler包的話用enrichGO()就可以

ego <- enrichGO(gene          = gene,
                universe      = names(geneList),
                OrgDb         = org.Hs.eg.db,
                ont           = "CC",
                pAdjustMethod = "BH",
                pvalueCutoff  = 0.01,
                qvalueCutoff  = 0.05,
        readable      = TRUE)
head(ego)
##                    ID                              Description GeneRatio
## GO:0005819 GO:0005819                                  spindle    26/201
## GO:0000779 GO:0000779 condensed chromosome, centromeric region    16/201
## GO:0072686 GO:0072686                          mitotic spindle    17/201
## GO:0000775 GO:0000775           chromosome, centromeric region    18/201
## GO:0098687 GO:0098687                       chromosomal region    23/201
## GO:0000776 GO:0000776                              kinetochore    15/201
##              BgRatio       pvalue     p.adjust       qvalue
## GO:0005819 306/11853 1.072029e-11 3.151766e-09 2.888837e-09
## GO:0000779 114/11853 7.709944e-11 8.659125e-09 7.936756e-09
## GO:0072686 133/11853 8.835841e-11 8.659125e-09 7.936756e-09
## GO:0000775 158/11853 1.684987e-10 1.179661e-08 1.081250e-08
## GO:0098687 272/11853 2.006225e-10 1.179661e-08 1.081250e-08
## GO:0000776 106/11853 2.733425e-10 1.339378e-08 1.227644e-08
##                                                                                                                                                               geneID
## GO:0005819 CDCA8/CDC20/KIF23/CENPE/ASPM/DLGAP5/SKA1/NUSAP1/TPX2/TACC3/NEK2/CDK1/MAD2L1/KIF18A/BIRC5/KIF11/TRAT1/TTK/AURKB/PRC1/KIFC1/KIF18B/KIF20A/AURKA/CCNB1/KIF4A
## GO:0000779                                                             CENPE/NDC80/HJURP/SKA1/NEK2/CENPM/CENPN/ERCC6L/MAD2L1/KIF18A/CDT1/BIRC5/TTK/NCAPG/AURKB/CCNB1
## GO:0072686                                                      KIF23/CENPE/ASPM/SKA1/NUSAP1/TPX2/TACC3/CDK1/MAD2L1/KIF18A/KIF11/TRAT1/AURKB/PRC1/KIFC1/KIF18B/AURKA
## GO:0000775                                                 CDCA8/CENPE/NDC80/TOP2A/HJURP/SKA1/NEK2/CENPM/CENPN/ERCC6L/MAD2L1/KIF18A/CDT1/BIRC5/TTK/NCAPG/AURKB/CCNB1
## GO:0098687                   CDCA8/CENPE/NDC80/TOP2A/HJURP/SKA1/NEK2/CENPM/RAD51AP1/CENPN/CDK1/ERCC6L/MAD2L1/KIF18A/CDT1/BIRC5/EZH2/TTK/NCAPG/AURKB/CHEK1/CCNB1/MCM5
## GO:0000776                                                                   CENPE/NDC80/HJURP/SKA1/NEK2/CENPM/CENPN/ERCC6L/MAD2L1/KIF18A/CDT1/BIRC5/TTK/AURKB/CCNB1
##            Count
## GO:0005819    26
## GO:0000779    16
## GO:0072686    17
## GO:0000775    18
## GO:0098687    23
## GO:0000776    15

只要是數(shù)據(jù)庫OrgDb 支持的gene ID格式都可以直接使用。但是需要在keyType 里指定gene ID的格式摇邦。

gene.df <- bitr(gene, fromType = "ENTREZID",
        toType = c("ENSEMBL", "SYMBOL"),
        OrgDb = org.Hs.eg.db)

ego2 <- enrichGO(gene         = gene.df$ENSEMBL,
                OrgDb         = org.Hs.eg.db,
                keyType       = 'ENSEMBL',
                ont           = "CC",
                pAdjustMethod = "BH",
                pvalueCutoff  = 0.01,
                qvalueCutoff  = 0.05)
head(ego2, 3)
##                    ID                              Description GeneRatio
## GO:0005819 GO:0005819                                  spindle    30/233
## GO:0072686 GO:0072686                          mitotic spindle    21/233
## GO:0000779 GO:0000779 condensed chromosome, centromeric region    17/233
##              BgRatio       pvalue     p.adjust       qvalue
## GO:0005819 422/21916 1.954166e-16 5.413039e-14 4.175744e-14
## GO:0072686 179/21916 3.911063e-16 5.416822e-14 4.178662e-14
## GO:0000779 154/21916 7.525516e-13 6.948560e-11 5.360280e-11
##                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                     geneID
## GO:0005819 ENSG00000134690/ENSG00000117399/ENSG00000137807/ENSG00000138778/ENSG00000066279/ENSG00000126787/ENSG00000154839/ENSG00000262634/ENSG00000137804/ENSG00000088325/ENSG00000013810/ENSG00000117650/ENSG00000170312/ENSG00000164109/ENSG00000121621/ENSG00000089685/ENSG00000138160/ENSG00000163519/ENSG00000112742/ENSG00000178999/ENSG00000198901/ENSG00000237649/ENSG00000233450/ENSG00000056678/ENSG00000204197/ENSG00000186185/ENSG00000112984/ENSG00000087586/ENSG00000134057/ENSG00000090889
## GO:0072686                                                                                                                                                 ENSG00000137807/ENSG00000138778/ENSG00000066279/ENSG00000154839/ENSG00000262634/ENSG00000137804/ENSG00000088325/ENSG00000013810/ENSG00000170312/ENSG00000164109/ENSG00000121621/ENSG00000138160/ENSG00000163519/ENSG00000178999/ENSG00000198901/ENSG00000237649/ENSG00000233450/ENSG00000056678/ENSG00000204197/ENSG00000186185/ENSG00000087586
## GO:0000779                                                                                                                                                                                                                 ENSG00000138778/ENSG00000080986/ENSG00000123485/ENSG00000154839/ENSG00000262634/ENSG00000117650/ENSG00000100162/ENSG00000166451/ENSG00000186871/ENSG00000164109/ENSG00000121621/ENSG00000167513/ENSG00000089685/ENSG00000112742/ENSG00000109805/ENSG00000178999/ENSG00000134057
##            Count
## GO:0005819    30
## GO:0072686    21
## GO:0000779    17

3. GO 基因集合富集分析(Gene Set Enrichment Analysis, GSEA)

gseGO() 可以實現(xiàn)GSEA分析恤煞。

ego3 <- gseGO(geneList     = geneList,
              OrgDb        = org.Hs.eg.db,
              ont          = "CC",
              minGSSize    = 100,
              maxGSSize    = 500,
              pvalueCutoff = 0.05,
              verbose      = FALSE)

4. 非模型生物的GO分析

如果需要處理非模型生物也就是沒有OrgDb 的時候可以自己通過AnnotationHub搜索到自己需要的數(shù)據(jù)庫。如果實在沒有的話可以用biomaRt或者 Blast2GO來獲取GO注釋施籍。又或者用AnnotationForge 直接創(chuàng)建一個自己的數(shù)據(jù)庫居扒。

5. 可視化GO

p值,關(guān)系網(wǎng)絡(luò)丑慎,參與程度都會有顯示出來喜喂。

goplot(ego)
Fig1.png
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末瓤摧,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子玉吁,更是在濱河造成了極大的恐慌照弥,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,324評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件进副,死亡現(xiàn)場離奇詭異产喉,居然都是意外死亡,警方通過查閱死者的電腦和手機敢会,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,356評論 3 392
  • 文/潘曉璐 我一進店門曾沈,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人鸥昏,你說我怎么就攤上這事塞俱。” “怎么了吏垮?”我有些...
    開封第一講書人閱讀 162,328評論 0 353
  • 文/不壞的土叔 我叫張陵障涯,是天一觀的道長。 經(jīng)常有香客問我膳汪,道長唯蝶,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,147評論 1 292
  • 正文 為了忘掉前任遗嗽,我火速辦了婚禮粘我,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘痹换。我一直安慰自己征字,他們只是感情好,可當我...
    茶點故事閱讀 67,160評論 6 388
  • 文/花漫 我一把揭開白布娇豫。 她就那樣靜靜地躺著匙姜,像睡著了一般。 火紅的嫁衣襯著肌膚如雪冯痢。 梳的紋絲不亂的頭發(fā)上氮昧,一...
    開封第一講書人閱讀 51,115評論 1 296
  • 那天,我揣著相機與錄音浦楣,去河邊找鬼袖肥。 笑死,一個胖子當著我的面吹牛椒振,可吹牛的內(nèi)容都是我干的昭伸。 我是一名探鬼主播梧乘,決...
    沈念sama閱讀 40,025評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼澎迎,長吁一口氣:“原來是場噩夢啊……” “哼庐杨!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起夹供,我...
    開封第一講書人閱讀 38,867評論 0 274
  • 序言:老撾萬榮一對情侶失蹤灵份,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后哮洽,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體填渠,經(jīng)...
    沈念sama閱讀 45,307評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,528評論 2 332
  • 正文 我和宋清朗相戀三年鸟辅,在試婚紗的時候發(fā)現(xiàn)自己被綠了氛什。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,688評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡匪凉,死狀恐怖枪眉,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情再层,我是刑警寧澤贸铜,帶...
    沈念sama閱讀 35,409評論 5 343
  • 正文 年R本政府宣布,位于F島的核電站聂受,受9級特大地震影響蒿秦,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜蛋济,卻給世界環(huán)境...
    茶點故事閱讀 41,001評論 3 325
  • 文/蒙蒙 一棍鳖、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧碗旅,春花似錦鹊杖、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,657評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至川尖,卻和暖如春登下,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背叮喳。 一陣腳步聲響...
    開封第一講書人閱讀 32,811評論 1 268
  • 我被黑心中介騙來泰國打工被芳, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人馍悟。 一個月前我還...
    沈念sama閱讀 47,685評論 2 368
  • 正文 我出身青樓畔濒,卻偏偏與公主長得像,于是被迫代替她去往敵國和親锣咒。 傳聞我的和親對象是個殘疾皇子侵状,可洞房花燭夜當晚...
    茶點故事閱讀 44,573評論 2 353

推薦閱讀更多精彩內(nèi)容