GOstats: 麻瓜一鍵分析 GO/KEGG 富集情況

本菜甚至是不好意思PO這篇


Tools for manipulating GO and microarrays

Falcon S, Gentleman R (2007). “Using GOstats to test gene lists for GO term association.” Bioinformatics, 23(2), 257-8.

1. 標(biāo)準(zhǔn)開頭

關(guān)于 GOstats 涌穆,又是真の大佬寫的包飒筑。

包里有一系列能分析 GO 和微陣列數(shù)據(jù)的工具, 可以通過超幾何分布檢驗的方法分析 GO/KEGG 的富集情況檬果。

2. GO 富集分析

2.1 設(shè)置參數(shù)

構(gòu)建 GOHyperGParams 實例前仓洼,需要設(shè)置以下參數(shù):

geneIds: 所選擇的基因 ID.

universeGeneIds: 全部基因 ID.

annotation: 所對應(yīng)的注釋包名稱。

ontology: GO 分類门驾,即 BP, CC, MF. 每次檢測只能輸入一個位谋。

pvalueCutoff: p 值。

conditional: TRUE-條件超幾何檢驗,F(xiàn)ALSE-標(biāo)準(zhǔn)超幾何檢驗

testDirection: “over” or “under”

params <- new("GOHyperGParams",
              geneIds = genes, 
              universeGeneIds = universe, 
              annotation = "org.Hs.eg.db",
              ontology = "MF", 
              pvalueCutoff = 0.05, 
              conditional = FALSE, 
              testDirection = "over")

2.2 hyperGTest()

輸入前面構(gòu)建的 params 基矮,一步得到分析結(jié)果:

hgOver <- hyperGTest(params)
hgOver
# Gene to GO MF  test for over-representation 
# 996 GO MF ids tested (502 have p < 0.05)
# Selected gene set size: 411 
#     Gene universe size: 16969 
#     Annotation package: org.Hs.eg 
head(summary(hgOver))
#       GOMFID       Pvalue OddsRatio  ExpCount Count Size
# 1 GO:0019829 2.761450e-32  89.30268 0.8961636    25   37
# 2 GO:0022853 7.895069e-32  82.42826 0.9203842    25   38
# 3 GO:0042625 7.895069e-32  82.42826 0.9203842    25   38
# 4 GO:0042626 1.021258e-30  38.01563 1.5016795    29   62
# 5 GO:0043492 1.558530e-30  33.35150 1.6712240    30   69
# 6 GO:0015399 3.001251e-29  32.15539 1.6470034    29   68
#                                                               Term
# 1                              cation-transporting ATPase activity
# 2                    active ion transmembrane transporter activity
# 3            ATPase coupled ion transmembrane transporter activity
# 4 ATPase activity, coupled to transmembrane movement of substances
# 5               ATPase activity, coupled to movement of substances
# 6                primary active transmembrane transporter activity

3. KEGG 富集分析

整個流程都和 GO 分析如出一轍淆储,稍微變一下對象和參數(shù)即可。

3.1 設(shè)置參數(shù)

需設(shè)置參數(shù): geneIds, universeGeneIds, annotation, pvalueCutoff, testDirection.

params2 <- new("KEGGHyperGParams",
               geneIds = genes, 
               universeGeneIds = universe, 
               annotation = "org.Hs.eg.db",
               pvalueCutoff = 0.05, 
               testDirection = "over")

3.2 hyperGTest()

kOver <- hyperGTest(params2)
kOver
# Gene to KEGG  test for over-representation 
# 175 KEGG ids tested (65 have p < 0.05)
# Selected gene set size: 282 
#     Gene universe size: 5077 
#     Annotation package: org.Hs.eg
head(summary(kOver))
#   KEGGID       Pvalue OddsRatio  ExpCount Count Size
# 1  04970 2.204029e-18 11.154157  4.276367    30   89
# 2  01100 2.703714e-17  3.052904 54.295451   114 1130
# 3  00071 4.028679e-17 20.352665  2.066110    21   43
# 4  00280 3.631982e-13 14.583042  2.114159    18   44
# 5  04972 6.256463e-13  7.464167  4.852956    26  101
# 6  04976 6.176347e-12  8.910115  3.411484    21   71
#                                         Term
# 1                         Salivary secretion
# 2                         Metabolic pathways
# 3                     Fatty acid degradation
# 4 Valine, leucine and isoleucine degradation
# 5                       Pancreatic secretion
# 6                             Bile secretion

所以 hyperGTest() 就是一個讓人不明原理但又有很酷炫輸出的傻瓜黑箱函數(shù)家浇。


最后本砰,向大家隆重推薦生信技能樹的一系列干貨!

  1. 生信技能樹全球公益巡講:https://mp.weixin.qq.com/s/E9ykuIbc-2Ja9HOY0bn_6g
  2. B站公益74小時生信工程師教學(xué)視頻合輯:https://mp.weixin.qq.com/s/IyFK7l_WBAiUgqQi8O7Hxw
  3. 招學(xué)徒:https://mp.weixin.qq.com/s/KgbilzXnFjbKKunuw7NVfw
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末钢悲,一起剝皮案震驚了整個濱河市点额,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌莺琳,老刑警劉巖还棱,帶你破解...
    沈念sama閱讀 216,372評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異惭等,居然都是意外死亡珍手,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評論 3 392
  • 文/潘曉璐 我一進(jìn)店門辞做,熙熙樓的掌柜王于貴愁眉苦臉地迎上來琳要,“玉大人,你說我怎么就攤上這事秤茅≈刹梗” “怎么了?”我有些...
    開封第一講書人閱讀 162,415評論 0 353
  • 文/不壞的土叔 我叫張陵框喳,是天一觀的道長课幕。 經(jīng)常有香客問我,道長帖努,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,157評論 1 292
  • 正文 為了忘掉前任粪般,我火速辦了婚禮拼余,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘亩歹。我一直安慰自己匙监,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,171評論 6 388
  • 文/花漫 我一把揭開白布小作。 她就那樣靜靜地躺著亭姥,像睡著了一般。 火紅的嫁衣襯著肌膚如雪顾稀。 梳的紋絲不亂的頭發(fā)上达罗,一...
    開封第一講書人閱讀 51,125評論 1 297
  • 那天,我揣著相機與錄音,去河邊找鬼粮揉。 笑死巡李,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的扶认。 我是一名探鬼主播侨拦,決...
    沈念sama閱讀 40,028評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼辐宾!你這毒婦竟也來了狱从?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,887評論 0 274
  • 序言:老撾萬榮一對情侶失蹤叠纹,失蹤者是張志新(化名)和其女友劉穎季研,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體吊洼,經(jīng)...
    沈念sama閱讀 45,310評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡训貌,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,533評論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了冒窍。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片递沪。...
    茶點故事閱讀 39,690評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖综液,靈堂內(nèi)的尸體忽然破棺而出款慨,到底是詐尸還是另有隱情,我是刑警寧澤谬莹,帶...
    沈念sama閱讀 35,411評論 5 343
  • 正文 年R本政府宣布檩奠,位于F島的核電站,受9級特大地震影響附帽,放射性物質(zhì)發(fā)生泄漏埠戳。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,004評論 3 325
  • 文/蒙蒙 一蕉扮、第九天 我趴在偏房一處隱蔽的房頂上張望整胃。 院中可真熱鬧,春花似錦喳钟、人聲如沸屁使。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽蛮寂。三九已至,卻和暖如春易茬,著一層夾襖步出監(jiān)牢的瞬間酬蹋,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評論 1 268
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留除嘹,地道東北人写半。 一個月前我還...
    沈念sama閱讀 47,693評論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像尉咕,于是被迫代替她去往敵國和親叠蝇。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,577評論 2 353