GO和KEGG富集倍數(shù)(Fold Enrichment)如何計算

前面我們簡單介紹過ggplot2畫KEGG富集柱形圖,其實GO富集結(jié)果的展示相對于KEGG來說要復雜一點點,因為GO又進一步可以劃分成三個類暖夭。

BP:biological process,生物學過程论矾。

MF:molecular function,分子功能我擂。

CC:cellular component, 細胞成分阱洪。

因此在畫圖的時候侮腹,我們需要將這三類給區(qū)分開來又厉。下面分別用了三種不同的方式來展示GO富集分析的結(jié)果九府。

圖1:橫軸為富集到每個GO條目上面的基因數(shù)目
圖2: 橫軸為GeneRatio
圖3:橫軸為Fold enrichment(富集倍數(shù))

下面我們結(jié)合富集分析的結(jié)果表,來分別解釋一下這三張圖中橫坐標的具體含義覆致。

首先來看看這張表中每一列所代表的含義

ONTOLOGY:區(qū)分是BP侄旬,MF還是CC
ID:具體的GO條目的ID號
Description:GO條目的描述
GeneRatio:這里是一個分數(shù),分子是富集到這個GO條目上的gene的數(shù)目煌妈,
            分母是所有輸入的做富集分析的gene的數(shù)目儡羔,可以是差異表達
            分析得到的gene
BgRatio:Background Ratio. 這里也是一個分數(shù)宣羊,分母是人的所有編碼蛋白的
        基因中有GO注釋的gene的數(shù)目,這里是19623個汰蜘,分子是這19623個
        gene中注釋到這個GO條目上面的gene的數(shù)目
pvalue:富集的p值
p.adjust:校正之后的p值
qvalue:q值
geneID:輸入的做富集分析的gene中富集到這個GO條目上面的具體的
        gene名字
Count:輸入的做富集分析的gene中富集到這個GO條目上面的gene的數(shù)目

這張表里面沒有提到富集倍數(shù)(fold enrichment)

fold enrichment = GeneRatio / BgRatio

那么我們就很容易理解上面三張圖的橫坐標了仇冯,分別為Count,GeneRatio和Fold enrichment族操。

那么問題來了苛坚,既然這張表里面沒有Fold enrichment,那么我們?nèi)绾斡嬎愀患稊?shù)呢色难?

下面小編給大家介紹三種方法來計算Fold enrichment泼舱,任君挑選

1.利用eval直接做計算

kegg=read.csv("KEGG-enrich.csv",stringsAsFactors = F)
?
enrichment_fold=apply(kegg,1,function(x){
  GeneRatio=eval(parse(text=x["GeneRatio"]))
  BgRatio=eval(parse(text=x["BgRatio"]))
  enrichment_fold=round(GeneRatio/BgRatio,2)
  enrichment_fold
})

2.利用strsplit按/分割成分子和分母

kegg=read.csv("KEGG-enrich.csv",stringsAsFactors = F)
fenshu2xiaoshu<-function(ratio){
  sapply(ratio,function(x) as.numeric(strsplit(x,"/")[[1]][1])/as.numeric(strsplit(x,"/")[[1]][2]))
}
enrichment_fold=fenshu2xiaoshu(kegg$GeneRatio)/fenshu2xiaoshu(kegg$BgRatio)
enrichment_fold=as.numeric(enrichment_fold)

3. 利用gsub替換,得到分子和分母

kegg=read.csv("KEGG-enrich.csv",stringsAsFactors = F)
fenshu2xiaoshu2<-function(ratio){
  sapply(ratio,function(x) as.numeric(gsub("/.*$","",x))/as.numeric(gsub("^.*/","",x)))
}
enrichment_fold=fenshu2xiaoshu2(kegg$GeneRatio)/fenshu2xiaoshu2(kegg$BgRatio)
enrichment_fold=as.numeric(enrichment_fold)

參看下面這篇文章獲取獲取KEGG-enrich.csv

GO和KEGG富集倍數(shù)(Fold Enrichment)如何計算?

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末莱预,一起剝皮案震驚了整個濱河市柠掂,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌依沮,老刑警劉巖涯贞,帶你破解...
    沈念sama閱讀 216,372評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異危喉,居然都是意外死亡宋渔,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評論 3 392
  • 文/潘曉璐 我一進店門辜限,熙熙樓的掌柜王于貴愁眉苦臉地迎上來皇拣,“玉大人,你說我怎么就攤上這事薄嫡⊙跫保” “怎么了?”我有些...
    開封第一講書人閱讀 162,415評論 0 353
  • 文/不壞的土叔 我叫張陵毫深,是天一觀的道長吩坝。 經(jīng)常有香客問我,道長哑蔫,這世上最難降的妖魔是什么钉寝? 我笑而不...
    開封第一講書人閱讀 58,157評論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮闸迷,結(jié)果婚禮上嵌纲,老公的妹妹穿的比我還像新娘。我一直安慰自己腥沽,他們只是感情好逮走,可當我...
    茶點故事閱讀 67,171評論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著今阳,像睡著了一般言沐。 火紅的嫁衣襯著肌膚如雪邓嘹。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,125評論 1 297
  • 那天险胰,我揣著相機與錄音汹押,去河邊找鬼。 笑死起便,一個胖子當著我的面吹牛棚贾,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播榆综,決...
    沈念sama閱讀 40,028評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼妙痹,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了鼻疮?” 一聲冷哼從身側(cè)響起怯伊,我...
    開封第一講書人閱讀 38,887評論 0 274
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎判沟,沒想到半個月后耿芹,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,310評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡挪哄,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,533評論 2 332
  • 正文 我和宋清朗相戀三年吧秕,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片迹炼。...
    茶點故事閱讀 39,690評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡砸彬,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出斯入,到底是詐尸還是另有隱情砂碉,我是刑警寧澤,帶...
    沈念sama閱讀 35,411評論 5 343
  • 正文 年R本政府宣布刻两,位于F島的核電站增蹭,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏闹伪。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,004評論 3 325
  • 文/蒙蒙 一壮池、第九天 我趴在偏房一處隱蔽的房頂上張望偏瓤。 院中可真熱鬧,春花似錦椰憋、人聲如沸厅克。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽证舟。三九已至硕旗,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間女责,已是汗流浹背漆枚。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評論 1 268
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留抵知,地道東北人墙基。 一個月前我還...
    沈念sama閱讀 47,693評論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像刷喜,于是被迫代替她去往敵國和親残制。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,577評論 2 353

推薦閱讀更多精彩內(nèi)容