GOplot 可視化基因富集分析結(jié)果

GOplot

GOplot 包通過封裝好的函數(shù)可視化基因功能分析結(jié)果。


#1. 安裝

install.packages('GOplot')

#2. GOplot 內(nèi)置數(shù)據(jù)

##2.1 腦和心臟內(nèi)皮細胞的轉(zhuǎn)錄組數(shù)據(jù)

  • 來自文章Nolan et al. 2013绢要,GEO accession: GSE47067.
Name Description Dimension
EC$eset Data frame of normalized expression values of brain and heart endothelial cells (3 replicates) 20644 x 7
EC$genelist Data frame of differentially expressed genes (adjusted p-value < 0.05) 2039 x 7
EC$david Data frame of results from a functional analysis of the differentially expressed genes performed with DAVID 174 x 5
EC$genes Data frame of selected genes with logFC 37 x 2
EC$process Character vector of selected enriched biological processes 7

##2.2 查看內(nèi)置數(shù)據(jù)格式

  • 導(dǎo)入數(shù)據(jù)
library(GOplot)
data(EC)
  • 基因富集結(jié)果查看
head(EC$david)
##   Category         ID                             Term
## 1       BP GO:0007507                heart development
## 2       BP GO:0001944          vasculature development
## 3       BP GO:0001568         blood vessel development
## 4       BP GO:0048729             tissue morphogenesis
## 5       BP GO:0048514       blood vessel morphogenesis
## 6       BP GO:0051336 regulation of hydrolase activity
##                                                                                                                                                                                                                                                                                                                                                                              Genes
## 1       DLC1, NRP2, NRP1, EDN1, PDLIM3, GJA1, TTN, GJA5, ZIC3, TGFB2, CERKL, GATA6, COL4A3BP, GAB1, SEMA3C, MKL2, SLC22A5, MB, PTPRJ, RXRA, VANGL2, MYH6, TNNT2, HHEX, MURC, MIB1, FOXC2, FOXC1, ADAM19, MYL2, TCAP, EGLN1, SOX9, ITGB1, CHD7, HEXIM1, PKD2, NFATC4, PCSK5, ACTC1, TGFBR2, NF1, HSPG2, SMAD3, TBX1, TNNI3, CSRP3, FOXP1, KCNJ8, PLN, TSC2, ATP6V0A1, TGFBR3, HDAC9
## 2 GNA13, ACVRL1, NRP1, PGF, IL18, LEPR, EDN1, GJA1, FOXO1, GJA5, TGFB2, WARS, CERKL, APOE, CXCR4, ANG, SEMA3C, NOS2, MKL2, FGF2, RAPGEF1, PTPRJ, RECK, EFNB2, VASH1, PNPLA6, THY1, MIB1, NUS1, FOXC2, FOXC1, CAV1, CDH2, MEIS1, WT1, CDH5, PTK2, FBXW8, CHD7, PLCD1, PLXND1, FIGF, PPAP2B, MAP2K1, TBX4, TGFBR2, NF1, TBX1, TNNI3, LAMA4, MEOX2, ECSCR, HBEGF, AMOT, TGFBR3, HDAC7
## 3        GNA13, ACVRL1, NRP1, PGF, IL18, LEPR, EDN1, GJA1, FOXO1, GJA5, TGFB2, WARS, CERKL, APOE, CXCR4, ANG, SEMA3C, NOS2, MKL2, FGF2, RAPGEF1, PTPRJ, RECK, VASH1, PNPLA6, THY1, MIB1, NUS1, FOXC2, FOXC1, CAV1, CDH2, MEIS1, WT1, CDH5, PTK2, FBXW8, CHD7, PLCD1, PLXND1, FIGF, PPAP2B, MAP2K1, TBX4, TGFBR2, NF1, TBX1, TNNI3, LAMA4, MEOX2, ECSCR, HBEGF, AMOT, TGFBR3, HDAC7
## 4                                   DLC1, ENAH, NRP1, PGF, ZIC2, TGFB2, CD44, ILK, SEMA3C, RET, AR, RXRA, VANGL2, LEF1, TNNT2, HHEX, MIB1, NCOA3, FOXC2, FOXC1, TGFB1I1, WNT5A, COBL, BBS4, FGFR3, TNC, BMPR2, CTNND1, EGLN1, NR3C1, SOX9, TCF7L1, IGF1R, FOXQ1, MACF1, HOXA5, BCL2, PLXND1, CAR2, ACTC1, TBX4, SMAD3, FZD3, SHANK3, FZD6, HOXB4, FREM2, TSC2, ZIC5, TGFBR3, APAF1
## 5                                                                                            GNA13, CAV1, ACVRL1, NRP1, PGF, IL18, LEPR, EDN1, GJA1, CDH2, MEIS1, WT1, TGFB2, WARS, PTK2, CERKL, APOE, CXCR4, ANG, SEMA3C, PLCD1, NOS2, MKL2, PLXND1, FIGF, FGF2, PTPRJ, TGFBR2, TBX4, NF1, TBX1, TNNI3, PNPLA6, VASH1, THY1, NUS1, MEOX2, ECSCR, AMOT, HBEGF, FOXC2, FOXC1, HDAC7
## 6                                                                               CAV1, XIAP, AGFG1, ADORA2A, TNNC1, TBC1D9, LEPR, ABHD5, EDN1, ASAP2, ASAP3, SMAP1, TBC1D12, ANG, TBC1D14, MTCH1, TBC1D13, TBC1D4, TBC1D30, DHCR24, HIP1, VAV3, NOS1, NF1, MYH6, RICTOR, TBC1D22A, THY1, PLCE1, RNF7, NDEL1, CHML, IFT57, ACAP2, TSC2, ERN1, APAF1, ARAP3, ARAP2, ARAP1, HTR2A, F2R
##      adj_pval
## 1 0.000002170
## 2 0.000010400
## 3 0.000007620
## 4 0.000119000
## 5 0.000720000
## 6 0.001171166
  • 查看選擇的基因
head(EC$genelist)
##        ID    logFC   AveExpr        t  P.Value adj.P.Val        B
## 1 Slco1a4 6.645388 1.2168670 88.65515 1.32e-18  2.73e-14 29.02715
## 2 Slc19a3 6.281525 1.1600468 69.95094 2.41e-17  2.49e-13 27.62917
## 3     Ddc 4.483338 0.8365231 65.57836 5.31e-17  3.65e-13 27.18476
## 4 Slco1c1 6.469384 1.3558865 59.87613 1.62e-16  8.34e-13 26.51242
## 5  Sema3c 5.515630 2.3252117 58.53141 2.14e-16  8.81e-13 26.33626
## 6 Slc38a3 4.761755 0.9218670 54.11559 5.58e-16  1.76e-12 25.70308
  • 構(gòu)建畫圖數(shù)據(jù):circle_dat()
circ <- circle_dat(EC$david, EC$genelist)
head(circ)
  category         ID              term count  genes      logFC adj_pval     zscore
BP GO:0007507 heart development    54   DLC1 -0.9707875 2.17e-06 -0.8164966
BP GO:0007507 heart development    54   NRP2 -1.5153173 2.17e-06 -0.8164966
BP GO:0007507 heart development    54   NRP1 -1.1412315 2.17e-06 -0.8164966
BP GO:0007507 heart development    54   EDN1  1.3813006 2.17e-06 -0.8164966
BP GO:0007507 heart development    54 PDLIM3 -0.8876939 2.17e-06 -0.8164966
BP GO:0007507 heart development    54   GJA1 -0.8179480 2.17e-06 -0.8164966
  • zscore: 每個GO term下上調(diào)(logFC>0)基因數(shù)和下調(diào)基因數(shù)的差與注釋到GO term基因數(shù)平方根的商吏恭。
zscore

#3. 畫圖

##3.1 條形圖(GOBar())

  • 畫BP下的GO term
GOBar(subset(circ, category == 'BP')
img
  • 分面同時展示BP, CC, MF的GO term
GOBar(circ, display = 'multiple')
GOBar

#3.2 氣泡圖(GOBubble())

GOBubble(circ, labels = 3)
img

上圖中:X軸是z-score; Y軸是多重矯正后p值的負對數(shù)重罪;圈大小展示GO Term下基因數(shù)樱哼。

  • 分面同時展示BP, CC, MF的氣泡圖
GOBubble(circ, title = 'Bubble plot', colour = c('orange', 'darkred', 'gold'), display = 'multiple', labels = 3)  
img

#2.3 圈圖展示基因富集分析結(jié)果(GOCircle())

GOCircle(circ)
img

默認展示circ 數(shù)據(jù)前10個GO Term,通過參數(shù)nsub調(diào)整需要展示的GO Term

  • 根據(jù)GO Term選擇要展示的GO Term
GOCircle(circ, nsub = c('GO:0007507', 'GO:0001568', 'GO:0001944', 'GO:0048729', 'GO:0048514', 'GO:0005886', 'GO:0008092', 'GO:0008047'))
  • 選擇要展示的GO Term數(shù)量
GOCircle(circ, nsub = 10)

#2.4 展示基因與GO Terms關(guān)系的圈圖 (GOChord())

chord_dat ()將作圖數(shù)據(jù)構(gòu)建成GOChord() 要求的輸入格式剿配;一個二進制的關(guān)系矩陣搅幅,1表示基因?qū)儆谠揋O Term,0與之相反呼胚。

  • 選擇感興趣的基因
head(EC$genes)
##      ID      logFC
## 1  PTK2 -0.6527904
## 2 GNA13  0.3711599
## 3  LEPR  2.6539788
## 4  APOE  0.8698346
## 5 CXCR4 -2.5647537
## 6  RECK  3.6926860
  • 選擇感興趣的GO Term
EC$process
## [1] "heart development"        "phosphorylation"         
## [3] "vasculature development"  "blood vessel development"
## [5] "tissue morphogenesis"     "cell adhesion"           
## [7] "plasma membrane"
  • 構(gòu)建畫圖數(shù)據(jù)
#chord_dat(data, genes, process)
#genes茄唐、process其中任何一個參數(shù)不指定,默認使用對應(yīng)的全部數(shù)據(jù)
chord <- chord_dat(circ, EC$genes, EC$process)
head(chord)
##       heart development phosphorylation vasculature development
## PTK2                  0               1                       1
## GNA13                 0               0                       1
## LEPR                  0               0                       1
## APOE                  0               0                       1
## CXCR4                 0               0                       1
## RECK                  0               0                       1
##       blood vessel development tissue morphogenesis cell adhesion
## PTK2                         1                    0             0
## GNA13                        1                    0             0
## LEPR                         1                    0             0
## APOE                         1                    0             0
## CXCR4                        1                    0             0
## RECK                         1                    0             0
##       plasma membrane      logFC
## PTK2                1 -0.6527904
## GNA13               1  0.3711599
## LEPR                1  2.6539788
## APOE                1  0.8698346
## CXCR4               1 -2.5647537
## RECK                1  3.6926860
  • 畫圖
chord <- chord_dat(data = circ, genes = EC$genes, process = EC$process)
GOChord(chord, space = 0.02, gene.order = 'logFC', gene.space = 0.25, gene.size = 5)
img
  • GOChord() 參數(shù)
GOChord(data, title, space, gene.order, gene.size, gene.space, nlfc = 1,
  lfc.col, lfc.min, lfc.max, ribbon.col, border.size, process.label, limit)
#data: 二進制矩陣
#title:標(biāo)題
#space:基因?qū)?yīng)方塊之間的距離
#gene.order:基因排列順序
#gene.size:基因標(biāo)簽大小
#nlfc:logFC 列的數(shù)目
#lfc.col:LFC顏色蝇更,定義模式:c(color for low values, color for the mid point, color for the high values)
#lfc.min:LFC最小值
#lfc.max:LFC最大值
#ribbon.col:向量定義基因與GO Term間條帶顏色
#border.size:基因與GO Term間條帶邊框粗細
#process.label:GO Term 圖例文字大小
#limit:c(3, 2)沪编,兩個數(shù)字呼盆;第一個參數(shù)篩選基因(保留至少存在于3個GO Term的基因),第二個參數(shù)篩選GO Term(保留至少包含2個基因的GO Term )

#3.5 基因與GO Term的熱圖(GOHeat)

nlfc = 1:顏色對應(yīng)logFC
nlfc = 0:顏色對應(yīng)每個基因注釋了到了幾個GO Term

GOHeat(chord, nlfc = 1, fill.col = c('red', 'yellow', 'green'))
img
  • 聚類(GOCluster)
GOCluster(circ, EC$process, clust.by = 'logFC', term.width = 2)
  • GOCluster()調(diào)用R內(nèi)置函數(shù)hclust 對基因表水平達或根據(jù)功能分內(nèi)進行層次聚類。
GOCluster(circ, EC$process, clust.by = 'logFC', term.width = 2)
img

參考

GOplot by Wencke Walter

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末蚁廓,一起剝皮案震驚了整個濱河市访圃,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌相嵌,老刑警劉巖挽荠,帶你破解...
    沈念sama閱讀 217,277評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異平绩,居然都是意外死亡,警方通過查閱死者的電腦和手機漠另,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,689評論 3 393
  • 文/潘曉璐 我一進店門捏雌,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人笆搓,你說我怎么就攤上這事性湿。” “怎么了满败?”我有些...
    開封第一講書人閱讀 163,624評論 0 353
  • 文/不壞的土叔 我叫張陵肤频,是天一觀的道長。 經(jīng)常有香客問我算墨,道長宵荒,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,356評論 1 293
  • 正文 為了忘掉前任净嘀,我火速辦了婚禮报咳,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘挖藏。我一直安慰自己暑刃,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,402評論 6 392
  • 文/花漫 我一把揭開白布膜眠。 她就那樣靜靜地躺著岩臣,像睡著了一般。 火紅的嫁衣襯著肌膚如雪宵膨。 梳的紋絲不亂的頭發(fā)上架谎,一...
    開封第一講書人閱讀 51,292評論 1 301
  • 那天,我揣著相機與錄音柄驻,去河邊找鬼狐树。 笑死,一個胖子當(dāng)著我的面吹牛鸿脓,可吹牛的內(nèi)容都是我干的抑钟。 我是一名探鬼主播涯曲,決...
    沈念sama閱讀 40,135評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼在塔!你這毒婦竟也來了幻件?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,992評論 0 275
  • 序言:老撾萬榮一對情侶失蹤蛔溃,失蹤者是張志新(化名)和其女友劉穎绰沥,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體贺待,經(jīng)...
    沈念sama閱讀 45,429評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡徽曲,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,636評論 3 334
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了麸塞。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片腿堤。...
    茶點故事閱讀 39,785評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡兴垦,死狀恐怖哺窄,靈堂內(nèi)的尸體忽然破棺而出已卷,到底是詐尸還是另有隱情,我是刑警寧澤雁比,帶...
    沈念sama閱讀 35,492評論 5 345
  • 正文 年R本政府宣布稚虎,位于F島的核電站,受9級特大地震影響偎捎,放射性物質(zhì)發(fā)生泄漏蠢终。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,092評論 3 328
  • 文/蒙蒙 一茴她、第九天 我趴在偏房一處隱蔽的房頂上張望蜕径。 院中可真熱鬧,春花似錦败京、人聲如沸兜喻。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,723評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽朴皆。三九已至,卻和暖如春泛粹,著一層夾襖步出監(jiān)牢的瞬間遂铡,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,858評論 1 269
  • 我被黑心中介騙來泰國打工晶姊, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留扒接,地道東北人。 一個月前我還...
    沈念sama閱讀 47,891評論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像钾怔,于是被迫代替她去往敵國和親碱呼。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,713評論 2 354

推薦閱讀更多精彩內(nèi)容

  • 系統(tǒng)功能注釋和生物網(wǎng)絡(luò)可視化 Spatial Analysis of Functional Enrichment(...
    Y大寬閱讀 4,350評論 7 21
  • topGO手冊中的實例實現(xiàn) 手冊地址:http://bioconductor.uib.no/2.7/bioc/vi...
    x2yline閱讀 15,507評論 1 32
  • 何為塔耐的理性呢宗侦?那就得從塔羅的感性面說起了愚臀。塔羅的圖案,繪畫矾利,符號姑裂,等象征含義,很多是要通過內(nèi)心的感受來去解...
    霄世閱讀 364評論 0 0
  • 臨近晚上下起了小雪 天地是黑的 而你是白的 你的面孔不似月光 你不要墜落 墜落我掌中 我掬著你 你溫暖如一團炭火...
    貓的名字叫代代閱讀 238評論 0 2
  • 完美與破碎男旗,沒有一定的界限舶斧,全看你從哪個角度去看〔旎剩—劉墉 好多年前捧毛,我剛創(chuàng)業(yè)那會兒,因為經(jīng)驗不足让网,接連錯過了幾個關(guān)...
    防爆通訊錄閱讀 207評論 0 0