RNA-seq(10):KEGG通路可視化:gage和pathview

這部分直接從上部分RNA-seq(9):富集分析(功能注釋)的數(shù)據(jù)而來(lái)晶框,當(dāng)然如果你上部分?jǐn)?shù)據(jù)存盤了,這部分直接導(dǎo)入并進(jìn)行轉(zhuǎn)換就可以趾盐。這里我們先用另外一個(gè)R包 gage package (Generally Applicable Gene-set Enrichment for Pathway Analysis)進(jìn)行KEGG 富集分析哥倔,這樣也可以和上部分進(jìn)行比較秸架。

提前說(shuō)明幾個(gè)問(wèn)題

  • kegg的物種縮寫在這里查看
  • 我們使用 gage package (Generally Applicable Gene-set Enrichment for Pathway Analysis) 進(jìn)行通路分析。點(diǎn)擊下載 gage package workflow vignette for RNA-seq pathway analysis查看gage包工作流程咆蒿。一旦有了富集的通路list东抹,就可以使用pathview 包進(jìn)行通路可視化。當(dāng)然這會(huì)用到上下調(diào)信息沃测。
  • 用pathview進(jìn)行可視化

先安裝R包

source("https://bioconductor.org/biocLite.R")
biocLite("gage")
biocLite("pathview")
biocLite("gageData")
library("pathview")
library("gage")
library("gageData")
install.packages("dplyr")
library("dplyr")
#library(clusterProfiler)
#library(DOSE)
#library(stringr)
#library(org.Mm.eg.db)

加載數(shù)據(jù)

data(kegg.sets.mm)
data(sigmet.idx.mm)
kegg.sets.mm =  kegg.sets.mm[sigmet.idx.mm]
head(kegg.sets.mm,3)
setwd("F:/rna_seq/data/matrix")
sig.gene<-read.csv(file="DEG_treat_vs_control.csv")
gene.df<-bitr(gene, fromType = "ENSEMBL", 
              toType = c("SYMBOL","ENTREZID"),
              OrgDb = org.Mm.eg.db)
head(sig.gene)
> head(sig.gene)
                   X baseMean log2FoldChange     lfcSE      stat       pvalue         padj
1 ENSMUSG00000003309 548.1926       3.231611 0.2658125 12.157485 5.234568e-34 8.193146e-30
2 ENSMUSG00000046323 404.1894       3.067050 0.2628220 11.669687 1.820923e-31 1.425055e-27
3 ENSMUSG00000001123 341.8542       2.797485 0.2766499 10.112004 4.887441e-24 2.549941e-20
4 ENSMUSG00000023906 951.9460       2.382307 0.2510718  9.488551 2.342684e-21 9.116395e-18
5 ENSMUSG00000018569 485.4839       3.136031 0.3312999  9.465836 2.912214e-21 9.116395e-18
6 ENSMUSG00000000184 601.0842      -2.827750 0.3154171 -8.965112 3.099648e-19 8.085948e-16

開(kāi)始用gage包進(jìn)行富集分析缭黔,gage()函數(shù)需要fold change 和Entrez gene IDs

foldchanges = sig.gene$log2FoldChange
names(foldchanges)= gene.df$ENTREZID
head(foldchanges)

如下顯示:

> head(foldchanges)
    11768     73708     16859     54419     53624     12444 
 3.231611  3.067050  2.797485  2.382307  3.136031 -2.827750

開(kāi)始pathway分析,獲取結(jié)果

keggres = gage(foldchanges, gsets = kegg.sets.mm, same.dir = TRUE)
# Look at both up (greater), down (less), and statatistics.
lapply(keggres, head)

顯示為

> lapply(keggres, head)
$greater
                                                     p.geomean  stat.mean     p.val     q.val set.size      exp1
mmu04514 Cell adhesion molecules (CAMs)              0.2680462  0.6286461 0.2680462 0.5360924       12 0.2680462
mmu04510 Focal adhesion                              0.6382502 -0.3594187 0.6382502 0.6382502       10 0.6382502
mmu04144 Endocytosis                                        NA        NaN        NA        NA        8        NA
mmu03008 Ribosome biogenesis in eukaryotes                  NA        NaN        NA        NA        0        NA
mmu04141 Protein processing in endoplasmic reticulum        NA        NaN        NA        NA        0        NA
mmu04740 Olfactory transduction                             NA        NaN        NA        NA        1        NA

$less
                                                     p.geomean  stat.mean     p.val     q.val set.size      exp1
mmu04510 Focal adhesion                              0.3617498 -0.3594187 0.3617498 0.7234996       10 0.3617498
mmu04514 Cell adhesion molecules (CAMs)              0.7319538  0.6286461 0.7319538 0.7319538       12 0.7319538
mmu04144 Endocytosis                                        NA        NaN        NA        NA        8        NA
mmu03008 Ribosome biogenesis in eukaryotes                  NA        NaN        NA        NA        0        NA
mmu04141 Protein processing in endoplasmic reticulum        NA        NaN        NA        NA        0        NA
mmu04740 Olfactory transduction                             NA        NaN        NA        NA        1        NA

$stats
                                                      stat.mean       exp1
mmu04514 Cell adhesion molecules (CAMs)               0.6286461  0.6286461
mmu04510 Focal adhesion                              -0.3594187 -0.3594187
mmu04144 Endocytosis                                        NaN         NA
mmu03008 Ribosome biogenesis in eukaryotes                  NaN         NA
mmu04141 Protein processing in endoplasmic reticulum        NaN         NA
mmu04740 Olfactory transduction                             NaN         NA

得到pathway

keggrespathways = data.frame(id=rownames(keggres$greater), keggres$greater) %>% 
  tbl_df() %>% 
  filter(row_number()<=10) %>% 
  .$id %>% 
  as.character()
keggrespathways

結(jié)果如下:

> keggrespathways
 [1] "mmu04514 Cell adhesion molecules (CAMs)"              "mmu04510 Focal adhesion"                             
 [3] "mmu04144 Endocytosis"                                 "mmu03008 Ribosome biogenesis in eukaryotes"          
 [5] "mmu04141 Protein processing in endoplasmic reticulum" "mmu04740 Olfactory transduction"                     
 [7] "mmu03010 Ribosome"                                    "mmu04622 RIG-I-like receptor signaling pathway"      
 [9] "mmu04744 Phototransduction"                           "mmu04062 Chemokine signaling pathway" 
# Get the IDs.
keggresids = substr(keggrespathways, start=1, stop=8)
keggresids
> keggresids
 [1] "mmu04514" "mmu04510" "mmu04144" "mmu03008" "mmu04141" "mmu04740" "mmu03010" "mmu04622" "mmu04744" "mmu04062"

最后蒂破,可以通過(guò)pathview包中的pathway()函數(shù)畫圖试浙。下面寫一個(gè)函數(shù),這樣好循環(huán)畫出上面產(chǎn)生的前10個(gè)通路圖寞蚌。

# 先定義畫圖函數(shù)
plot_pathway = function(pid) pathview(gene.data=foldchanges, pathway.id=pid, species="mmu", new.signature=FALSE)
# 同時(shí)畫多個(gè)pathways田巴,這些plots自動(dòng)存到工作目錄
tmp = sapply(keggresids, function(pid) pathview(gene.data=foldchanges, pathway.id=pid, species="mmu"))

顯示如下

> tmp = sapply(keggresids, function(pid) pathview(gene.data=foldchanges, pathway.id=pid, species="mmu"))
Info: Downloading xml files for mmu04514, 1/1 pathways..
Info: Downloading png files for mmu04514, 1/1 pathways..
'select()' returned 1:1 mapping between keys and columns
Info: Working in directory F:/rna_seq/data/matrix
Info: Writing image file mmu04514.pathview.png
Info: Downloading xml files for mmu04510, 1/1 pathways..
Info: Downloading png files for mmu04510, 1/1 pathways..
'select()' returned 1:1 mapping between keys and columns

然后我們?nèi)スぷ髂夸洠榭碖EGG pathway挟秤,我放三張圖查看下:


mmu04144.pathview.png
mmu04510.pathview.png
mmu04514.pathview.png

至此壹哺,KEGG 通路可視化完成

后記:

更詳細(xì)的可視化見(jiàn)(可以從counts開(kāi)始)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市艘刚,隨后出現(xiàn)的幾起案子管宵,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,126評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件箩朴,死亡現(xiàn)場(chǎng)離奇詭異岗喉,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)炸庞,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門钱床,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人埠居,你說(shuō)我怎么就攤上這事查牌。” “怎么了滥壕?”我有些...
    開(kāi)封第一講書人閱讀 152,445評(píng)論 0 341
  • 文/不壞的土叔 我叫張陵纸颜,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我绎橘,道長(zhǎng)胁孙,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書人閱讀 55,185評(píng)論 1 278
  • 正文 為了忘掉前任称鳞,我火速辦了婚禮浊洞,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘胡岔。我一直安慰自己法希,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,178評(píng)論 5 371
  • 文/花漫 我一把揭開(kāi)白布靶瘸。 她就那樣靜靜地躺著苫亦,像睡著了一般。 火紅的嫁衣襯著肌膚如雪怨咪。 梳的紋絲不亂的頭發(fā)上屋剑,一...
    開(kāi)封第一講書人閱讀 48,970評(píng)論 1 284
  • 那天,我揣著相機(jī)與錄音诗眨,去河邊找鬼唉匾。 笑死,一個(gè)胖子當(dāng)著我的面吹牛匠楚,可吹牛的內(nèi)容都是我干的巍膘。 我是一名探鬼主播,決...
    沈念sama閱讀 38,276評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼芋簿,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼峡懈!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起与斤,我...
    開(kāi)封第一講書人閱讀 36,927評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤肪康,失蹤者是張志新(化名)和其女友劉穎荚恶,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體磷支,經(jīng)...
    沈念sama閱讀 43,400評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡谒撼,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,883評(píng)論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了雾狈。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片廓潜。...
    茶點(diǎn)故事閱讀 37,997評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖箍邮,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情叨叙,我是刑警寧澤锭弊,帶...
    沈念sama閱讀 33,646評(píng)論 4 322
  • 正文 年R本政府宣布,位于F島的核電站擂错,受9級(jí)特大地震影響味滞,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜钮呀,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,213評(píng)論 3 307
  • 文/蒙蒙 一剑鞍、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧爽醋,春花似錦蚁署、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 30,204評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至遂赠,卻和暖如春久妆,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背跷睦。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 31,423評(píng)論 1 260
  • 我被黑心中介騙來(lái)泰國(guó)打工筷弦, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人抑诸。 一個(gè)月前我還...
    沈念sama閱讀 45,423評(píng)論 2 352
  • 正文 我出身青樓烂琴,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親蜕乡。 傳聞我的和親對(duì)象是個(gè)殘疾皇子监右,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,722評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容