使用clusterprofiler中的enrichr對(duì)非模式植物進(jìn)行KEGG分析

一坞笙、需要的數(shù)據(jù)

（1）eggnog對(duì)基因的注釋(名字例如叫:egg.tsv)

TSV格式

image.png

（2）ko00001.json文件

下載地址：
https://www.genome.jp/kegg-bin/get_htext?ko00001

(3)目的基因集

image.png

二哮独、需要的R包

rio夺荒、stringr、tidyverse歪脏、clusterprofiler

三疑俭、構(gòu)建過程

1.導(dǎo)入注釋文件到R

options(stringsAsFactors = F)
egg<-rio::import("egg.tsv")

2.把注釋文件里的空值改為NA

egg[egg==""]<-NA

3.從注釋文件里把基因與KEGG提取出來:

gene2ko <- egg %>%
  dplyr::select(GID = query_name, KO = KEGG_ko) %>%
  na.omit()

image.png

4.將KO行中有多個(gè)值的拆分為多行

all_ko_list=str_split(gene2ko$KO,",")
gene2ko <- data.frame(GID=rep(gene2ko$GID,times=sapply(all_ko_list,length)),KO=unlist(all_ko_list))

image.png

5.將gene2ko中，KO列的"ko:"去掉

gene2ko$KO=str_replace(gene2ko$KO,"ko:","")

image.png

6.對(duì)json文件操作

if(!file.exists('kegg_info.RData')){
  library(jsonlite)
  library(purrr)
  library(RCurl)
  update_kegg <- function(json = "ko00001.json",file=NULL) {
    pathway2name <- tibble(Pathway = character(), Name = character())
    ko2pathway <- tibble(Ko = character(), Pathway = character())
    kegg <- fromJSON(json)
    for (a in seq_along(kegg[["children"]][["children"]])) {
      A <- kegg[["children"]][["name"]][[a]]
      for (b in seq_along(kegg[["children"]][["children"]][[a]][["children"]])) {
        B <- kegg[["children"]][["children"]][[a]][["name"]][[b]] 
        for (c in seq_along(kegg[["children"]][["children"]][[a]][["children"]][[b]][["children"]])) {
          pathway_info <- kegg[["children"]][["children"]][[a]][["children"]][[b]][["name"]][[c]]
          pathway_id <- str_match(pathway_info, "ko[0-9]{5}")[1]
          pathway_name <- str_replace(pathway_info, " \\[PATH:ko[0-9]{5}\\]", "") %>% str_replace("[0-9]{5} ", "")
          pathway2name <- rbind(pathway2name, tibble(Pathway = pathway_id, Name = pathway_name))
          kos_info <- kegg[["children"]][["children"]][[a]][["children"]][[b]][["children"]][[c]][["name"]]
          kos <- str_match(kos_info, "K[0-9]*")[,1]
          ko2pathway <- rbind(ko2pathway, tibble(Ko = kos, Pathway = rep(pathway_id, length(kos))))
        }
      }
    }
    save(pathway2name, ko2pathway, file = file)
  }
  update_kegg(json = "ko00001.json",file="kegg_info.RData")
}

產(chǎn)生一個(gè)叫kegg_info.RData的文件

image.png

7.加載上一步創(chuàng)建的文件

load("kegg_info.RData")

出現(xiàn)這兩個(gè)變量

image.png

分別是這樣：

ko2pathway

image.png

pathway2name

image.png

8.將ko2pathway的列名婿失，由Ko,Pathway钞艇，改為KO,Pathway

colnames(ko2pathway)=c("KO",'Pathway')

image.png

9.創(chuàng)建 Term2gene

Term2gene <- gene2ko %>%left_join(ko2pathway, by = "KO") %>%dplyr::select(Pathway,GID) %>%na.omit()

image.png

四.enrichr分析

library(clusterProfiler)
keggS7 <- enricher(gene=X557VS550All_resultsfiler$X1,pvalueCutoff = 0.05,pAdjustMethod = "BH",TERM2GENE = Term2gene,TERM2NAME = pathway2name)

gene目的基因集、Term2gene第9步豪硅、pathway2name由第7步創(chuàng)建

務(wù)必目的基因集的基因ID和注釋文件的基因ID一致

五哩照、簡(jiǎn)單畫圖

barplot(keggS7)

image.png

dotplot(keggS7)

image.png

參考：
詳細(xì)回顧非模式物種注釋構(gòu)建過程

最后編輯于：2021.05.13 18:02:01

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市舟误，隨后出現(xiàn)的幾起案子葡秒，更是在濱河造成了極大的恐慌，老刑警劉巖嵌溢，帶你破解...
沈念sama閱讀 217,277評(píng)論 6贊 503
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異蹋岩，居然都是意外死亡赖草，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,689評(píng)論 3贊 393
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門剪个，熙熙樓的掌柜王于貴愁眉苦臉地迎上來秧骑，“玉大人，你說我怎么就攤上這事扣囊『跽郏” “怎么了？”我有些...
開封第一講書人閱讀 163,624評(píng)論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵侵歇，是天一觀的道長(zhǎng)骂澄。經(jīng)常有香客問我，道長(zhǎng)惕虑，這世上最難降的妖魔是什么坟冲？我笑而不...
開封第一講書人閱讀 58,356評(píng)論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮溃蔫，結(jié)果婚禮上健提，老公的妹妹穿的比我還像新娘。我一直安慰自己伟叛，他們只是感情好私痹，可當(dāng)我...
茶點(diǎn)故事閱讀 67,402評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著，像睡著了一般紊遵。火紅的嫁衣襯著肌膚如雪账千。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 51,292評(píng)論 1贊 301
城市分裂傳說
那天癞蚕，我揣著相機(jī)與錄音蕊爵，去河邊找鬼。笑死桦山，一個(gè)胖子當(dāng)著我的面吹牛攒射，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播恒水，決...
沈念sama閱讀 40,135評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼会放，長(zhǎng)吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來了钉凌？” 一聲冷哼從身側(cè)響起咧最，我...
開封第一講書人閱讀 38,992評(píng)論 0贊 275
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎御雕，沒想到半個(gè)月后矢沿，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,429評(píng)論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡酸纲，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,636評(píng)論 3贊 334
?白月光啟示錄
正文我和宋清朗相戀三年捣鲸，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片闽坡。...
茶點(diǎn)故事閱讀 39,785評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡栽惶，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出疾嗅，到底是詐尸還是另有隱情外厂，我是刑警寧澤，帶...
沈念sama閱讀 35,492評(píng)論 5贊 345
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布代承，位于F島的核電站汁蝶，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏次泽。R本人自食惡果不足惜穿仪，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,092評(píng)論 3贊 328
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望意荤。院中可真熱鬧啊片，春花似錦、人聲如沸玖像。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,723評(píng)論 0贊 22
一樁弒父案齐饮，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至笤昨，卻和暖如春祖驱，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背瞒窒。一陣腳步聲響...
開封第一講書人閱讀 32,858評(píng)論 1贊 269
情欲美人皮
我被黑心中介騙來泰國(guó)打工捺僻，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人崇裁。一個(gè)月前我還...
沈念sama閱讀 47,891評(píng)論 2贊 370
代替公主和親
正文我出身青樓匕坯，卻偏偏與公主長(zhǎng)得像，于是被迫代替她去往敵國(guó)和親拔稳。傳聞我的和親對(duì)象是個(gè)殘疾皇子葛峻，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,713評(píng)論 2贊 354

使用clusterprofiler中的enrichr對(duì)非模式植物進(jìn)行KEGG分析

一坞笙、需要的數(shù)據(jù)

（1）eggnog對(duì)基因的注釋(名字例如叫:egg.tsv)

（2）ko00001.json文件

(3)目的基因集

二哮独、需要的R包

三疑俭、構(gòu)建過程

1.導(dǎo)入注釋文件到R

2.把注釋文件里的空值改為NA

3.從注釋文件里把基因與KEGG提取出來:

4.將KO行中有多個(gè)值的拆分為多行

5.將gene2ko中，KO列的"ko:"去掉

6.對(duì)json文件操作

7.加載上一步創(chuàng)建的文件

8.將ko2pathway的列名婿失，由Ko,Pathway钞艇，改為KO,Pathway

9.創(chuàng)建 Term2gene

四.enrichr分析

務(wù)必 目的基因集的基因ID和注釋文件的基因ID一致

五哩照、簡(jiǎn)單畫圖

推薦閱讀更多精彩內(nèi)容

務(wù)必目的基因集的基因ID和注釋文件的基因ID一致