一文極速讀懂 KEGG 數(shù)據(jù)庫

目錄

image

一、介紹

在進(jìn)行生物學(xué)實(shí)驗(yàn)或者生物信息的學(xué)習(xí)中胖秒,都會(huì)聽說KEGG富集分析,而且該方法在高通量測序分析中已然成為數(shù)據(jù)分析中必不可少的一環(huán)。

這種分析方法依托的是由 Kanehisa實(shí)驗(yàn)室 在1995年開發(fā)的KEGG數(shù)據(jù)庫忙菠,全稱為 Kyoto Encyclopedia of Genes and Genomes(京都基因與基因組百科全書)。它擁有多個(gè)子數(shù)據(jù)庫纺弊,包含基因組牛欢,生化反應(yīng),生化物質(zhì)淆游,疾病與藥物傍睹,以及最常用PATHWAY通路信息。

接下來進(jìn)入KEGG官網(wǎng):https://www.kegg.jp 犹菱,它的主頁主要由以下幾部分構(gòu)成:

image

二拾稳、KEGG的數(shù)據(jù)庫構(gòu)成

KEGG子庫中存儲(chǔ)的信息是生物系統(tǒng)的計(jì)算機(jī)表示形式,由基因和蛋白質(zhì)(基因組信息)和化學(xué)物質(zhì)(化學(xué)信息)的分子部件組成腊脱,這些部件的相互作用访得,反應(yīng)和關(guān)系構(gòu)成調(diào)控網(wǎng)絡(luò)圖(系統(tǒng)信息),除此之外陕凹,還包含疾病和藥物信息(健康信息)震鹉。具體的分類及數(shù)據(jù)庫如下:

image

三、KEGG PATHWAY 數(shù)據(jù)庫

在所有子數(shù)據(jù)庫中最重要也是最常用的就是KEGG PATHWAY捆姜,它包括大量由科研人員根據(jù)已有研究文獻(xiàn)传趾,通過手動(dòng)繪制的KEGG通路圖,代表著代謝過程泥技,環(huán)境信息過程浆兰,細(xì)胞過程,生物系統(tǒng)珊豹,人類疾病和藥物開發(fā)簸呈。

每個(gè)通路都由一個(gè)五位數(shù)字標(biāo)識(shí),后跟以下任意一個(gè):map店茶,ko蜕便,ec,rn和三字母或四字母生物代碼贩幻,它們分別代表五種通路類型:

  • map編號(hào):代表reference pathway轿腺,根據(jù)已有的知識(shí)繪制的两嘴、概括的、詳盡的具有一般參考意義的代謝圖族壳。 一個(gè)點(diǎn)同時(shí)表示一個(gè)基因憔辫,這個(gè)基因編碼的酶或這個(gè)酶參加的反應(yīng)
  • org編號(hào):物種特異性通路,這里就是將K編號(hào)基因(直系同源基因仿荆,后面會(huì)介紹)換為每個(gè)物種中對(duì)應(yīng)的基因
  • ko編號(hào):KO通路中的點(diǎn)表示直系同源基因
  • ec編號(hào):EC通路中的點(diǎn)表示相關(guān)的酶
  • rn編號(hào):化學(xué)反應(yīng)通路中的點(diǎn)只表示該點(diǎn)參與的某個(gè)反應(yīng)贰您、反應(yīng)物及反應(yīng)類型

在了解每種通路之前我們先學(xué)會(huì)在KEGG中切換每種通路類型

地址:https://www.kegg.jp/kegg-bin/show_pathway?org_name=map&mapno=00020&mapscale=&show_description=hide

使用過程中切換各種通路類型,比如進(jìn)入TCA循環(huán) 拢操,可以通過左上角下路菜單來切換:

image

接下來锦亦,我們?cè)敿?xì)介紹每種通路:

1. 參考通路圖 (map)

這里以 TCA循環(huán) 的通路圖為例,進(jìn)入?yún)⒖纪穲D(Reference pathway)令境。這是原始版本的通路孽亲,也是后續(xù)幾種通路圖的"模板"。每個(gè)白框可以代表直系同源基因展父,酶返劲,反應(yīng),也可以點(diǎn)擊鏈接至KO栖茉,ENZYME和REACTION詳細(xì)信息篮绿。

image

上述的形狀,箭頭吕漂,線段代表如下意義:

image
2. 物種特異性通路 (org)

我們選擇人的物種名Homo sapiens (human)亲配,點(diǎn)擊Go』棠可以看到與Reference pathway 圖(map00020)不同的是有物種特異性基因被標(biāo)注為綠色吼虎,而且通路編號(hào)為hsa00020

訪問鏈接:https://www.kegg.jp/kegg-bin/show_pathway?org_name=hsa&mapno=00020&mapscale=&show_description=hide

當(dāng)然,如果直接訪問hsa00020的鏈接也可以進(jìn)入該通路:https://www.kegg.jp/kegg-bin/show_pathway?hsa00020

image

點(diǎn)擊綠色基因苍鲜,會(huì)進(jìn)入Gene詳細(xì)信息

image
3. 直系同源物通路 (ko)

藍(lán)色框超鏈接到從原始版本中選擇的KO條目

image

進(jìn)入PCK的直系同源基因信息

image
4. 酶通路 (ec)

藍(lán)色框超鏈接到從原始版本中選擇的ENZYME條目

image

進(jìn)入ENZYME

image
5. 反應(yīng)通路 (reaction)

藍(lán)色框超鏈接到從原始版本中選擇的反應(yīng)條目思灰,

image

點(diǎn)擊后進(jìn)入對(duì)應(yīng)的反應(yīng)信息界面,如下圖

image

四混滔、KEGG ORTHOLOGY(KO)數(shù)據(jù)庫

KEGG ORTHOLOGY (KO)數(shù)據(jù)庫是構(gòu)建Pathway和Module的基礎(chǔ)洒疚,相當(dāng)于KEGG數(shù)據(jù)庫構(gòu)建的基石,因此理解KO數(shù)據(jù)庫的構(gòu)成對(duì)于使用及了解KEGG至關(guān)重要坯屿。

然而油湖,這種通用方法不足以理解由物種內(nèi)基因和基因組的變異所引起的更詳細(xì)的特征,特別是對(duì)于理解與人類基因和基因組的疾病相關(guān)的變異而言领跛。后來他們開發(fā)了 KEGG NETKERK乏德,該數(shù)據(jù)庫不僅涉及基因變異,而且包括病毒和其他因素的網(wǎng)絡(luò)變異方面的疾病和藥物知識(shí)吠昭。

KEGG的開發(fā)者根據(jù)不同生物之間基因和基因組的保守和變異喊括,引入直系同源物(KO)的概念胧瓜,使得KEGG通路圖,BRITE層次結(jié)構(gòu)和KEGG模塊的參考數(shù)據(jù)集可以廣泛應(yīng)用于任何細(xì)胞生物瘾晃。

image

概念

1.KO號(hào):表示不分物種的通路贷痪,相當(dāng)于所有物種的這一通路的并集幻妓,比如ko00020代表的 TCA 循環(huán) (下圖所示)蹦误,下圖的每個(gè)圓角矩形也代表著一個(gè)KO通路。

image

2.K號(hào):表示基因肉津,每個(gè)號(hào)代表的是所有物種的一個(gè)同源基因强胰,比如上圖中的K01596代表的是 PCK

image

進(jìn)入K01596的詳細(xì)頁面妹沙,我們會(huì)看到它代表的是一個(gè)基因列表偶洋,這些基因具有一個(gè)功能卻來自于不同的物種。

image

3.C號(hào):表示化合物

image

對(duì)于分析工具使用和kegg資源下載距糖,會(huì)在后續(xù)文章中更新玄窝。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市悍引,隨后出現(xiàn)的幾起案子恩脂,更是在濱河造成了極大的恐慌,老刑警劉巖趣斤,帶你破解...
    沈念sama閱讀 206,126評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件俩块,死亡現(xiàn)場離奇詭異,居然都是意外死亡浓领,警方通過查閱死者的電腦和手機(jī)玉凯,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來联贩,“玉大人漫仆,你說我怎么就攤上這事±峄希” “怎么了歹啼?”我有些...
    開封第一講書人閱讀 152,445評(píng)論 0 341
  • 文/不壞的土叔 我叫張陵,是天一觀的道長座菠。 經(jīng)常有香客問我狸眼,道長,這世上最難降的妖魔是什么浴滴? 我笑而不...
    開封第一講書人閱讀 55,185評(píng)論 1 278
  • 正文 為了忘掉前任拓萌,我火速辦了婚禮,結(jié)果婚禮上升略,老公的妹妹穿的比我還像新娘微王。我一直安慰自己屡限,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,178評(píng)論 5 371
  • 文/花漫 我一把揭開白布炕倘。 她就那樣靜靜地躺著钧大,像睡著了一般。 火紅的嫁衣襯著肌膚如雪罩旋。 梳的紋絲不亂的頭發(fā)上啊央,一...
    開封第一講書人閱讀 48,970評(píng)論 1 284
  • 那天,我揣著相機(jī)與錄音涨醋,去河邊找鬼瓜饥。 笑死,一個(gè)胖子當(dāng)著我的面吹牛浴骂,可吹牛的內(nèi)容都是我干的乓土。 我是一名探鬼主播,決...
    沈念sama閱讀 38,276評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼溯警,長吁一口氣:“原來是場噩夢(mèng)啊……” “哼趣苏!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起梯轻,我...
    開封第一講書人閱讀 36,927評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤食磕,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后檩淋,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體芬为,經(jīng)...
    沈念sama閱讀 43,400評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,883評(píng)論 2 323
  • 正文 我和宋清朗相戀三年蟀悦,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了媚朦。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 37,997評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡日戈,死狀恐怖询张,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情浙炼,我是刑警寧澤份氧,帶...
    沈念sama閱讀 33,646評(píng)論 4 322
  • 正文 年R本政府宣布,位于F島的核電站弯屈,受9級(jí)特大地震影響蜗帜,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜资厉,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,213評(píng)論 3 307
  • 文/蒙蒙 一厅缺、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦湘捎、人聲如沸诀豁。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽舷胜。三九已至,卻和暖如春活翩,著一層夾襖步出監(jiān)牢的瞬間烹骨,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評(píng)論 1 260
  • 我被黑心中介騙來泰國打工纱新, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留展氓,地道東北人穆趴。 一個(gè)月前我還...
    沈念sama閱讀 45,423評(píng)論 2 352
  • 正文 我出身青樓脸爱,卻偏偏與公主長得像,于是被迫代替她去往敵國和親未妹。 傳聞我的和親對(duì)象是個(gè)殘疾皇子簿废,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,722評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容

  • 我們有時(shí)候很關(guān)心基因所在的pathway、上下調(diào)控以及一堆基因富集到的pathway络它,再或者同源基因等信息族檬,KEG...
    Amy_Cui閱讀 63,095評(píng)論 0 41
  • 在ncbi上搜索 kegg && Kanehisa M,這個(gè)作者簡直不要太牛了哦化戳,就一個(gè)KEGG數(shù)據(jù)庫单料,發(fā)了好多文...
    Amy_Cui閱讀 4,663評(píng)論 0 12
  • 歡迎關(guān)注公眾號(hào)oddxix KEGG 簡介 KEGG全稱: Kyoto Encyclopedia of Genes...
    oddxix閱讀 12,083評(píng)論 1 55
  • pathway 建立在ko 數(shù)據(jù)庫的基礎(chǔ)上,基于我們對(duì)生命活動(dòng)中的分子相互作用和化學(xué)物質(zhì)的反應(yīng)的認(rèn)識(shí)点楼,構(gòu)建了復(fù)雜的...
    生信修煉手冊(cè)閱讀 2,334評(píng)論 0 1
  • 很多事情不是你不能扫尖,而是你不知道。 先看張海報(bào) 一天前掠廓,我也很難想象這么酷炫的海報(bào)是出自我之手换怖。當(dāng)你覺得可以推脫的...
    巧栗子閱讀 129評(píng)論 0 0