具有相同功能的基因被歸類到kegg orthology 中绽诚,每個(gè)KO 代表具體的一個(gè)功能。在生命活動(dòng)中辈末,往往需要多個(gè)功能單位共同發(fā)揮作用委可,比如多個(gè)蛋白質(zhì)構(gòu)成復(fù)合體來發(fā)揮調(diào)控作用,此時(shí)多個(gè)KO就整合在了一起租幕。這個(gè)例子說明在KO 之上舷手,必然還存在一個(gè)分類系統(tǒng),將參與同一過程的多個(gè)KO劃分在一起劲绪。實(shí)際上男窟,KEGG Module 數(shù)據(jù)庫就是存儲(chǔ)這種信息的數(shù)據(jù)庫。
KEGG Module 數(shù)據(jù)庫中的每條記錄代表一個(gè)功能單元贾富,是多個(gè)KO的集合,叫做kegg module, 通過大寫字母M和數(shù)字進(jìn)行標(biāo)識(shí)歉眷;
module 數(shù)據(jù)庫包含以下4大類別的功能:
pathway modules
structural complexes
functional sets
signature modules
更加詳細(xì)的分類信息可以在brite 數(shù)據(jù)庫中找到,見以下鏈接
和pathway 類似颤枪,對(duì)于每條module 的記錄汗捡,都有一張對(duì)應(yīng)的圖片,叫做module map
畏纲。
M0002對(duì)應(yīng)的map 如下圖
結(jié)合其詳細(xì)信息扇住,我們來理解下module 的構(gòu)成
從Definition 字段的信息春缕,我們可以看到每個(gè)Module 有多個(gè)KO 構(gòu)成,那么這些KO 之間有什么樣的關(guān)系呢艘蹋,這就要從definition 字段的定義說起锄贼!
被空白分隔的每個(gè)字段叫做1個(gè)block, M0002 可以分成以下5個(gè)主要的block
K01803
((K00134,K00150) K00927,K11389)
(K01834,K15633,K15634,K15635)
K01689
(K00873,K12406)
在這里,空格代表的是邏輯與 AND
的關(guān)系女阀,表示這5個(gè)block 一起發(fā)揮作用宅荤;
在(K01834,K15633,K15634,K15635)
block 中,逗號(hào)代表邏輯或OR
的關(guān)系强品,任何一個(gè)KO都可以起到這個(gè)blcok的作用膘侮。
注意在 ((K00134,K00150) K00927,K11389)
中同時(shí)出現(xiàn)了逗號(hào)和空格,為了正確區(qū)分的榛,還使用了圓括號(hào)琼了。圓括號(hào)內(nèi)為1個(gè)block, 所以K00134,K00150
為1個(gè)block, 這個(gè)block 和 K00927 用空白分隔,所以是AND關(guān)系夫晌,而逗號(hào)連接的是(K00134,K00150) K00927
和 K11389
兩個(gè)block雕薪。 所以這個(gè)block對(duì)應(yīng)的map 就是上圖展示的那樣。理解了definition 字段的信息晓淀,不難發(fā)現(xiàn)根據(jù)該字段的信息所袁,可以計(jì)算出這個(gè)module 對(duì)應(yīng)的map。
除了空格和逗號(hào)之外凶掰,definition 還會(huì)出現(xiàn) +燥爷, - 。比如((K01878+K01879),K14164,K01880)
, 加號(hào)代表兩個(gè)KO一起作為一個(gè)block發(fā)揮作用懦窘,對(duì)應(yīng)的map 圖為
減號(hào)代表可選項(xiàng)的意思前翎,表示這個(gè)block可有可無。比如K01866 K01873 -K07587 -K11627 -K01884
畅涂。減號(hào)連接的block 雖然可有可無港华,但是在map圖中還是會(huì)出現(xiàn)的。
由于module 由KO 發(fā)展而來午衰,所以module 也是跨物種的概念立宜。對(duì)于每個(gè)物種而言,也有該物種對(duì)應(yīng)的module, 比如M0000 在human中對(duì)應(yīng)的記錄為hsa_M00002臊岸;
在物種的module 中橙数,根據(jù)包含的block的個(gè)數(shù),可以劃分成兩類
complete module, 包含reference module 中所有的block;
incomplete module , 只缺少了1個(gè)或者2個(gè)block;
在物種對(duì)應(yīng)的module map 中帅戒,會(huì)對(duì)該物種對(duì)應(yīng)的KO高亮顯示
總結(jié)
KEGG Module 數(shù)據(jù)庫是對(duì)KO的整合商模,每個(gè)module 代表1個(gè)功能單元,是多個(gè)KO的集合;
Module 由block 構(gòu)成施流,definition 字段的信息需要理解空格响疚,逗號(hào),加號(hào)瞪醋,減號(hào)的不同含義忿晕,根據(jù)definition 字段的信息可以計(jì)算得到module map;
3.module 是跨物種的概念,最原始的叫做reference module, 定義了block的數(shù)量银受; 物種對(duì)應(yīng)的module 根據(jù)包含的block的完整性践盼,可以分為complete module 和 incomplete module; 在物種對(duì)應(yīng)的module map 中,對(duì)應(yīng)的KO會(huì)高亮顯示