1.kegg數(shù)據(jù)庫(kù)下載
通常我們?nèi)绻阎硞€(gè)基因,想對(duì)這個(gè)基因做通路很簡(jiǎn)單募书,直接用kegg的網(wǎng)頁(yè)注釋就可以折剃;如果想知道某個(gè)通路里相關(guān)的所有基因列表,要找全的話只能從數(shù)據(jù)庫(kù)里調(diào)了绪抛。數(shù)據(jù)庫(kù)下載方式资铡,參考本文:什么?KEGG數(shù)據(jù)你竟然還不會(huì)下載4甭搿笤休!
人類的kegg注釋文件下載https://pan.baidu.com/s/1o7XseDG.
A,B開頭分別代表KEGG的分類症副;
C開頭代表代謝通路店雅,pathway;
D開頭代表該通路里邊的基因贞铣,其中第二列為ncbi_entrez_id和gene?Symbol闹啦;
2.kegg數(shù)據(jù)庫(kù)各前綴含義
1)?K+num辕坝,表示在所有同源物種中具有相似結(jié)構(gòu)或功能的一類同源蛋白窍奋;(注:K大寫)---如,K04456 = 絲氨酸/蘇氨酸蛋白激酶酱畅;
2)ko+num琳袄,表示代謝通路名稱,表示一個(gè)特定的生物路徑纺酸;(注:ko小寫)?---如窖逗,ko04151 = PI3K-Akt信號(hào)通路;
3)M+num吁峻,表示模塊名稱?滑负;---如,M00676 = PI3K-Akt信號(hào)模塊用含;
4)map+num矮慕,表示KEGG中通用?代謝通路圖;無色啄骇;
5)hsa+num痴鳄,表示KEGG中某特定物種代謝通路圖;該類通路圖中通常有綠色方框缸夹,表示該方框?qū)儆谠撐锓N痪寻;hsa是人類的代號(hào)螺句,若是別的物種,該代號(hào)會(huì)變更橡类;
6)?C+num蛇尚,表示化合物名稱;如C00533 = NO (一氧化氮)
7)-.-.-.- 顾画,表示酶的名稱取劫;如EC2.7.11.1 = 絲氨酸/蘇氨酸激酶(即K04456,AKT)研侣;在代謝通路圖中谱邪,方框中通常會(huì)有-.-.-.-的數(shù)字,即表示酶庶诡;
8)R+num惦银,表示反應(yīng)名稱;
9)RC+num末誓,表示反應(yīng)類型扯俱;
10)RP+num,表示反應(yīng)物質(zhì)對(duì)喇澡。?
3. 各種ID轉(zhuǎn)換 ?
去HGNC數(shù)據(jù)庫(kù)下載頁(yè)面蘸吓,下載protein-coding gene.txt這個(gè)文件,里邊有各數(shù)據(jù)庫(kù)之間的ID對(duì)應(yīng)關(guān)系撩幽,可輕松應(yīng)對(duì)各種轉(zhuǎn)換。