我們通過GEO或者其他數(shù)據(jù)庫篩選出了一批顯著差異基因古瓤,接下來就需要分析這些基因參與了哪些功能,我們下一步需要進行GO功能注釋和KEGG(pathway)通路富集分析。那么睦焕,啥叫GO功能注釋呢藐握?以及什么叫KEGG(pathway)通路富集分析,我們所做的GO和KEGG是為了從這批差異基因中得知他們參與的功能與通路垃喊。
先說說GO猾普,GO(GENG ONTOLOGY)分別從功能、參與的生物途徑本谜、細胞中的定位初家,對基因產物進行了簡單注釋。所以通過GO富集分析可粗略的了解基因富集在哪些生物學功能乌助、途徑或細胞定位溜在。
再說說KEGG,大多數(shù)聽說KEGG(Kyoto encyclopedia of genes and genomes)的人都會把它當做一個基因通路(pathway)的數(shù)據(jù)庫他托,其實它的功能還不止于此掖肋。KEGG是一個整合了基因組、化學和系統(tǒng)功能信息的綜合數(shù)據(jù)庫上祈。
DAVID (the Database for Annotation培遵,Visualization and Integrated Discovery)的網(wǎng)址是http://david.abcc.ncifcrf.gov/。 DAVID是一個生物信息數(shù)據(jù)庫登刺,也是一款在線免費分析軟件籽腕,其整合了生物學數(shù)據(jù)和分析工具,為大規(guī)模的基因或蛋白列表(成百上千個基因ID或者蛋白ID列表)提供系統(tǒng)綜合的生物功能注釋信息纸俭,幫助用戶從中提取生物學信息皇耗。目前DAVID數(shù)據(jù)庫主要用于差異基因的功能和通路富集分析,對很多科研工作者來說揍很,是個非常好的工具郎楼。
準備輸入文件
需要一列類似的含有基因名數(shù)據(jù)
開始進入分析
選擇functioal annotation選項
(1)粘貼基因(2)選擇official—gene-symbol(3)選擇genelist(4)提交list
提交完成后,界面會彈出上面所示的提示框 窒悔,按確定即可呜袁。
按照如上流程進行,1 list1——2 Use——3選擇物種“homo sapines(人類)”——4 點擊Select Species
首先把所有默認選項都清空简珠,只選擇Gene_Ontology下的GOTERM_BP_DIRECT和CC阶界、MP和Pathways 下的KEGG_PATHWAY ,最后點擊 Functional Annotation chart聋庵,結果就出來了膘融。
可以點擊右上角的Download File 按鈕,將結果進行復制保存祭玉。其中結果包括功能和通路兩部分氧映。
Kobas數(shù)據(jù)庫
簡介
KOBAS(KEGG Orthology Based Annotation System)是一個被廣泛用于基因/蛋白質功能注釋和功能集富集的網(wǎng)頁版數(shù)據(jù)庫。使用者在給定一組基因或蛋白質脱货,該數(shù)據(jù)庫可以確定某些通路和基因本體論(GO)是否有統(tǒng)計學顯著性岛都。
KOBAS 3.0的輸入不支持gene symbol律姨,所以使用者在使用前需將Symbol ID轉換成Entrez Gene ID(或者)ensembl格式的ID。
推薦進行基因ID轉換的網(wǎng)站:gprofiler :http://biit.cs.ut.ee/gprofiler/gconvert.cgi
使用者需要(1)上傳或者粘貼含有基因列表的數(shù)據(jù)(2)選擇物種為homo sapines(人類)(3)確定輸出格式為ENSG(4)點擊RUN(5)下載注釋后的數(shù)據(jù):Export to CSV疗绣。下載的注釋后的數(shù)據(jù)如下所示:
KOBAS注釋
使用者將轉換后的ID輸入http://kobas.cbi.pku.edu.cn/anno_iden.php线召,根據(jù)研究對象類型,進行相應選擇:選擇KEGG Pathway與GO多矮,點擊Run;
將富集結果下載:
下載得到富集結果如下:
GO與KEGG富集分析哈打,DAVID和KOBAS是比較簡單同時受歡迎和認可的選擇塔逃。
相比之下,KOBAS畫出的圖更賞心悅目料仗,但KOBAS不支持直接輸入gene symbol湾盗,所以我們常常聯(lián)合DAVID和KOBAS聯(lián)合使用。
作者:柳葉刀與小鼠標
鏈接:http://www.reibang.com/p/344b9a1eb9b9
來源:簡書
著作權歸作者所有立轧。商業(yè)轉載請聯(lián)系作者獲得授權格粪,非商業(yè)轉載請注明出處。