在進(jìn)行差異基因表達(dá)分析時(shí),得到顯著差異基因后吧黄,接下來(lái)就需要分析這些基因參與了哪些功能趟咆,常見(jiàn)的就是GO功能注釋和KEGG通路富集分析,今天為大家介紹在線分析工具的使用——DAVID與KOBAS 3.0每庆。
DAVID是一個(gè)生物信息數(shù)據(jù)庫(kù),其整合了生物學(xué)數(shù)據(jù)和分析工具今穿,為大規(guī)模的基因或蛋白列表提供系統(tǒng)綜合的生物功能注釋信息缤灵,幫助用戶從中提取生物學(xué)信息。目前DAVID數(shù)據(jù)庫(kù)主要用于差異基因的功能和通路富集分析蓝晒。
KOBAS是一個(gè)被廣泛用于基因/蛋白質(zhì)功能注釋和功能集富集的網(wǎng)頁(yè)版數(shù)據(jù)庫(kù)腮出。使用者在給定一組基因或蛋白質(zhì),該數(shù)據(jù)庫(kù)可以確定某些通路和基因本體論(GO)是否有統(tǒng)計(jì)學(xué)顯著性芝薇。
Step 1:打開(kāi)網(wǎng)站https://david.ncifcrf.gov/胚嘲,進(jìn)入DAVID首頁(yè),然后點(diǎn)擊Start Analysis洛二;
Step 2:輸入所需要富集的顯著差異基因的基因名馋劈,并在select identifier中選擇official_gene_symbol立倍,然后在List type中選擇gene list,最后點(diǎn)擊submit list侣滩;
Step 3:由于本次分析使用的是人類癌細(xì)胞口注,故在list和background中的物種都選擇homo sapiens,讀者可根據(jù)自己研究物種的類型進(jìn)行選擇君珠;
Step 4:由于KOBAS 3.0的輸入不支持gene symbol寝志,所以使用者在使用前需將Symbol ID轉(zhuǎn)換成Entrez Gene ID(或者)ensembl格式的ID。
或者策添,也可使用gprofiler把基因ID進(jìn)行轉(zhuǎn)換http://biit.cs.ut.ee/gprofiler/convert材部。
操作流程:
(1)上傳或者粘貼含有基因列表的數(shù)據(jù)
(2)選擇物種為homo sapines
(3)確定輸出格式為ENSG
(4)點(diǎn)擊RUN
(5)下載注釋后的數(shù)據(jù):Export to CSV
Step 5:KOBAS注釋。打開(kāi)KOBAS 3.0網(wǎng)站http://kobas.cbi.pku.edu.cn/kobas3/?t=1唯竹,點(diǎn)擊“gene-list enrichment”乐导,根據(jù)研究對(duì)象類型,進(jìn)行相應(yīng)選擇浸颓。比如在這里物臂,我們?cè)凇癟ype”里選中“Entrez Gene ID”,在“Species”選“Homo sapiens”产上,再把轉(zhuǎn)換后的ID復(fù)制黏貼進(jìn)去:
選擇KEGG Pathway與GO棵磷,點(diǎn)擊Run;
得到富集結(jié)果如下:
最后晋涣,可用Cytoscape軟件把得到的KEGG通路和DEG數(shù)據(jù)做出可視化圖片仪媒,就能清晰看出兩者之間的關(guān)系。如下圖谢鹊,我們可以發(fā)現(xiàn)哪些基因表達(dá)下調(diào)算吩,哪些基因參與什么樣的通路等等。
圖片來(lái)自于https://doi.org/10.2174/1389202920666191011092410
大家可參考以下這篇2011年中國(guó)學(xué)者們?cè)凇禢ucleic Acids Research》發(fā)表的文章佃扼,它詳細(xì)介紹了KOBAS的使用偎巢。
https://doi.org/10.1093/nar/gkr483
GO與KEGG富集分析,往往同時(shí)出現(xiàn)在不同場(chǎng)合松嘶,DAVID其實(shí)就可以做GO與KEGG富集分析艘狭,但相比之下,KOBAS畫(huà)出的圖更賞心悅目翠订,但KOBAS不支持直接輸入gene symbol ,所以我們常常聯(lián)合使用DAVID和KOBAS遵倦。