首先,基因本體論(Gene Ontology)和基因文庫(kù)不是同一概念丁逝。
我從下面幾個(gè)方面講一下GO的一些概 念和基本方法(感謝劉老師提供的資料):
1. Ontology(本體)的定義
2. 為什么要使用Gene Ontology
3. GO 概念嘱支、術(shù)語(yǔ)
4. GO 關(guān)系
5. GO 公理
6. GO 數(shù)據(jù)庫(kù)簡(jiǎn)介
7. GO 注釋方法
8. GO相關(guān)分析軟件
1. Ontology(本體)的定義 什么叫本體袁滥?
本體是指是在一定知識(shí)范圍內(nèi),對(duì)所談?wù)摰囊唤M概念革屠,對(duì)它們給出一種語(yǔ)義約定。
Gruber提出了一種四元素表示方法排宰,即一個(gè)本體中的四個(gè)主要元素是:
概念(concepts)
關(guān)系(relations)
實(shí)例(instances)
公理(axioms) 也就是說(shuō)對(duì)于一個(gè)本體而言似芝,至少需要這四個(gè)元素來(lái)構(gòu)成;我們的基因本體(Gene Ontology)也遵循這 個(gè)原則板甘。
2. 為什么要使用Gene Ontology 為了查找某個(gè)研究領(lǐng)域的相關(guān)信息党瓮,生物學(xué)家往往要花費(fèi)大量的時(shí)間,
更糟糕的是虾啦,不同的生物學(xué)數(shù)據(jù)庫(kù) 可能會(huì)使用不同的術(shù)語(yǔ)麻诀,
好比是一些方言一樣,這讓信息查找更加麻煩傲醉,尤其是使得機(jī)器查找無(wú)章可循蝇闭。
Gene Ontology(GO)就是為了解決這種問題而發(fā)起的一個(gè)項(xiàng)目。
3. GO 概念硬毕、術(shù)語(yǔ)
Gene Ontology中最基本的概念是 term 呻引。
GO里面的每一個(gè)entry都有一個(gè)唯一的數(shù)字標(biāo)記,形如 GO: nnnnnnn吐咳,還有一個(gè)term名逻悠,比如 "cell", "fibroblast growth factor receptor binding",或者 "signal transduction"韭脊。
每個(gè)term都屬于一個(gè)ontology童谒,總共有三個(gè)ontology,它們分別是molecular function, cellular component和biological process沪羔。
4. GO 關(guān)系
Gene Ontology的結(jié)構(gòu)是一個(gè)有向無(wú)環(huán)圖饥伊,有點(diǎn)類似于分類樹,不同點(diǎn)在于Gene Ontology 的結(jié)構(gòu)中一 個(gè) term可以有不止一個(gè)parent
**GO term關(guān)系 **
GO的本體被構(gòu)造為有向無(wú)環(huán)圖蔫饰,其中術(shù)語(yǔ)作為圖中的節(jié)點(diǎn)琅豆,并且術(shù)語(yǔ)之間的關(guān)系作為邊緣。 正如每個(gè)術(shù) 語(yǔ)被定義一樣篓吁,因此GO術(shù)語(yǔ)之間的關(guān)系也被分類和定義茫因。
主要的關(guān)系有以下幾種:
is a
part of
regulates
negatively regulates
positively regulates
occurs_in
has_part
5. GO 公理
A is a B
B is part of C
we can infer that A is part of C
is a * part of → part of
is a * is a → is a
part of * part of → part of
part of * is a → part of
is a * part of → part of
part of * is a
part of * have part
has part * has part → has part
has part * is a → has part
is a * has part → has part
B regulate A; some A regulated by B
positively regulates and negatively regulates
is a * regulates → regulates
regulates * is a → regulates
regulates * part of → regulates
regulates * part of → regulates
part of * regulates → ???
regulates * regulates → ???
6. GO 數(shù)據(jù)庫(kù)簡(jiǎn)介
Download Ontology
GO數(shù)據(jù)庫(kù)包括了下面三個(gè)主要的文件:
go-basic.obo
is_a, part_of, regulates, negatively_regulates and positively_regulates excludes relationships that cross the 3 main GO hierarchies
go.obo go.owl
includes has_part occurs_in
go-plus.owl
includes cross ontology relationships ChEBI, cell ontology and Uberon
GO slim:
cut-down versions of the GO ontologies containing a subset of the terms in the whole GO
7. GO 注釋方法
GO官方下載 geneontology.org/page/d
1.基因組數(shù)據(jù)庫(kù)注釋 Ensemble - BioMart
2.基因數(shù)據(jù)庫(kù)JGI phytozome(植物)
3.利用GO與其他數(shù)據(jù)庫(kù)映射文件 Download Mappings
4、利用Blast2GO及對(duì)應(yīng)數(shù)據(jù)庫(kù)進(jìn)行注釋
數(shù)據(jù)庫(kù)來(lái)源
? NCBI gene_info
? NCBI gene2accession
? PIR idmapping
? geneontology assocdb-data
8. GO相關(guān)分析軟件
1.Gene Ontology 有向無(wú)環(huán)圖
amigo2
AmiGO 2: Visualize
2.EMBL-EBI QuickGO
GO Slims and GO Term Comparison
3.Gene Ontology 分類 富集 - PANTHER
PANTHER - Gene List Analysis