數(shù)據(jù)庫概況:
人類疾病遺傳的基礎(chǔ)是精確醫(yī)學(xué)和藥物發(fā)現(xiàn)的核心。數(shù)據(jù)的可用性妥衣、碎片化、異構(gòu)性和概念描述的不一致性是疾病機(jī)制研究必須克服的問題陪拘。DisGeNET (http://www.disgenet.org)正是為了幫助科研工作者克服這些障礙而開發(fā)的數(shù)據(jù)庫,它收集了大量與人類疾病(Mendelian, complex and environmental
diseases)相關(guān)的變異和基因纤壁。DisGeNET整合了公共數(shù)據(jù)庫、GWAS目錄捺信、動物模型和科學(xué)文獻(xiàn)的數(shù)據(jù)酌媒。該數(shù)據(jù)庫的收據(jù)采用了統(tǒng)一的標(biāo)準(zhǔn)進(jìn)行注釋。此外迄靠,還提供了一些原始指標(biāo)秒咨,以幫助確定基因型與表型關(guān)系的優(yōu)先級≌浦浚可以通過web接口雨席、Cytoscape應(yīng)用程序、RDF SPARQL終端吠式、幾種編程語言的腳本和R包訪問這些信息陡厘。DisGeNET是一個多功能平臺,可用于不同的研究目的包括特定的人類疾病的分子基礎(chǔ)及其并發(fā)癥的研究,致病基因特性分析,輔助構(gòu)建藥物治療作用及藥物不良反應(yīng)假說,疾病候選基因的驗(yàn)證及文本挖掘方法的評價性能。目前最新版本的DisGeNET 為v6.0特占,它收錄了17,549 個基因和 24,166 個diseases, disorders, traits, 及clinical or abnormal human phenotypes 間的628,685 個gene-disease associations (GDAs)糙置。同時還收錄了117,337 個變異和 10,358 個疾病、性狀是目、表型間的210,498 variant-disease associations (VDAs)谤饭。可以通過疾病懊纳、基因或變異進(jìn)行搜索揉抵。此外,該平臺還提出了一個可以通過Cytoscape軟件運(yùn)行的插件嗤疯。
DisGeNET gene-disease association type ontology:
數(shù)據(jù)庫地址:
http://www.disgenet.org/home/
數(shù)據(jù)來源:
DisGeNET(v6.0)數(shù)據(jù)庫主要來源于已知數(shù)據(jù)庫和文獻(xiàn)的文本挖掘冤今。該收錄的數(shù)據(jù)庫情況如下表所示:
了解數(shù)據(jù)庫更多信息:http://disgenet.org/dbinfo
數(shù)據(jù)庫使用:
DisGeNET數(shù)據(jù)庫有多重接口可供選擇:
1.Web Interface:
網(wǎng)頁版的數(shù)據(jù)庫主要包括檢索、瀏覽及數(shù)據(jù)下載等幾個主要功能身弊。數(shù)據(jù)檢索包括以基因辟汰、變異及者疾病為檢索詞進(jìn)行檢索:
瀏覽功能是以數(shù)據(jù)庫為單位進(jìn)行的,主要包括疾病信息阱佛、對應(yīng)基因/變異信息帖汞、疾病與基因/變異關(guān)系信息、證據(jù)信息凑术。以HPO數(shù)據(jù)庫為例:
2.R Package :
在R上安裝disgenet2r包后后既可以進(jìn)行DisGeNET數(shù)據(jù)庫搜索翩蘸,也可以進(jìn)行可視化。但值得注意的是該R包目前的基于?DisGeNET v5.0 (May, 2017)淮逊。安裝和使用示例如下:
安裝:
##The package,disgenet2rcan be installed usingdevtoolsfrom this repository:
library(devtools)
install_bitbucket("ibi_group/disgenet2r")
數(shù)據(jù)庫檢索示例:
##以基因?yàn)闄z索詞進(jìn)行檢索
library(disgenet2r)
gq<-disgenetGene(gene=3953,
????database="ALL",
????score=c(">",0.1))
##以疾病為檢索詞進(jìn)行檢索
library(disgenet2r)
dq<-disgenetDisease(disease="umls:C0028754",
????database="ALL",
??? score=c('>',0.3))
3.Cytoscape App:
安裝:
需要預(yù)裝Cytoscape催首,然后直接在Cytoscape安裝DisGeNET插件扶踊。
使用:
打開Cytoscape,按如下順序操作:
Cytoscape App主要功能就是將DisGeNET的數(shù)據(jù)用networks的形式進(jìn)行展示郎任,主要包括以下幾個方面:
a)? ? ?Generate gene-disease networks:即基因和疾病間networks秧耗,例如HPO數(shù)據(jù)庫中Asthma基因和疾病間networks示例如下:
b)? ? ?Generate variant-disease networks:即變異和疾病間networks,示例如下
c)? ? ? Generate gene or disease projection networks:即基因-基因間或者疾病-疾病間的networks舶治,示例如下
d)? ? ?Create networks by DisGeNET association type:即檢索某一關(guān)聯(lián)關(guān)系分井,并將其可視化,如下面的The CURATED GDA network for CausalMutations
e)? ? ? Create networks by disease class:對某一類疾病建立network霉猛,如下是營養(yǎng)代謝病network
f)? ? ?Create networks by gene, disease, or variant:可以不限制具體哪兩個(基因尺锚、變異、疾蚕场)間的關(guān)系瘫辩,而是通過過濾條件得到network,例如可以從以下幾方面進(jìn)行過濾:Source, Association Type,Disease Class, Score坛悉。下面是以MECP為檢索詞伐厌,過濾條件為Mental Disorders時構(gòu)建的網(wǎng)絡(luò)
g)? ? ?Multiple entity search in the DisGeNET App:包括匹配某一關(guān)鍵字的疾病或者基因的元素間構(gòu)建網(wǎng)絡(luò)、基于基因/變異列表構(gòu)建網(wǎng)絡(luò)吹散。如下圖是CTD數(shù)據(jù)庫中Alzheimer相關(guān)的基因弧械,包含了Alzheimer的所有亞型。
4.custom scripts
除了上述方法外還可以利用自己編寫的腳本(R空民、python刃唐、perl、)來進(jìn)一步使用數(shù)據(jù)庫界轩。例如可以利用以下腳本進(jìn)行自動化:
a)? ? 基于R進(jìn)行自動化:見“disGeNETAutomation.R”
b)? ?基于python進(jìn)行自動化:見“disgenet-automation.py”
數(shù)據(jù)庫優(yōu)勢:
The highlights of DisGeNETare the data integration, standardisation and a fine-grained tracking of theprovenance information
參考文獻(xiàn):
DisGeNET: a Cytoscape plugin to visualize, integrate, search and analyze
gene-disease networks.2010 Bioinformatics. PMID: 20861032
DisGeNET: a discovery platform for the dynamical exploration of human
diseases and their genes.2015 Database. PMCID: 4397996. PMID: 25877637DOI:?10.1093/database/bav028
DisGeNET-RDF: harnessing the innovative power of the Semantic Web to
explore the genetic basis of diseases.2016 Bioinformatics. PMCID:4937199. PMID: 27153650.DOI:?10.1093/bioinformatics/btw214
DisGeNET: a comprehensive platform integrating information on human
disease-associated genes and variants.2017 Nucleic Acids Res. PMCID:5210640. PMID: 27924018. DOI:?10.1093/nar/gkw943