DisGeNET數(shù)據(jù)庫介紹

數(shù)據(jù)庫概況:

人類疾病遺傳的基礎(chǔ)是精確醫(yī)學(xué)和藥物發(fā)現(xiàn)的核心。數(shù)據(jù)的可用性妥衣、碎片化、異構(gòu)性和概念描述的不一致性是疾病機(jī)制研究必須克服的問題陪拘。DisGeNET (http://www.disgenet.org)正是為了幫助科研工作者克服這些障礙而開發(fā)的數(shù)據(jù)庫,它收集了大量與人類疾病(Mendelian, complex and environmental

diseases)相關(guān)的變異和基因纤壁。DisGeNET整合了公共數(shù)據(jù)庫、GWAS目錄捺信、動物模型和科學(xué)文獻(xiàn)的數(shù)據(jù)酌媒。該數(shù)據(jù)庫的收據(jù)采用了統(tǒng)一的標(biāo)準(zhǔn)進(jìn)行注釋。此外迄靠,還提供了一些原始指標(biāo)秒咨,以幫助確定基因型與表型關(guān)系的優(yōu)先級≌浦浚可以通過web接口雨席、Cytoscape應(yīng)用程序、RDF SPARQL終端吠式、幾種編程語言的腳本和R包訪問這些信息陡厘。DisGeNET是一個多功能平臺,可用于不同的研究目的包括特定的人類疾病的分子基礎(chǔ)及其并發(fā)癥的研究,致病基因特性分析,輔助構(gòu)建藥物治療作用及藥物不良反應(yīng)假說,疾病候選基因的驗(yàn)證及文本挖掘方法的評價性能。目前最新版本的DisGeNET 為v6.0特占,它收錄了17,549 個基因和 24,166 個diseases, disorders, traits, 及clinical or abnormal human phenotypes 間的628,685 個gene-disease associations (GDAs)糙置。同時還收錄了117,337 個變異和 10,358 個疾病、性狀是目、表型間的210,498 variant-disease associations (VDAs)谤饭。可以通過疾病懊纳、基因或變異進(jìn)行搜索揉抵。此外,該平臺還提出了一個可以通過Cytoscape軟件運(yùn)行的插件嗤疯。

DisGeNET gene-disease association type ontology:

數(shù)據(jù)庫地址:

http://www.disgenet.org/home/

數(shù)據(jù)來源:

DisGeNET(v6.0)數(shù)據(jù)庫主要來源于已知數(shù)據(jù)庫和文獻(xiàn)的文本挖掘冤今。該收錄的數(shù)據(jù)庫情況如下表所示:

了解數(shù)據(jù)庫更多信息:http://disgenet.org/dbinfo

數(shù)據(jù)庫使用:

DisGeNET數(shù)據(jù)庫有多重接口可供選擇:

1.Web Interface

網(wǎng)頁版的數(shù)據(jù)庫主要包括檢索、瀏覽及數(shù)據(jù)下載等幾個主要功能身弊。數(shù)據(jù)檢索包括以基因辟汰、變異及者疾病為檢索詞進(jìn)行檢索:

瀏覽功能是以數(shù)據(jù)庫為單位進(jìn)行的,主要包括疾病信息阱佛、對應(yīng)基因/變異信息帖汞、疾病與基因/變異關(guān)系信息、證據(jù)信息凑术。以HPO數(shù)據(jù)庫為例:

2.R Package

在R上安裝disgenet2r包后后既可以進(jìn)行DisGeNET數(shù)據(jù)庫搜索翩蘸,也可以進(jìn)行可視化。但值得注意的是該R包目前的基于?DisGeNET v5.0 (May, 2017)淮逊。安裝和使用示例如下:

安裝:

##The package,disgenet2rcan be installed usingdevtoolsfrom this repository:

library(devtools)

install_bitbucket("ibi_group/disgenet2r")

數(shù)據(jù)庫檢索示例:

##以基因?yàn)闄z索詞進(jìn)行檢索

library(disgenet2r)

gq<-disgenetGene(gene=3953,

????database="ALL",

????score=c(">",0.1))

##以疾病為檢索詞進(jìn)行檢索

library(disgenet2r)

dq<-disgenetDisease(disease="umls:C0028754",

????database="ALL",

??? score=c('>',0.3))

3.Cytoscape App

安裝:

需要預(yù)裝Cytoscape催首,然后直接在Cytoscape安裝DisGeNET插件扶踊。


使用:

打開Cytoscape,按如下順序操作:

Cytoscape App主要功能就是將DisGeNET的數(shù)據(jù)用networks的形式進(jìn)行展示郎任,主要包括以下幾個方面:

a)? ? ?Generate gene-disease networks:即基因和疾病間networks秧耗,例如HPO數(shù)據(jù)庫中Asthma基因和疾病間networks示例如下:

b)? ? ?Generate variant-disease networks:即變異和疾病間networks,示例如下

c)? ? ? Generate gene or disease projection networks:即基因-基因間或者疾病-疾病間的networks舶治,示例如下

d)? ? ?Create networks by DisGeNET association type:即檢索某一關(guān)聯(lián)關(guān)系分井,并將其可視化,如下面的The CURATED GDA network for CausalMutations

e)? ? ? Create networks by disease class:對某一類疾病建立network霉猛,如下是營養(yǎng)代謝病network

f)? ? ?Create networks by gene, disease, or variant:可以不限制具體哪兩個(基因尺锚、變異、疾蚕场)間的關(guān)系瘫辩,而是通過過濾條件得到network,例如可以從以下幾方面進(jìn)行過濾:Source, Association Type,Disease Class, Score坛悉。下面是以MECP為檢索詞伐厌,過濾條件為Mental Disorders時構(gòu)建的網(wǎng)絡(luò)

g)? ? ?Multiple entity search in the DisGeNET App:包括匹配某一關(guān)鍵字的疾病或者基因的元素間構(gòu)建網(wǎng)絡(luò)、基于基因/變異列表構(gòu)建網(wǎng)絡(luò)吹散。如下圖是CTD數(shù)據(jù)庫中Alzheimer相關(guān)的基因弧械,包含了Alzheimer的所有亞型。

4.custom scripts

除了上述方法外還可以利用自己編寫的腳本(R空民、python刃唐、perl、)來進(jìn)一步使用數(shù)據(jù)庫界轩。例如可以利用以下腳本進(jìn)行自動化:

a)? ? 基于R進(jìn)行自動化:見“disGeNETAutomation.R”

b)? ?基于python進(jìn)行自動化:見“disgenet-automation.py”

數(shù)據(jù)庫優(yōu)勢:

The highlights of DisGeNETare the data integration, standardisation and a fine-grained tracking of theprovenance information

參考文獻(xiàn):

DisGeNET: a Cytoscape plugin to visualize, integrate, search and analyze

gene-disease networks.2010 Bioinformatics. PMID: 20861032

DisGeNET: a discovery platform for the dynamical exploration of human

diseases and their genes.2015 Database. PMCID: 4397996. PMID: 25877637DOI:?10.1093/database/bav028

DisGeNET-RDF: harnessing the innovative power of the Semantic Web to

explore the genetic basis of diseases.2016 Bioinformatics. PMCID:4937199. PMID: 27153650.DOI:?10.1093/bioinformatics/btw214

DisGeNET: a comprehensive platform integrating information on human

disease-associated genes and variants.2017 Nucleic Acids Res. PMCID:5210640. PMID: 27924018. DOI:?10.1093/nar/gkw943

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末画饥,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子浊猾,更是在濱河造成了極大的恐慌抖甘,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,548評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件葫慎,死亡現(xiàn)場離奇詭異衔彻,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)偷办,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,497評論 3 399
  • 文/潘曉璐 我一進(jìn)店門艰额,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人椒涯,你說我怎么就攤上這事柄沮。” “怎么了?”我有些...
    開封第一講書人閱讀 167,990評論 0 360
  • 文/不壞的土叔 我叫張陵祖搓,是天一觀的道長狱意。 經(jīng)常有香客問我,道長拯欧,這世上最難降的妖魔是什么详囤? 我笑而不...
    開封第一講書人閱讀 59,618評論 1 296
  • 正文 為了忘掉前任,我火速辦了婚禮镐作,結(jié)果婚禮上纬纪,老公的妹妹穿的比我還像新娘。我一直安慰自己滑肉,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,618評論 6 397
  • 文/花漫 我一把揭開白布摘仅。 她就那樣靜靜地躺著靶庙,像睡著了一般。 火紅的嫁衣襯著肌膚如雪娃属。 梳的紋絲不亂的頭發(fā)上六荒,一...
    開封第一講書人閱讀 52,246評論 1 308
  • 那天,我揣著相機(jī)與錄音矾端,去河邊找鬼掏击。 笑死,一個胖子當(dāng)著我的面吹牛秩铆,可吹牛的內(nèi)容都是我干的砚亭。 我是一名探鬼主播,決...
    沈念sama閱讀 40,819評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼殴玛,長吁一口氣:“原來是場噩夢啊……” “哼捅膘!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起滚粟,我...
    開封第一講書人閱讀 39,725評論 0 276
  • 序言:老撾萬榮一對情侶失蹤寻仗,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后凡壤,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體署尤,經(jīng)...
    沈念sama閱讀 46,268評論 1 320
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,356評論 3 340
  • 正文 我和宋清朗相戀三年亚侠,在試婚紗的時候發(fā)現(xiàn)自己被綠了曹体。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,488評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡盖奈,死狀恐怖混坞,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤究孕,帶...
    沈念sama閱讀 36,181評論 5 350
  • 正文 年R本政府宣布啥酱,位于F島的核電站,受9級特大地震影響厨诸,放射性物質(zhì)發(fā)生泄漏镶殷。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,862評論 3 333
  • 文/蒙蒙 一微酬、第九天 我趴在偏房一處隱蔽的房頂上張望绘趋。 院中可真熱鬧,春花似錦颗管、人聲如沸陷遮。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,331評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽帽馋。三九已至,卻和暖如春比吭,著一層夾襖步出監(jiān)牢的瞬間绽族,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,445評論 1 272
  • 我被黑心中介騙來泰國打工衩藤, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留吧慢,地道東北人。 一個月前我還...
    沈念sama閱讀 48,897評論 3 376
  • 正文 我出身青樓赏表,卻偏偏與公主長得像检诗,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子底哗,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,500評論 2 359

推薦閱讀更多精彩內(nèi)容

  • 目的: 利用高通量測序數(shù)據(jù)進(jìn)行致病基因的挖掘岁诉,可根據(jù)樣本情況采用不同的分析方法,但無論哪種方法最終都將面臨從眾多c...
    bioYIYI閱讀 20,726評論 1 96
  • 轉(zhuǎn)載 :https://www.plob.org/article/3856.html 生物信息數(shù)據(jù)庫與查詢 近年來...
    oddxix閱讀 10,967評論 0 37
  • 腫瘤研究相關(guān)數(shù)據(jù)庫: 最經(jīng)典的Cosmic數(shù)據(jù)庫COSMIC 全稱:Catalogue of somatic mu...
    happyxhz閱讀 6,688評論 0 19
  • 我要的自由哪跋选! 黑暗中誰絆倒了我的馬 背后的冷箭呼嘯 要將一切希望都抹殺 我要的自由哪涕癣! 你們說好了給我鮮花 可是...
    日夢白閱讀 165評論 0 1
  • 為什么你制定計劃的時候信心滿滿,最后卻總是完不成前标? 為什么我們明知概率極低坠韩,卻依然喜歡買彩票? 為什么每一個決定都...
    無為_8a30閱讀 522評論 0 0