生物與計(jì)算機(jī)的結(jié)合讓生物進(jìn)入大數(shù)據(jù)時(shí)代,為方便管理各種生物數(shù)據(jù)票彪,科學(xué)家們開(kāi)發(fā)了各式各樣的生物數(shù)據(jù)庫(kù)红淡。了解與自己研究領(lǐng)域相關(guān)的數(shù)據(jù)庫(kù),并加以利用可能會(huì)使研究工作得到事半功倍的效果降铸。在此將常用數(shù)據(jù)庫(kù)按照以下分類(lèi)方式大致整理了一下在旱,方便檢索。
分類(lèi)不準(zhǔn)或有遺漏的歡迎指出推掸,后續(xù)將不斷推出更新版本桶蝎。
目錄
Meta databases
Model organism databases
Nucleic acid databases
3.1 DNA databases
3.2 Gene expression databases (mostly microarray data)
3.3 Phenotype databases
3.4 RNA databasesAmino acid / protein databases
4.1 Protein sequence databases
4.2 Protein structure databases
4.3 Protein model databases
4.4 Protein-protein and other molecular interactionsSignal transduction pathway databases
Metabolic pathway and protein function databases
Additional databases
7.1 Exosomal databases
7.2 Mathematical model databases
7.3 Taxonomic databases
7.4 Radiologic databasesWiki-style databases
Specialized databases
1. Meta databases
元數(shù)據(jù)庫(kù),合并不同來(lái)源的相關(guān)數(shù)據(jù)以更新的或更加方便的形式提供新的數(shù)據(jù)谅畅,通俗的講就是數(shù)據(jù)庫(kù)的數(shù)據(jù)庫(kù)登渣,代表性的數(shù)據(jù)庫(kù)主要有以下幾個(gè):
ConsensusPathDB
網(wǎng)址:http://consensuspathdb.org/
描述:分子功能互作數(shù)據(jù)庫(kù),基于32個(gè)公共數(shù)據(jù)庫(kù)毡泻,整合了人類(lèi)蛋白質(zhì)相互作用胜茧,遺傳相互作用信號(hào),代謝,基因調(diào)控和藥物 - 靶標(biāo)相互作用的信息呻顽。Entrez
網(wǎng)址:https://www.ncbi.nlm.nih.gov/Class/MLACourse/Modules/Entrez/complex_boolean.html
描述:Entrez跨數(shù)據(jù)庫(kù)全局查詢(xún)搜索系統(tǒng)是一個(gè)聯(lián)合搜索引擎或門(mén)戶網(wǎng)站雹顺,允許用戶在NCBI網(wǎng)站上搜索許多離散的健康科學(xué)數(shù)據(jù)庫(kù)。Neuroscience Information Framework
網(wǎng)址:https://neuinfo.org//
描述:整合了數(shù)百種神經(jīng)科學(xué)相關(guān)資源廊遍,包括實(shí)驗(yàn)嬉愧,臨床和轉(zhuǎn)化神經(jīng)科學(xué)數(shù)據(jù)庫(kù),知識(shí)庫(kù)喉前,地圖集和遺傳/基因組資源等没酣。GeneCard
網(wǎng)址:https://www.genecards.org/
描述:自動(dòng)整合125個(gè)數(shù)據(jù)庫(kù),包含基因組被饿、轉(zhuǎn)錄組四康、蛋白組搪搏、遺傳狭握、臨床和功能信息的龐大人基因組數(shù)據(jù)庫(kù)。Ensembl Genomes
網(wǎng)址:http://ensemblgenomes.org/
描述:該項(xiàng)目由EMBL運(yùn)營(yíng)疯溺,提供細(xì)菌论颅、原生生物、真菌囱嫩、植物和無(wú)脊椎動(dòng)物后生動(dòng)物的基因組數(shù)據(jù)恃疯。
- UCSC Genome
網(wǎng)址: http://genome.ucsc.edu
描述:主要是動(dòng)物基因組信息,基因組注釋?zhuān)蚪M保守性和基因組共線性數(shù)據(jù)墨闲。
- Human protein atlas
網(wǎng)址:http://www.proteinatlas.org/
描述:人體蛋白在細(xì)胞今妄、組織、病理?xiàng)l件下的表達(dá)
2. Model organism databases
模式生物數(shù)據(jù)庫(kù)鸳碧,為深入研究模式生物提供生物數(shù)據(jù)盾鳞,如:
Personal Genome Project
網(wǎng)址:https://www.personalgenomes.org/
描述:來(lái)自世界各地的100,00名志愿者的人類(lèi)基因組計(jì)劃。Mouse Genome Database(MGD)
網(wǎng)址:http://www.informatics.jax.org/
描述:MGD數(shù)據(jù)庫(kù)是整合了國(guó)際上實(shí)驗(yàn)室小鼠生物數(shù)據(jù)的資源庫(kù)瞻离,提供小鼠相關(guān)的基因組腾仅、綜合遺傳等信息。Rat Genome Database (RGD):
網(wǎng)址:https://rgd.mcw.edu/
描述:大鼠基因組數(shù)據(jù)庫(kù)套利。PomBase
網(wǎng)址:https://www.pombase.org/
描述:裂殖酵母Schizosaccharomyces pombe的知識(shí)庫(kù)推励。Saccharomyces Genome Database (SGD):
網(wǎng)址:https://www.yeastgenome.org/
描述:酵母模型生物的基因組數(shù)據(jù)庫(kù)TAIR
網(wǎng)址 https://www.arabidopsis.org/
描述:最全的擬南芥資源數(shù)據(jù)庫(kù)。政府為我們付費(fèi)購(gòu)買(mǎi)了使用權(quán)肉迫,以至于不少人沒(méi)感覺(jué)到TAIR已經(jīng)收費(fèi)了验辞。Legume Information System (LIS)
網(wǎng)址:https://legumeinfo.org/
描述:豆科植物的基因組數(shù)據(jù)庫(kù)。Wormbase:
網(wǎng)址:https://wormbase.org/#012-34-5
描述:關(guān)于線蟲(chóng)模式生物秀麗隱桿線蟲(chóng)的生物學(xué)和基因組在線生物數(shù)據(jù)庫(kù)喊衫,還包含其他相關(guān)線蟲(chóng)的信息受神。Xenbase:
網(wǎng)址:http://www.xenbase.org/entry/
描述:模式生物非洲爪蟾(Xenopus tropicalis)和非洲爪蟾(Xenopus laevis)的基因組數(shù)據(jù)庫(kù)。Zebrafish Information Network:
網(wǎng)址:http://zfin.org/
描述:斑馬魚(yú)的基因組數(shù)據(jù)庫(kù)格侯。FlyBase:
網(wǎng)址:http://flybase.org/
描述:模式生物果蠅的基因組數(shù)據(jù)庫(kù)鼻听。UCSC Malaria Genome Browser:
網(wǎng)址:http://enacademic.com/dic.nsf/enwiki/7907997
描述:UCSC瘧疾基因組瀏覽器是研究瘧疾(如惡性瘧原蟲(chóng)等)基因組的生物信息學(xué)研究工具财著。
3. Nucleic acid databases
3.1 DNA databases
核酸數(shù)據(jù)庫(kù)分為一級(jí)數(shù)據(jù)庫(kù)(Primary databases)和二級(jí)數(shù)據(jù)庫(kù)(Secondary databases)
3.1.1 一級(jí)核酸數(shù)據(jù)庫(kù)
下面三個(gè)數(shù)據(jù)庫(kù)是核酸的主數(shù)據(jù)庫(kù),存儲(chǔ)來(lái)自所有生物的核酸序列撑碴,接受用戶提交核酸序列撑教,每天交換更新數(shù)據(jù)以實(shí)現(xiàn)他們之間的最佳同步。
DNA Data Bank of Japan
網(wǎng)址:https://www.ddbj.nig.ac.jp/index-e.htmlEMBL (European Bioinformatics Institute)
網(wǎng)址:https://www.embl.org/NCBI (National Center for Biotechnology Information)
網(wǎng)址:https://www.ncbi.nlm.nih.gov/
3.1.2 二級(jí)核酸數(shù)據(jù)庫(kù)
數(shù)目很多愤兵,先列出一些,歡迎補(bǔ)充:
23andMe’s database
網(wǎng)址:https://www.23andme.com/en-int/
描述:23andMe是一家私營(yíng)的個(gè)人基因組學(xué)生物技術(shù)公司 排吴,主要業(yè)務(wù)是基于唾液對(duì)消費(fèi)者進(jìn)行基因檢測(cè)秆乳,并向客戶提供基因檢測(cè)報(bào)告。OMIM (Online Mendelian Inheritance in Man):
網(wǎng)址:https://omim.org/
描述:一個(gè)管理人類(lèi)基因和人類(lèi)遺傳疾病特征的數(shù)據(jù)庫(kù)钻哩。RefSeq
網(wǎng)址:https://www.ncbi.nlm.nih.gov/refseq/
描述:參考序列數(shù)據(jù)庫(kù)收集了從病毒屹堰、細(xì)菌到真核生物等主要生物的核酸序列(DNA、RNA)及其蛋白質(zhì)常產(chǎn)物街氢。1000 Genomes Project:
網(wǎng)址:http://www.internationalgenome.org/
描述:2008年1月啟動(dòng)的項(xiàng)目扯键,對(duì)來(lái)自不同種族群體的一千多名匿名參與者的基因組進(jìn)行了分析,并將數(shù)據(jù)公布于眾珊肃。SNP / Disease Databases
網(wǎng)址:https://www.snpedia.com/
描述:人SNP位點(diǎn)對(duì)表型的影響和貢獻(xiàn)度數(shù)據(jù)庫(kù)
3.2 Gene expression databases
這些數(shù)據(jù)庫(kù)收集基因組序列荣刑,注釋并分析他們,以提供公共訪問(wèn)伦乔。主要包括:
ArrayExpress
網(wǎng)址:https://www.ebi.ac.uk/arrayexpress/
描述:功能基因組數(shù)據(jù)存檔厉亏;存儲(chǔ)來(lái)自EMBL的高通量功能基因組學(xué)實(shí)驗(yàn)的數(shù)據(jù);展示方式很炫酷评矩。Bioinformatic Harvester
網(wǎng)址:Ensembl: http://asia.ensembl.org/index.html
描述:為人類(lèi)叶堆,小鼠,其他脊椎動(dòng)物和真核生物基因組提供自動(dòng)注釋的數(shù)據(jù)庫(kù)BioGPS
網(wǎng)址:http://biogps.org/#goto=welcome
描述:強(qiáng)大的基因和蛋白表達(dá)注釋平臺(tái)-
Gene Disease Database
基因疾病數(shù)據(jù)庫(kù)斥杜,通過(guò)整理表型-基因型關(guān)系和基因-疾病機(jī)制虱颗,以及多種復(fù)合相互作用來(lái)理解復(fù)雜疾病的潛在機(jī)制。主要數(shù)據(jù)庫(kù)如下:5.1 The Comparative Toxicogenomics Database (CTD)
<pre style="overflow-wrap: break-word !important; margin-top: 0px; margin-bottom: 0px; padding: 1px 2px; max-width: 100%; border-radius: 3px; background-color: rgb(247, 247, 247); color: inherit; line-height: 1.5em; overflow: auto; border-left: 4px solid rgb(108, 162, 252); box-sizing: border-box !important;"> 網(wǎng)址:http://ctdbase.org/</pre>
5.2 The Universal Protein Resource (UNIPROT)
<pre style="overflow-wrap: break-word !important; margin-top: 0px; margin-bottom: 0px; padding: 1px 2px; max-width: 100%; border-radius: 3px; background-color: rgb(247, 247, 247); color: inherit; line-height: 1.5em; overflow: auto; border-left: 4px solid rgb(108, 162, 252); box-sizing: border-box !important;"> 網(wǎng)址:https://www.uniprot.org</pre>
5.3 The Online Mendelian Inheritance in Man
<pre style="overflow-wrap: break-word !important; margin-top: 0px; margin-bottom: 0px; padding: 1px 2px; max-width: 100%; border-radius: 3px; background-color: rgb(247, 247, 247); color: inherit; line-height: 1.5em; overflow: auto; border-left: 4px solid rgb(108, 162, 252); box-sizing: border-box !important;"> 網(wǎng)址:https://www.ncbi.nlm.nih.gov/omim</pre>
5.5 The Ensembl genome database project
<pre style="overflow-wrap: break-word !important; margin-top: 0px; margin-bottom: 0px; padding: 1px 2px; max-width: 100%; border-radius: 3px; background-color: rgb(247, 247, 247); color: inherit; line-height: 1.5em; overflow: auto; border-left: 4px solid rgb(108, 162, 252); box-sizing: border-box !important;"> 網(wǎng)址:http://www.ensembl.org/</pre>
5.6 The Gene Disease Associations Database DisGeNET
<pre style="overflow-wrap: break-word !important; margin-top: 0px; margin-bottom: 0px; padding: 1px 2px; max-width: 100%; border-radius: 3px; background-color: rgb(247, 247, 247); color: inherit; line-height: 1.5em; overflow: auto; border-left: 4px solid rgb(108, 162, 252); box-sizing: border-box !important;"> 網(wǎng)址:http://www.disgenet.org/</pre>
Gene Expression Omnibus (GEO):
網(wǎng)址:https://www.ncbi.nlm.nih.gov/geo/
描述:來(lái)自美國(guó)國(guó)家癌癥研究所(NCI)的公共功能基因組數(shù)據(jù)庫(kù)蔗喂,它支持基于陣列和序列的數(shù)據(jù)忘渔,并提供了用于查詢(xún)和下載基因表達(dá)譜的工具。
3.3 Phenotype databases
PHI-base:
網(wǎng)址:http://www.phi-base.org/
描述:病原體 - 宿主相互作用數(shù)據(jù)庫(kù)缰儿。細(xì)胞表型數(shù)據(jù)庫(kù)
網(wǎng)址:https://www.ebi.ac.uk/fg/sym
描述:基于RNAi的細(xì)胞表型收集dbGAP
網(wǎng)址:https://www.ncbi.nlm.nih.gov/gap
描述:基因型-表型數(shù)據(jù)庫(kù)畦粮,來(lái)源于GWAS、醫(yī)學(xué)測(cè)序、分子診斷等The Human Phenotype Ontology
網(wǎng)址:https://hpo.jax.org/app/
描述:人類(lèi)疾病表型描述的標(biāo)準(zhǔn)化術(shù)語(yǔ)宣赔,類(lèi)比于Gene Ontology. 現(xiàn)有13000個(gè)條目和156,000關(guān)于遺傳病的注釋预麸。GWAS central
網(wǎng)址: https://www.gwascentral.org
描述:包含2,974,967個(gè)SNP與829個(gè)MeSH疾病、表型之間的69,986,326個(gè)關(guān)聯(lián)儒将。European genome-phenome archive
網(wǎng)址:https://ega-archive.org
描述:生物醫(yī)學(xué)研究中涉及的遺傳和表型數(shù)據(jù)關(guān)聯(lián)庫(kù)Monarch
網(wǎng)址:https://monarchinitiative.org
描述:基因型-表型數(shù)據(jù)庫(kù)吏祸,表型相似性度量Cellular Phenotype Database
網(wǎng)址:http://www.ebi.ac.uk/fg/sym
描述:存儲(chǔ)來(lái)自高通量表型研究的數(shù)據(jù),可以搜索感興趣的表型并檢索相關(guān)靶基因和RNAiGenomeRNAi
網(wǎng)址:http://www.genomernai.org/
描述:包含來(lái)自果蠅和人RNA干擾篩選的表型數(shù)據(jù)庫(kù)Genomics of Drug Sensitivity in Cancer
網(wǎng)址:http://www.cancerrxgene.org/
描述:篩選了多種抗癌療法人類(lèi)癌細(xì)胞系钩蚊,通過(guò)與基因組數(shù)據(jù)關(guān)聯(lián)以識(shí)別藥物靶標(biāo)贡翘,同時(shí)為臨床應(yīng)用提供信息GenomeCRISPR
網(wǎng)址:http://genomecrispr.dkfz.de/
描述:用于高通量CRISPR / Cas9篩選實(shí)驗(yàn)的數(shù)據(jù)庫(kù)Cellular Microscopy Phenotype Ontology (CMPO)
網(wǎng)址:www.ebi.ac.uk/cmpo/
描述:CMPO為描述與整個(gè)細(xì)胞、細(xì)胞成分砰逻、細(xì)胞過(guò)程和細(xì)胞群體有關(guān)的表型特性提供了一種物種中立的詞匯鸣驱。Human Phenotype Ontology (HPO)
網(wǎng)址:https://hpo.jax.org/app/
描述:提供了人類(lèi)疾病中表型異常的標(biāo)準(zhǔn)化詞匯
3.4 RNA databases
miRBase
網(wǎng)址:http://www.mirbase.org/
描述:存儲(chǔ)microRNA序列和注釋的數(shù)據(jù)庫(kù)。Rfam:
網(wǎng)址:http://rfam.org/
描述:一個(gè)包含非編碼RNA(ncRNA)家族和其他類(lèi)型RNA信息的數(shù)據(jù)庫(kù)蝠咆。RNAcentral
網(wǎng)址:https://rnacentral.org/
描述:非編碼RNA序列數(shù)據(jù)庫(kù)踊东。
4. Amino acid / protein databases
4.1 Protein sequence databases
Swiss-Prot/Uniprot
網(wǎng)址:https://www.uniprot.org/
描述:結(jié)合了從文獻(xiàn)中提取的信息和生物鑒定者評(píng)估的計(jì)算分析,是一個(gè)手動(dòng)注釋的非冗余蛋白質(zhì)序列數(shù)據(jù)庫(kù)勺美。Database of Interacting Proteins (Univ. of California)
網(wǎng)址:https://dip.doe-mbi.ucla.edu/dip/Main.cgi
描述:記錄了實(shí)驗(yàn)確定的蛋白質(zhì)之間的相互作用递胧。DisProt:(打不開(kāi)了)
網(wǎng)址:http://www.disprot.org/
描述:用于注釋文獻(xiàn)中的蛋白固有無(wú)序區(qū)域(IDRs)
InterPro:
網(wǎng)址:https://www.ebi.ac.uk/interpro/
描述:通過(guò)整合多個(gè)蛋白相關(guān)數(shù)據(jù)庫(kù)祝闻,提供了一個(gè)方便的對(duì)蛋白序列進(jìn)行功能注釋的平臺(tái)占卧,包括對(duì)蛋白質(zhì)家族、結(jié)構(gòu)域联喘、功能位點(diǎn)的預(yù)測(cè)华蜒。MobiDB:
網(wǎng)址:http://mobidb.bio.unipd.it/
描述:內(nèi)在蛋白質(zhì)紊亂注釋數(shù)據(jù)庫(kù)。neXtProt:
網(wǎng)址:https://www.nextprot.org/
描述:人類(lèi)蛋白質(zhì)數(shù)據(jù)庫(kù)豁遭。Pfam:
網(wǎng)址:http://pfam.xfam.org/
描述:Pfam是蛋白質(zhì)家族的數(shù)據(jù)庫(kù)叭喜,包括使用隱馬爾可夫模型生成的注釋和多序列比對(duì)。PRINTS
網(wǎng)址:http://130.88.97.239/PRINTS/index.php
描述:蛋白質(zhì)序列指紋圖譜數(shù)據(jù)庫(kù)蓖谢,所謂蛋白質(zhì)的指紋是指一組保守的序列基序捂蕴,用于刻畫(huà)蛋白質(zhì)家族的特征。PROSITE:
網(wǎng)址:https://prosite.expasy.org/
描述:收集了有顯著生物學(xué)意義的蛋白質(zhì)位點(diǎn)和序列模式闪幽,并能根據(jù)這些位點(diǎn)和模式快速并可靠地鑒別一個(gè)未知功能的蛋白質(zhì)序列應(yīng)該屬于哪一個(gè)蛋白質(zhì)家族啥辨。Protein Information Resource
網(wǎng)址:https://pir.georgetown.edu/
描述:是一個(gè)全面的、經(jīng)過(guò)注釋的盯腌、非冗余的蛋白質(zhì)序列數(shù)據(jù)庫(kù)溉知。可幫助研究者鑒別和解釋蛋白質(zhì)序列信息,研究分子進(jìn)化级乍、功能基因組舌劳,進(jìn)行生物信息學(xué)分析。SUPERFAMILY:
網(wǎng)址:http://supfam.org/SUPERFAMILY/
描述:一個(gè)包含所有蛋白質(zhì)和基因組結(jié)構(gòu)和功能注釋的數(shù)據(jù)庫(kù)玫荣。
4.2 Protein structure databases
Protein Data Bank (PDB)
網(wǎng)址:http://www.rcsb.org
描述:一個(gè)專(zhuān)門(mén)收錄蛋白質(zhì)及核酸的三維結(jié)構(gòu)資料的數(shù)據(jù)庫(kù)蒿囤,以下為PDB成員網(wǎng)站
1.1 Protein DataBank in Europe (PDBe):https://www.ebi.ac.uk/pdbe/
1.2 ProteinDatabank in Japan (PDBj):https://pdbj.org
1.3 Research Collaboratory for Structural Bioinformatics (RCSB):https://www.rcsb.org
1.4 Worldwide Protein Data Bank:http://www.wwpdb.org/The Protein Protein Interaction Inhibition Database (2PI2db):
網(wǎng)址:http://2p2idb.cnrs-mrs.fr
描述:收集了已通過(guò)X射線晶體學(xué)或核磁共振表征的蛋白質(zhì)-蛋白質(zhì)、蛋白質(zhì)-調(diào)節(jié)劑復(fù)合物結(jié)構(gòu)崇决。
4.3 Protein model databases
ModBase:
網(wǎng)址:https://modbase.compbio.ucsf.edu/modbase-cgi/index.cgi
描述:一個(gè)注釋比較飯白紙結(jié)構(gòu)模型的數(shù)據(jù)庫(kù)材诽。Protein Model Portal (PMP):
網(wǎng)址:https://www.proteinmodelportal.org
描述:結(jié)合了數(shù)個(gè)蛋白質(zhì)結(jié)構(gòu)模型數(shù)據(jù)庫(kù)的元數(shù)據(jù)庫(kù),提供模型構(gòu)建和質(zhì)量評(píng)估等多種交互式服務(wù)恒傻。Similarity Matrix of Proteins (SIMAP):
網(wǎng)址:http://cube.univie.ac.at/resources/simap
描述:基于FASTA序列計(jì)算的蛋白質(zhì)相似性數(shù)據(jù)庫(kù)脸侥。Swiss-model:
網(wǎng)址:https://swissmodel.expasy.org
描述:致力于同源蛋白質(zhì)的3D結(jié)構(gòu)建模。
4.4 Protein-protein and other molecular interactions
BioGRID
網(wǎng)址:https://thebiogrid.org
描述:蛋白質(zhì)與遺傳相互作用數(shù)據(jù)庫(kù)盈厘。string
網(wǎng)址:http://string-db.org/cgi/help.pl?subpage=api
描述:用于檢索相互作用基因/蛋白質(zhì)的搜索工具IntAct
網(wǎng)址:https://www.ebi.ac.uk/intact/
描述:為分子交互研究提供免費(fèi)的開(kāi)源數(shù)據(jù)庫(kù)系統(tǒng)和分析工具睁枕。
5. Signal transduction pathway databases
NCI-Nature Pathway Interaction Database
網(wǎng)址:http://biogps.org/plugin/259/nci-nature-pathway-interaction-database/
描述:http://www.ndexbio.org/#/ (原來(lái)的PID遷移到此新數(shù)據(jù)庫(kù))。
NDEx提供了一個(gè)開(kāi)源框架沸手,科學(xué)家和機(jī)構(gòu)可以共享外遇、存儲(chǔ)、操作和發(fā)布生物網(wǎng)絡(luò)知識(shí)契吉。Netpath
網(wǎng)址:http://www.netpath.org/
描述:人類(lèi)信號(hào)轉(zhuǎn)導(dǎo)通路數(shù)據(jù)庫(kù)跳仿,擁有45個(gè)信號(hào)通路,包括在免疫系統(tǒng)調(diào)節(jié)和癌癥調(diào)節(jié)中起主要作用的通路捐晶。-
Reactome
網(wǎng)址:https://reactome.org/
描述:該庫(kù)覆蓋了19個(gè)物種的通路研究菲语,包括經(jīng)典的代謝通路、信號(hào)轉(zhuǎn)導(dǎo)惑灵、基因轉(zhuǎn)錄調(diào)控山上、細(xì)胞凋亡與疾病。reactome相關(guān)推文:
- WikiPathways
網(wǎng)址:https://www.wikipathways.org/index.php/WikiPathways
描述:該數(shù)據(jù)庫(kù)收錄了超過(guò)20個(gè)物種的通路佩憾,其中人類(lèi)的通路就包含了800多個(gè)通路,涵蓋了約7500種基因干花。此外妄帘,它還包含了超過(guò)1000個(gè)代謝產(chǎn)物的通路。
6. Metabolic pathway and protein function databases
代謝途徑和蛋白質(zhì)功能數(shù)據(jù)庫(kù)
BiGG Models
網(wǎng)址:http://bigg.ucsd.edu
描述:該數(shù)據(jù)庫(kù)將70多種已發(fā)表的基因組規(guī)模的代謝網(wǎng)絡(luò)整合到了一起把敢,并且有一組標(biāo)準(zhǔn)化的BiGG ID寄摆。BioCyc Database Collection:
網(wǎng)址:https://biocyc.org
描述:收集了14558個(gè)通路/基因組數(shù)據(jù)庫(kù),每一個(gè)數(shù)據(jù)庫(kù)描述了單個(gè)有機(jī)體的基因組和代謝通路修赞,同時(shí)提供多種用于組學(xué)數(shù)據(jù)導(dǎo)航和可視化的分析工具婶恼。BRENDA:
網(wǎng)址:http://www.brenda-enzymes.org
描述:酶數(shù)據(jù)庫(kù)桑阶,提供酶的分類(lèi)、命名法勾邦、生化反應(yīng)蚣录、專(zhuān)一性、結(jié)構(gòu)眷篇、細(xì)胞定位萎河、提取方法、文獻(xiàn)蕉饼、應(yīng)用與改造及相關(guān)疾病的數(shù)據(jù)虐杯。HMDB
網(wǎng)址:http://www.hmdb.ca
描述:人類(lèi)代謝組數(shù)據(jù)庫(kù),包含有關(guān)人體中發(fā)現(xiàn)的小分子代謝物的詳細(xì)信息昧港。KEGG PATHWAY Database
網(wǎng)址:https://www.kegg.jp
描述:KEGG是一個(gè)整合了基因組擎椰、化學(xué)和系統(tǒng)功能信息的數(shù)據(jù)庫(kù)。把從已經(jīng)完整測(cè)序的基因組中得到的基因目錄與更高級(jí)別的細(xì)胞创肥、物種和生態(tài)系統(tǒng)水平的系統(tǒng)功能關(guān)聯(lián)起來(lái)是KEGG數(shù)據(jù)庫(kù)的特色之一达舒。Reactome(同上)
WikiPathways(同上)
7. Additional databases
7.1 Exosomal databases
外泌體是一類(lèi)可以由多種細(xì)胞類(lèi)型分泌的胞外囊泡,與其他胞外囊泡如核外顆粒體和凋亡小體不同叹侄,外泌體是內(nèi)吞起源的巩搏。外泌體在疫苗、藥物遞送趾代、細(xì)胞間通信的作用以及其作為生物標(biāo)志物的一種可能來(lái)源以及引起了研究人員的極大興趣贯底,導(dǎo)致外泌體相關(guān)研究呈現(xiàn)井噴趨勢(shì)。相關(guān)數(shù)據(jù)庫(kù)如下:
ExoCarta
網(wǎng)址:http://www.exocarta.org
描述:是一個(gè)關(guān)于外泌體蛋白稽坤、RNA丈甸、脂質(zhì)體的手工數(shù)據(jù)庫(kù)糯俗。exoRBase
網(wǎng)址:http://www.exorbase.org
描述:將不同疾病血來(lái)源外泌體中的circRNA, lncRNA和mRNA進(jìn)行整理的數(shù)據(jù)庫(kù)尿褪。
7.2 Mathematical model databases
- Biomodels Database
網(wǎng)址:http://biomodels.caltech.edu
描述:生物模型在線數(shù)據(jù)庫(kù),主要存儲(chǔ)數(shù)量型生物化學(xué)模型得湘。
7.3 Taxonomic databases
BacDive
網(wǎng)址:https://bacdive.dsmz.de
描述:提供有關(guān)細(xì)菌和古細(xì)菌生物多樣性的菌株相關(guān)信息杖玲。EzTaxon-e
網(wǎng)址:https://www.ezbiocloud.net
描述:基于16S核糖體RNA基因序列鑒定原核生物的數(shù)據(jù)庫(kù)。
7.4 Radiologic databases
The Cancer Imaging Archive (TCIA)
網(wǎng)址:http://www.cancerimagingarchive.net
描述:包含常見(jiàn)腫瘤(肺癌淘正、前列腺癌等)醫(yī)學(xué)圖像(MRI摆马、CT等)及相應(yīng)臨床信息(治療方案細(xì)節(jié)、基因鸿吆、病理等)的大規(guī)模公用數(shù)據(jù)庫(kù)囤采。Neuroimaging Informatics Tools and Resources Clearinghouse
網(wǎng)址:https://www.nitrc.org
描述:神經(jīng)影像信息學(xué)工具和資源交換中心。
8. Wiki-style databases
- Gene Wiki
網(wǎng)址:https://en.wikipedia.org/wiki/Wikipedia:Gene_Wiki
描述:一個(gè)基于wiki的基因信息數(shù)據(jù)庫(kù)
9. Specialized databases
Barcode of Life Data Systems
網(wǎng)址:http://www.boldsystems.org
描述:DNA條形碼數(shù)據(jù)庫(kù)(即生物體內(nèi)能夠代表該物種的惩淳、標(biāo)準(zhǔn)的蕉毯、有足夠變異的乓搬、易擴(kuò)增且相對(duì)較短的DNA片段),并提供一個(gè)分析DNA序列的在線平臺(tái)代虾。The Cancer Genome Atlas (TCGA)
網(wǎng)址:https://cancergenome.nih.gov
描述:提供使用高通量技術(shù)獲得的癌癥樣本數(shù)據(jù)进肯,包括基因表達(dá)譜、拷貝數(shù)變異棉磨、SNP基因分型江掩、全基因組DNA甲基化等。Cellosaurus
網(wǎng)址:https://web.expasy.org/cellosaurus/
描述:細(xì)胞系的在線資源庫(kù)乘瓤。Comparative Toxicogenomics Database (CTD)
網(wǎng)址:http://ctdbase.org
描述:CTD(比較毒物遺傳數(shù)據(jù)庫(kù))环形,為研究人員提供了集中、綜合的各種不同類(lèi)型分子以及來(lái)自各種生物體的毒理學(xué)數(shù)據(jù)衙傀。DiProDB
網(wǎng)址:http://diprodb.fli-leibniz.de
描述:收集和分析熱力學(xué)斟赚,結(jié)構(gòu)和其他二核苷酸特性的數(shù)據(jù)庫(kù)。Dryad
網(wǎng)址:http://datadryad.org
描述:存放優(yōu)質(zhì)數(shù)據(jù)資源的場(chǎng)所差油,使科學(xué)出版物背后的數(shù)據(jù)可被發(fā)現(xiàn)拗军、可重復(fù)使用、可引用蓄喇。Edinburgh Mouse Atlas
網(wǎng)址:http://www.emouseatlas.org/emap/home.html
描述:小鼠胚胎原位基因表達(dá)數(shù)據(jù)庫(kù)发侵。EPD Eukaryotic Promoter Database
網(wǎng)址:https://epd.vital-it.ch/index.php
描述:真核基因啟動(dòng)子數(shù)據(jù)庫(kù),提供從EMBL中得到的真核基因的啟動(dòng)子序列妆偏,幫助實(shí)驗(yàn)研究人員刃鳄、生物信息學(xué)研究人員分析真核基因的轉(zhuǎn)錄信號(hào)。FINDbase (the Frequency of INherited Disorders database)
網(wǎng)址:http://www.findbase.org
描述:是一個(gè)全球治病遺傳變異頻率的數(shù)據(jù)庫(kù)钱骂。HGNC (HUGO Gene Nomenclature Committee):
網(wǎng)址:https://www.genenames.org
描述:負(fù)責(zé)對(duì)人類(lèi)基因組包括蛋白編碼基因叔锐, ncRNA基因,甲基因和其他基因在內(nèi)的所有基因提供一個(gè)唯一的见秽、標(biāo)準(zhǔn)的愉烙、可以廣泛傳播的symbolInternational Human Epigenome Consortium
網(wǎng)址:http://ihec-epigenomes.org
描述:國(guó)際人類(lèi)表觀基因組學(xué)會(huì),致力于全球表觀基因組學(xué)領(lǐng)域的發(fā)展解取。MethBase
網(wǎng)址:http://smithlabresearch.org/software/methbase/
描述:在UCSC Genome Browser上可視化的DNA甲基化數(shù)據(jù)庫(kù)步责。Minimotif Miner
網(wǎng)址:http://minimotifminer.org/
描述:短連續(xù)功能性肽基序的數(shù)據(jù)庫(kù)。NCI-dbGaP
網(wǎng)址:https://www.ncbi.nlm.nih.gov/gap
描述:人類(lèi)基因型和表型相互作用的數(shù)據(jù)庫(kù)禀苦。PubMed
網(wǎng)址: https://www.ncbi.nlm.nih.gov/pmc/
描述:生命科學(xué)和生物醫(yī)學(xué)領(lǐng)域的參考和摘要蔓肯。Oncogenomic databases
網(wǎng)址:https://oglandscapes.irbbarcelona.org
描述:用于癌癥研究的數(shù)據(jù)庫(kù)匯編。RIKEN integrated database of mammals
網(wǎng)址:http://metadb.riken.jp/metadb/download/SciNetS_ria254i
描述:Riken研究所推廣的多個(gè)大型項(xiàng)目的綜合數(shù)據(jù)庫(kù)振乏。TDR Targets
網(wǎng)址:http://tdrtargets.org
描述:專(zhuān)注于熱帶疾病藥物發(fā)現(xiàn)的化學(xué)基因組學(xué)數(shù)據(jù)庫(kù)蔗包。LNCipedia
網(wǎng)址:http://www.lncipedia.org/
描述:人類(lèi)長(zhǎng)鏈非編碼RNA的整合庫(kù)NONCODE
網(wǎng)址: http://www.noncode.org/
描述:存儲(chǔ)17類(lèi)(人類(lèi),小鼠慧邮,牛调限,大鼠邻储,雞,果蠅旧噪,斑馬魚(yú)吨娜,小腸,酵母淘钟,擬南芥宦赠,黑猩猩,大猩猩米母,猩猩勾扭,恒河猴,負(fù)鼠和豬)物種非編碼RNA(不包括tRNA和rRNA)的數(shù)據(jù)庫(kù)Oncomine
網(wǎng)址:https://www.oncomine.org/resource/login.html
描述:腫瘤相關(guān)基因研究的數(shù)據(jù)庫(kù)铁瞒,整合了GEO妙色、TCGA和已發(fā)表的文獻(xiàn)等來(lái)源的RNA和DNA-seq數(shù)據(jù)GeneVestigator(GV)
網(wǎng)址:https://genevestigator.com/
描述:一個(gè)基因表達(dá)的搜索引擎,集成了上萬(wàn)的人工精選慧耍、注釋的公共芯片實(shí)驗(yàn)結(jié)果immuneXpresso
網(wǎng)址:http://immuneexpresso.org/immport-immunexpresso/public/immunexpresso/search
描述:immuneXpresso搜索引擎可自動(dòng)從PubMed摘要中提取高分辨率細(xì)胞 - 細(xì)胞因子相互作用網(wǎng)絡(luò)身辨。
點(diǎn)擊 閱讀原文 獲得可點(diǎn)擊的鏈接。