生物信息學(xué)數(shù)據(jù)庫(kù)分類(lèi)概覽 (第一版)

生物與計(jì)算機(jī)的結(jié)合讓生物進(jìn)入大數(shù)據(jù)時(shí)代,為方便管理各種生物數(shù)據(jù)票彪,科學(xué)家們開(kāi)發(fā)了各式各樣的生物數(shù)據(jù)庫(kù)红淡。了解與自己研究領(lǐng)域相關(guān)的數(shù)據(jù)庫(kù),并加以利用可能會(huì)使研究工作得到事半功倍的效果降铸。在此將常用數(shù)據(jù)庫(kù)按照以下分類(lèi)方式大致整理了一下在旱,方便檢索。

分類(lèi)不準(zhǔn)或有遺漏的歡迎指出推掸,后續(xù)將不斷推出更新版本桶蝎。

目錄

  1. Meta databases

  2. Model organism databases

  3. Nucleic acid databases
    3.1 DNA databases
    3.2 Gene expression databases (mostly microarray data)
    3.3 Phenotype databases
    3.4 RNA databases

  4. Amino acid / protein databases
    4.1 Protein sequence databases
    4.2 Protein structure databases
    4.3 Protein model databases
    4.4 Protein-protein and other molecular interactions

  5. Signal transduction pathway databases

  6. Metabolic pathway and protein function databases

  7. Additional databases
    7.1 Exosomal databases
    7.2 Mathematical model databases
    7.3 Taxonomic databases
    7.4 Radiologic databases

  8. Wiki-style databases

  9. Specialized databases

1. Meta databases

元數(shù)據(jù)庫(kù),合并不同來(lái)源的相關(guān)數(shù)據(jù)以更新的或更加方便的形式提供新的數(shù)據(jù)谅畅,通俗的講就是數(shù)據(jù)庫(kù)的數(shù)據(jù)庫(kù)登渣,代表性的數(shù)據(jù)庫(kù)主要有以下幾個(gè):

  1. ConsensusPathDB
    網(wǎng)址:http://consensuspathdb.org/
    描述:分子功能互作數(shù)據(jù)庫(kù),基于32個(gè)公共數(shù)據(jù)庫(kù)毡泻,整合了人類(lèi)蛋白質(zhì)相互作用胜茧,遺傳相互作用信號(hào),代謝,基因調(diào)控和藥物 - 靶標(biāo)相互作用的信息呻顽。

  2. Entrez
    網(wǎng)址:https://www.ncbi.nlm.nih.gov/Class/MLACourse/Modules/Entrez/complex_boolean.html
    描述:Entrez跨數(shù)據(jù)庫(kù)全局查詢(xún)搜索系統(tǒng)是一個(gè)聯(lián)合搜索引擎或門(mén)戶網(wǎng)站雹顺,允許用戶在NCBI網(wǎng)站上搜索許多離散的健康科學(xué)數(shù)據(jù)庫(kù)。

  3. Neuroscience Information Framework
    網(wǎng)址:https://neuinfo.org//
    描述:整合了數(shù)百種神經(jīng)科學(xué)相關(guān)資源廊遍,包括實(shí)驗(yàn)嬉愧,臨床和轉(zhuǎn)化神經(jīng)科學(xué)數(shù)據(jù)庫(kù),知識(shí)庫(kù)喉前,地圖集和遺傳/基因組資源等没酣。

  4. GeneCard
    網(wǎng)址:https://www.genecards.org/
    描述:自動(dòng)整合125個(gè)數(shù)據(jù)庫(kù),包含基因組被饿、轉(zhuǎn)錄組四康、蛋白組搪搏、遺傳狭握、臨床和功能信息的龐大人基因組數(shù)據(jù)庫(kù)。

  5. Ensembl Genomes
    網(wǎng)址:http://ensemblgenomes.org/
    描述:該項(xiàng)目由EMBL運(yùn)營(yíng)疯溺,提供細(xì)菌论颅、原生生物、真菌囱嫩、植物和無(wú)脊椎動(dòng)物后生動(dòng)物的基因組數(shù)據(jù)恃疯。

  1. UCSC Genome
    網(wǎng)址: http://genome.ucsc.edu
    描述:主要是動(dòng)物基因組信息,基因組注釋?zhuān)蚪M保守性和基因組共線性數(shù)據(jù)墨闲。
  1. Human protein atlas
    網(wǎng)址:http://www.proteinatlas.org/
    描述:人體蛋白在細(xì)胞今妄、組織、病理?xiàng)l件下的表達(dá)

2. Model organism databases

模式生物數(shù)據(jù)庫(kù)鸳碧,為深入研究模式生物提供生物數(shù)據(jù)盾鳞,如:

  1. Personal Genome Project
    網(wǎng)址:https://www.personalgenomes.org/
    描述:來(lái)自世界各地的100,00名志愿者的人類(lèi)基因組計(jì)劃。

  2. Mouse Genome Database(MGD)
    網(wǎng)址:http://www.informatics.jax.org/
    描述:MGD數(shù)據(jù)庫(kù)是整合了國(guó)際上實(shí)驗(yàn)室小鼠生物數(shù)據(jù)的資源庫(kù)瞻离,提供小鼠相關(guān)的基因組腾仅、綜合遺傳等信息。

  3. Rat Genome Database (RGD):
    網(wǎng)址:https://rgd.mcw.edu/
    描述:大鼠基因組數(shù)據(jù)庫(kù)套利。

  4. PomBase
    網(wǎng)址:https://www.pombase.org/
    描述:裂殖酵母Schizosaccharomyces pombe的知識(shí)庫(kù)推励。

  5. Saccharomyces Genome Database (SGD):
    網(wǎng)址:https://www.yeastgenome.org/
    描述:酵母模型生物的基因組數(shù)據(jù)庫(kù)

  6. TAIR
    網(wǎng)址 https://www.arabidopsis.org/
    描述:最全的擬南芥資源數(shù)據(jù)庫(kù)。政府為我們付費(fèi)購(gòu)買(mǎi)了使用權(quán)肉迫,以至于不少人沒(méi)感覺(jué)到TAIR已經(jīng)收費(fèi)了验辞。

  7. Legume Information System (LIS)
    網(wǎng)址:https://legumeinfo.org/
    描述:豆科植物的基因組數(shù)據(jù)庫(kù)。

  8. Wormbase:
    網(wǎng)址:https://wormbase.org/#012-34-5
    描述:關(guān)于線蟲(chóng)模式生物秀麗隱桿線蟲(chóng)的生物學(xué)和基因組在線生物數(shù)據(jù)庫(kù)喊衫,還包含其他相關(guān)線蟲(chóng)的信息受神。

  9. Xenbase:
    網(wǎng)址:http://www.xenbase.org/entry/
    描述:模式生物非洲爪蟾(Xenopus tropicalis)和非洲爪蟾(Xenopus laevis)的基因組數(shù)據(jù)庫(kù)。

  10. Zebrafish Information Network:
    網(wǎng)址:http://zfin.org/
    描述:斑馬魚(yú)的基因組數(shù)據(jù)庫(kù)格侯。

  11. FlyBase:
    網(wǎng)址:http://flybase.org/
    描述:模式生物果蠅的基因組數(shù)據(jù)庫(kù)鼻听。

  12. UCSC Malaria Genome Browser:
    網(wǎng)址:http://enacademic.com/dic.nsf/enwiki/7907997
    描述:UCSC瘧疾基因組瀏覽器是研究瘧疾(如惡性瘧原蟲(chóng)等)基因組的生物信息學(xué)研究工具财著。

3. Nucleic acid databases

3.1 DNA databases

核酸數(shù)據(jù)庫(kù)分為一級(jí)數(shù)據(jù)庫(kù)(Primary databases)和二級(jí)數(shù)據(jù)庫(kù)(Secondary databases)

3.1.1 一級(jí)核酸數(shù)據(jù)庫(kù)

下面三個(gè)數(shù)據(jù)庫(kù)是核酸的主數(shù)據(jù)庫(kù),存儲(chǔ)來(lái)自所有生物的核酸序列撑碴,接受用戶提交核酸序列撑教,每天交換更新數(shù)據(jù)以實(shí)現(xiàn)他們之間的最佳同步。

  1. DNA Data Bank of Japan
    網(wǎng)址:https://www.ddbj.nig.ac.jp/index-e.html

  2. EMBL (European Bioinformatics Institute)
    網(wǎng)址:https://www.embl.org/

  3. NCBI (National Center for Biotechnology Information)
    網(wǎng)址:https://www.ncbi.nlm.nih.gov/

3.1.2 二級(jí)核酸數(shù)據(jù)庫(kù)

數(shù)目很多愤兵,先列出一些,歡迎補(bǔ)充:

  1. 23andMe’s database
    網(wǎng)址:https://www.23andme.com/en-int/
    描述:23andMe是一家私營(yíng)的個(gè)人基因組學(xué)生物技術(shù)公司 排吴,主要業(yè)務(wù)是基于唾液對(duì)消費(fèi)者進(jìn)行基因檢測(cè)秆乳,并向客戶提供基因檢測(cè)報(bào)告。

  2. OMIM (Online Mendelian Inheritance in Man):
    網(wǎng)址:https://omim.org/
    描述:一個(gè)管理人類(lèi)基因和人類(lèi)遺傳疾病特征的數(shù)據(jù)庫(kù)钻哩。

  3. RefSeq
    網(wǎng)址:https://www.ncbi.nlm.nih.gov/refseq/
    描述:參考序列數(shù)據(jù)庫(kù)收集了從病毒屹堰、細(xì)菌到真核生物等主要生物的核酸序列(DNA、RNA)及其蛋白質(zhì)常產(chǎn)物街氢。

  4. 1000 Genomes Project:
    網(wǎng)址:http://www.internationalgenome.org/
    描述:2008年1月啟動(dòng)的項(xiàng)目扯键,對(duì)來(lái)自不同種族群體的一千多名匿名參與者的基因組進(jìn)行了分析,并將數(shù)據(jù)公布于眾珊肃。

  5. SNP / Disease Databases
    網(wǎng)址:https://www.snpedia.com/
    描述:人SNP位點(diǎn)對(duì)表型的影響和貢獻(xiàn)度數(shù)據(jù)庫(kù)

3.2 Gene expression databases

這些數(shù)據(jù)庫(kù)收集基因組序列荣刑,注釋并分析他們,以提供公共訪問(wèn)伦乔。主要包括:

  1. ArrayExpress
    網(wǎng)址:https://www.ebi.ac.uk/arrayexpress/
    描述:功能基因組數(shù)據(jù)存檔厉亏;存儲(chǔ)來(lái)自EMBL的高通量功能基因組學(xué)實(shí)驗(yàn)的數(shù)據(jù);展示方式很炫酷评矩。

  2. Bioinformatic Harvester
    網(wǎng)址:Ensembl: http://asia.ensembl.org/index.html
    描述:為人類(lèi)叶堆,小鼠,其他脊椎動(dòng)物和真核生物基因組提供自動(dòng)注釋的數(shù)據(jù)庫(kù)

  3. BioGPS
    網(wǎng)址:http://biogps.org/#goto=welcome
    描述:強(qiáng)大的基因和蛋白表達(dá)注釋平臺(tái)

  4. Gene Disease Database
    基因疾病數(shù)據(jù)庫(kù)斥杜,通過(guò)整理表型-基因型關(guān)系和基因-疾病機(jī)制虱颗,以及多種復(fù)合相互作用來(lái)理解復(fù)雜疾病的潛在機(jī)制。主要數(shù)據(jù)庫(kù)如下:

    5.1 The Comparative Toxicogenomics Database (CTD)

    <pre style="overflow-wrap: break-word !important; margin-top: 0px; margin-bottom: 0px; padding: 1px 2px; max-width: 100%; border-radius: 3px; background-color: rgb(247, 247, 247); color: inherit; line-height: 1.5em; overflow: auto; border-left: 4px solid rgb(108, 162, 252); box-sizing: border-box !important;"> 網(wǎng)址:http://ctdbase.org/</pre>

    5.2 The Universal Protein Resource (UNIPROT)

    <pre style="overflow-wrap: break-word !important; margin-top: 0px; margin-bottom: 0px; padding: 1px 2px; max-width: 100%; border-radius: 3px; background-color: rgb(247, 247, 247); color: inherit; line-height: 1.5em; overflow: auto; border-left: 4px solid rgb(108, 162, 252); box-sizing: border-box !important;"> 網(wǎng)址:https://www.uniprot.org</pre>

    5.3 The Online Mendelian Inheritance in Man

    <pre style="overflow-wrap: break-word !important; margin-top: 0px; margin-bottom: 0px; padding: 1px 2px; max-width: 100%; border-radius: 3px; background-color: rgb(247, 247, 247); color: inherit; line-height: 1.5em; overflow: auto; border-left: 4px solid rgb(108, 162, 252); box-sizing: border-box !important;"> 網(wǎng)址:https://www.ncbi.nlm.nih.gov/omim</pre>

    5.5 The Ensembl genome database project

    <pre style="overflow-wrap: break-word !important; margin-top: 0px; margin-bottom: 0px; padding: 1px 2px; max-width: 100%; border-radius: 3px; background-color: rgb(247, 247, 247); color: inherit; line-height: 1.5em; overflow: auto; border-left: 4px solid rgb(108, 162, 252); box-sizing: border-box !important;"> 網(wǎng)址:http://www.ensembl.org/</pre>

    5.6 The Gene Disease Associations Database DisGeNET

    <pre style="overflow-wrap: break-word !important; margin-top: 0px; margin-bottom: 0px; padding: 1px 2px; max-width: 100%; border-radius: 3px; background-color: rgb(247, 247, 247); color: inherit; line-height: 1.5em; overflow: auto; border-left: 4px solid rgb(108, 162, 252); box-sizing: border-box !important;"> 網(wǎng)址:http://www.disgenet.org/</pre>

  5. Gene Expression Omnibus (GEO):
    網(wǎng)址:https://www.ncbi.nlm.nih.gov/geo/
    描述:來(lái)自美國(guó)國(guó)家癌癥研究所(NCI)的公共功能基因組數(shù)據(jù)庫(kù)蔗喂,它支持基于陣列和序列的數(shù)據(jù)忘渔,并提供了用于查詢(xún)和下載基因表達(dá)譜的工具。

3.3 Phenotype databases

  1. PHI-base:
    網(wǎng)址:http://www.phi-base.org/
    描述:病原體 - 宿主相互作用數(shù)據(jù)庫(kù)缰儿。

  2. 細(xì)胞表型數(shù)據(jù)庫(kù)
    網(wǎng)址:https://www.ebi.ac.uk/fg/sym
    描述:基于RNAi的細(xì)胞表型收集

  3. dbGAP
    網(wǎng)址:https://www.ncbi.nlm.nih.gov/gap
    描述:基因型-表型數(shù)據(jù)庫(kù)畦粮,來(lái)源于GWAS、醫(yī)學(xué)測(cè)序、分子診斷等

  4. The Human Phenotype Ontology
    網(wǎng)址:https://hpo.jax.org/app/
    描述:人類(lèi)疾病表型描述的標(biāo)準(zhǔn)化術(shù)語(yǔ)宣赔,類(lèi)比于Gene Ontology. 現(xiàn)有13000個(gè)條目和156,000關(guān)于遺傳病的注釋预麸。

  5. GWAS central
    網(wǎng)址: https://www.gwascentral.org
    描述:包含2,974,967個(gè)SNP與829個(gè)MeSH疾病、表型之間的69,986,326個(gè)關(guān)聯(lián)儒将。

  6. European genome-phenome archive
    網(wǎng)址:https://ega-archive.org
    描述:生物醫(yī)學(xué)研究中涉及的遺傳和表型數(shù)據(jù)關(guān)聯(lián)庫(kù)

  7. Monarch
    網(wǎng)址:https://monarchinitiative.org
    描述:基因型-表型數(shù)據(jù)庫(kù)吏祸,表型相似性度量

  8. Cellular Phenotype Database
    網(wǎng)址:http://www.ebi.ac.uk/fg/sym
    描述:存儲(chǔ)來(lái)自高通量表型研究的數(shù)據(jù),可以搜索感興趣的表型并檢索相關(guān)靶基因和RNAi

  9. GenomeRNAi
    網(wǎng)址:http://www.genomernai.org/
    描述:包含來(lái)自果蠅和人RNA干擾篩選的表型數(shù)據(jù)庫(kù)

  10. Genomics of Drug Sensitivity in Cancer
    網(wǎng)址:http://www.cancerrxgene.org/
    描述:篩選了多種抗癌療法人類(lèi)癌細(xì)胞系钩蚊,通過(guò)與基因組數(shù)據(jù)關(guān)聯(lián)以識(shí)別藥物靶標(biāo)贡翘,同時(shí)為臨床應(yīng)用提供信息

  11. GenomeCRISPR
    網(wǎng)址:http://genomecrispr.dkfz.de/
    描述:用于高通量CRISPR / Cas9篩選實(shí)驗(yàn)的數(shù)據(jù)庫(kù)

  12. Cellular Microscopy Phenotype Ontology (CMPO)
    網(wǎng)址:www.ebi.ac.uk/cmpo/
    描述:CMPO為描述與整個(gè)細(xì)胞、細(xì)胞成分砰逻、細(xì)胞過(guò)程和細(xì)胞群體有關(guān)的表型特性提供了一種物種中立的詞匯鸣驱。

  13. Human Phenotype Ontology (HPO)
    網(wǎng)址:https://hpo.jax.org/app/
    描述:提供了人類(lèi)疾病中表型異常的標(biāo)準(zhǔn)化詞匯

3.4 RNA databases

  1. miRBase
    網(wǎng)址:http://www.mirbase.org/
    描述:存儲(chǔ)microRNA序列和注釋的數(shù)據(jù)庫(kù)。

  2. Rfam:
    網(wǎng)址:http://rfam.org/
    描述:一個(gè)包含非編碼RNA(ncRNA)家族和其他類(lèi)型RNA信息的數(shù)據(jù)庫(kù)蝠咆。

  3. RNAcentral
    網(wǎng)址:https://rnacentral.org/
    描述:非編碼RNA序列數(shù)據(jù)庫(kù)踊东。

4. Amino acid / protein databases

4.1 Protein sequence databases

  1. Swiss-Prot/Uniprot
    網(wǎng)址:https://www.uniprot.org/
    描述:結(jié)合了從文獻(xiàn)中提取的信息和生物鑒定者評(píng)估的計(jì)算分析,是一個(gè)手動(dòng)注釋的非冗余蛋白質(zhì)序列數(shù)據(jù)庫(kù)勺美。

  2. Database of Interacting Proteins (Univ. of California)
    網(wǎng)址:https://dip.doe-mbi.ucla.edu/dip/Main.cgi
    描述:記錄了實(shí)驗(yàn)確定的蛋白質(zhì)之間的相互作用递胧。

  3. DisProt:(打不開(kāi)了)
    網(wǎng)址:http://www.disprot.org/
    描述:用于注釋文獻(xiàn)中的蛋白固有無(wú)序區(qū)域(IDRs)

  1. InterPro:
    網(wǎng)址:https://www.ebi.ac.uk/interpro/
    描述:通過(guò)整合多個(gè)蛋白相關(guān)數(shù)據(jù)庫(kù)祝闻,提供了一個(gè)方便的對(duì)蛋白序列進(jìn)行功能注釋的平臺(tái)占卧,包括對(duì)蛋白質(zhì)家族、結(jié)構(gòu)域联喘、功能位點(diǎn)的預(yù)測(cè)华蜒。

  2. MobiDB:
    網(wǎng)址:http://mobidb.bio.unipd.it/
    描述:內(nèi)在蛋白質(zhì)紊亂注釋數(shù)據(jù)庫(kù)。

  3. neXtProt:
    網(wǎng)址:https://www.nextprot.org/
    描述:人類(lèi)蛋白質(zhì)數(shù)據(jù)庫(kù)豁遭。

  4. Pfam:
    網(wǎng)址:http://pfam.xfam.org/
    描述:Pfam是蛋白質(zhì)家族的數(shù)據(jù)庫(kù)叭喜,包括使用隱馬爾可夫模型生成的注釋和多序列比對(duì)。

  5. PRINTS
    網(wǎng)址:http://130.88.97.239/PRINTS/index.php
    描述:蛋白質(zhì)序列指紋圖譜數(shù)據(jù)庫(kù)蓖谢,所謂蛋白質(zhì)的指紋是指一組保守的序列基序捂蕴,用于刻畫(huà)蛋白質(zhì)家族的特征。

  6. PROSITE:
    網(wǎng)址:https://prosite.expasy.org/
    描述:收集了有顯著生物學(xué)意義的蛋白質(zhì)位點(diǎn)和序列模式闪幽,并能根據(jù)這些位點(diǎn)和模式快速并可靠地鑒別一個(gè)未知功能的蛋白質(zhì)序列應(yīng)該屬于哪一個(gè)蛋白質(zhì)家族啥辨。

  7. Protein Information Resource
    網(wǎng)址:https://pir.georgetown.edu/
    描述:是一個(gè)全面的、經(jīng)過(guò)注釋的盯腌、非冗余的蛋白質(zhì)序列數(shù)據(jù)庫(kù)溉知。可幫助研究者鑒別和解釋蛋白質(zhì)序列信息,研究分子進(jìn)化级乍、功能基因組舌劳,進(jìn)行生物信息學(xué)分析。

  8. SUPERFAMILY:
    網(wǎng)址:http://supfam.org/SUPERFAMILY/
    描述:一個(gè)包含所有蛋白質(zhì)和基因組結(jié)構(gòu)和功能注釋的數(shù)據(jù)庫(kù)玫荣。

4.2 Protein structure databases

  1. Protein Data Bank (PDB)
    網(wǎng)址:http://www.rcsb.org
    描述:一個(gè)專(zhuān)門(mén)收錄蛋白質(zhì)及核酸的三維結(jié)構(gòu)資料的數(shù)據(jù)庫(kù)蒿囤,以下為PDB成員網(wǎng)站
    1.1 Protein DataBank in Europe (PDBe):https://www.ebi.ac.uk/pdbe/
    1.2 ProteinDatabank in Japan (PDBj):https://pdbj.org
    1.3 Research Collaboratory for Structural Bioinformatics (RCSB):https://www.rcsb.org
    1.4 Worldwide Protein Data Bank:http://www.wwpdb.org/

  2. The Protein Protein Interaction Inhibition Database (2PI2db):
    網(wǎng)址:http://2p2idb.cnrs-mrs.fr
    描述:收集了已通過(guò)X射線晶體學(xué)或核磁共振表征的蛋白質(zhì)-蛋白質(zhì)、蛋白質(zhì)-調(diào)節(jié)劑復(fù)合物結(jié)構(gòu)崇决。

4.3 Protein model databases

  1. ModBase:
    網(wǎng)址:https://modbase.compbio.ucsf.edu/modbase-cgi/index.cgi
    描述:一個(gè)注釋比較飯白紙結(jié)構(gòu)模型的數(shù)據(jù)庫(kù)材诽。

  2. Protein Model Portal (PMP):
    網(wǎng)址:https://www.proteinmodelportal.org
    描述:結(jié)合了數(shù)個(gè)蛋白質(zhì)結(jié)構(gòu)模型數(shù)據(jù)庫(kù)的元數(shù)據(jù)庫(kù),提供模型構(gòu)建和質(zhì)量評(píng)估等多種交互式服務(wù)恒傻。

  3. Similarity Matrix of Proteins (SIMAP):
    網(wǎng)址:http://cube.univie.ac.at/resources/simap
    描述:基于FASTA序列計(jì)算的蛋白質(zhì)相似性數(shù)據(jù)庫(kù)脸侥。

  4. Swiss-model:
    網(wǎng)址:https://swissmodel.expasy.org
    描述:致力于同源蛋白質(zhì)的3D結(jié)構(gòu)建模。

4.4 Protein-protein and other molecular interactions

  1. BioGRID
    網(wǎng)址:https://thebiogrid.org
    描述:蛋白質(zhì)與遺傳相互作用數(shù)據(jù)庫(kù)盈厘。

  2. string
    網(wǎng)址:http://string-db.org/cgi/help.pl?subpage=api
    描述:用于檢索相互作用基因/蛋白質(zhì)的搜索工具

  3. IntAct
    網(wǎng)址:https://www.ebi.ac.uk/intact/
    描述:為分子交互研究提供免費(fèi)的開(kāi)源數(shù)據(jù)庫(kù)系統(tǒng)和分析工具睁枕。

5. Signal transduction pathway databases

  1. NCI-Nature Pathway Interaction Database
    網(wǎng)址:http://biogps.org/plugin/259/nci-nature-pathway-interaction-database/
    描述:http://www.ndexbio.org/#/ (原來(lái)的PID遷移到此新數(shù)據(jù)庫(kù))。
    NDEx提供了一個(gè)開(kāi)源框架沸手,科學(xué)家和機(jī)構(gòu)可以共享外遇、存儲(chǔ)、操作和發(fā)布生物網(wǎng)絡(luò)知識(shí)契吉。

  2. Netpath
    網(wǎng)址:http://www.netpath.org/
    描述:人類(lèi)信號(hào)轉(zhuǎn)導(dǎo)通路數(shù)據(jù)庫(kù)跳仿,擁有45個(gè)信號(hào)通路,包括在免疫系統(tǒng)調(diào)節(jié)和癌癥調(diào)節(jié)中起主要作用的通路捐晶。

  3. Reactome
    網(wǎng)址:https://reactome.org/
    描述:該庫(kù)覆蓋了19個(gè)物種的通路研究菲语,包括經(jīng)典的代謝通路、信號(hào)轉(zhuǎn)導(dǎo)惑灵、基因轉(zhuǎn)錄調(diào)控山上、細(xì)胞凋亡與疾病。

    reactome相關(guān)推文:

  1. WikiPathways
    網(wǎng)址:https://www.wikipathways.org/index.php/WikiPathways
    描述:該數(shù)據(jù)庫(kù)收錄了超過(guò)20個(gè)物種的通路佩憾,其中人類(lèi)的通路就包含了800多個(gè)通路,涵蓋了約7500種基因干花。此外妄帘,它還包含了超過(guò)1000個(gè)代謝產(chǎn)物的通路。

6. Metabolic pathway and protein function databases

代謝途徑和蛋白質(zhì)功能數(shù)據(jù)庫(kù)

  1. BiGG Models
    網(wǎng)址:http://bigg.ucsd.edu
    描述:該數(shù)據(jù)庫(kù)將70多種已發(fā)表的基因組規(guī)模的代謝網(wǎng)絡(luò)整合到了一起把敢,并且有一組標(biāo)準(zhǔn)化的BiGG ID寄摆。

  2. BioCyc Database Collection:
    網(wǎng)址:https://biocyc.org
    描述:收集了14558個(gè)通路/基因組數(shù)據(jù)庫(kù),每一個(gè)數(shù)據(jù)庫(kù)描述了單個(gè)有機(jī)體的基因組和代謝通路修赞,同時(shí)提供多種用于組學(xué)數(shù)據(jù)導(dǎo)航和可視化的分析工具婶恼。

  3. BRENDA:
    網(wǎng)址:http://www.brenda-enzymes.org
    描述:酶數(shù)據(jù)庫(kù)桑阶,提供酶的分類(lèi)、命名法勾邦、生化反應(yīng)蚣录、專(zhuān)一性、結(jié)構(gòu)眷篇、細(xì)胞定位萎河、提取方法、文獻(xiàn)蕉饼、應(yīng)用與改造及相關(guān)疾病的數(shù)據(jù)虐杯。

  4. HMDB
    網(wǎng)址:http://www.hmdb.ca
    描述:人類(lèi)代謝組數(shù)據(jù)庫(kù),包含有關(guān)人體中發(fā)現(xiàn)的小分子代謝物的詳細(xì)信息昧港。

  5. KEGG PATHWAY Database
    網(wǎng)址:https://www.kegg.jp
    描述:KEGG是一個(gè)整合了基因組擎椰、化學(xué)和系統(tǒng)功能信息的數(shù)據(jù)庫(kù)。把從已經(jīng)完整測(cè)序的基因組中得到的基因目錄與更高級(jí)別的細(xì)胞创肥、物種和生態(tài)系統(tǒng)水平的系統(tǒng)功能關(guān)聯(lián)起來(lái)是KEGG數(shù)據(jù)庫(kù)的特色之一达舒。

  6. Reactome(同上)

  7. WikiPathways(同上)

7. Additional databases

7.1 Exosomal databases

外泌體是一類(lèi)可以由多種細(xì)胞類(lèi)型分泌的胞外囊泡,與其他胞外囊泡如核外顆粒體和凋亡小體不同叹侄,外泌體是內(nèi)吞起源的巩搏。外泌體在疫苗、藥物遞送趾代、細(xì)胞間通信的作用以及其作為生物標(biāo)志物的一種可能來(lái)源以及引起了研究人員的極大興趣贯底,導(dǎo)致外泌體相關(guān)研究呈現(xiàn)井噴趨勢(shì)。相關(guān)數(shù)據(jù)庫(kù)如下:

  1. ExoCarta
    網(wǎng)址:http://www.exocarta.org
    描述:是一個(gè)關(guān)于外泌體蛋白稽坤、RNA丈甸、脂質(zhì)體的手工數(shù)據(jù)庫(kù)糯俗。

  2. exoRBase
    網(wǎng)址:http://www.exorbase.org
    描述:將不同疾病血來(lái)源外泌體中的circRNA, lncRNA和mRNA進(jìn)行整理的數(shù)據(jù)庫(kù)尿褪。

7.2 Mathematical model databases

  1. Biomodels Database
    網(wǎng)址:http://biomodels.caltech.edu
    描述:生物模型在線數(shù)據(jù)庫(kù),主要存儲(chǔ)數(shù)量型生物化學(xué)模型得湘。

7.3 Taxonomic databases

  1. BacDive
    網(wǎng)址:https://bacdive.dsmz.de
    描述:提供有關(guān)細(xì)菌和古細(xì)菌生物多樣性的菌株相關(guān)信息杖玲。

  2. EzTaxon-e
    網(wǎng)址:https://www.ezbiocloud.net
    描述:基于16S核糖體RNA基因序列鑒定原核生物的數(shù)據(jù)庫(kù)。

7.4 Radiologic databases

  1. The Cancer Imaging Archive (TCIA)
    網(wǎng)址:http://www.cancerimagingarchive.net
    描述:包含常見(jiàn)腫瘤(肺癌淘正、前列腺癌等)醫(yī)學(xué)圖像(MRI摆马、CT等)及相應(yīng)臨床信息(治療方案細(xì)節(jié)、基因鸿吆、病理等)的大規(guī)模公用數(shù)據(jù)庫(kù)囤采。

  2. Neuroimaging Informatics Tools and Resources Clearinghouse
    網(wǎng)址:https://www.nitrc.org
    描述:神經(jīng)影像信息學(xué)工具和資源交換中心。

8. Wiki-style databases

  1. Gene Wiki
    網(wǎng)址:https://en.wikipedia.org/wiki/Wikipedia:Gene_Wiki
    描述:一個(gè)基于wiki的基因信息數(shù)據(jù)庫(kù)

9. Specialized databases

  1. Barcode of Life Data Systems
    網(wǎng)址:http://www.boldsystems.org
    描述:DNA條形碼數(shù)據(jù)庫(kù)(即生物體內(nèi)能夠代表該物種的惩淳、標(biāo)準(zhǔn)的蕉毯、有足夠變異的乓搬、易擴(kuò)增且相對(duì)較短的DNA片段),并提供一個(gè)分析DNA序列的在線平臺(tái)代虾。

  2. The Cancer Genome Atlas (TCGA)
    網(wǎng)址:https://cancergenome.nih.gov
    描述:提供使用高通量技術(shù)獲得的癌癥樣本數(shù)據(jù)进肯,包括基因表達(dá)譜、拷貝數(shù)變異棉磨、SNP基因分型江掩、全基因組DNA甲基化等。

  3. Cellosaurus
    網(wǎng)址:https://web.expasy.org/cellosaurus/
    描述:細(xì)胞系的在線資源庫(kù)乘瓤。

  4. Comparative Toxicogenomics Database (CTD)
    網(wǎng)址:http://ctdbase.org
    描述:CTD(比較毒物遺傳數(shù)據(jù)庫(kù))环形,為研究人員提供了集中、綜合的各種不同類(lèi)型分子以及來(lái)自各種生物體的毒理學(xué)數(shù)據(jù)衙傀。

  5. DiProDB
    網(wǎng)址:http://diprodb.fli-leibniz.de
    描述:收集和分析熱力學(xué)斟赚,結(jié)構(gòu)和其他二核苷酸特性的數(shù)據(jù)庫(kù)。

  6. Dryad
    網(wǎng)址:http://datadryad.org
    描述:存放優(yōu)質(zhì)數(shù)據(jù)資源的場(chǎng)所差油,使科學(xué)出版物背后的數(shù)據(jù)可被發(fā)現(xiàn)拗军、可重復(fù)使用、可引用蓄喇。

  7. Edinburgh Mouse Atlas
    網(wǎng)址:http://www.emouseatlas.org/emap/home.html
    描述:小鼠胚胎原位基因表達(dá)數(shù)據(jù)庫(kù)发侵。

  8. EPD Eukaryotic Promoter Database
    網(wǎng)址:https://epd.vital-it.ch/index.php
    描述:真核基因啟動(dòng)子數(shù)據(jù)庫(kù),提供從EMBL中得到的真核基因的啟動(dòng)子序列妆偏,幫助實(shí)驗(yàn)研究人員刃鳄、生物信息學(xué)研究人員分析真核基因的轉(zhuǎn)錄信號(hào)。

  9. FINDbase (the Frequency of INherited Disorders database)
    網(wǎng)址:http://www.findbase.org
    描述:是一個(gè)全球治病遺傳變異頻率的數(shù)據(jù)庫(kù)钱骂。

  10. HGNC (HUGO Gene Nomenclature Committee):
    網(wǎng)址:https://www.genenames.org
    描述:負(fù)責(zé)對(duì)人類(lèi)基因組包括蛋白編碼基因叔锐, ncRNA基因,甲基因和其他基因在內(nèi)的所有基因提供一個(gè)唯一的见秽、標(biāo)準(zhǔn)的愉烙、可以廣泛傳播的symbol

  11. International Human Epigenome Consortium
    網(wǎng)址:http://ihec-epigenomes.org
    描述:國(guó)際人類(lèi)表觀基因組學(xué)會(huì),致力于全球表觀基因組學(xué)領(lǐng)域的發(fā)展解取。

  12. MethBase
    網(wǎng)址:http://smithlabresearch.org/software/methbase/
    描述:在UCSC Genome Browser上可視化的DNA甲基化數(shù)據(jù)庫(kù)步责。

  13. Minimotif Miner
    網(wǎng)址:http://minimotifminer.org/
    描述:短連續(xù)功能性肽基序的數(shù)據(jù)庫(kù)。

  14. NCI-dbGaP
    網(wǎng)址:https://www.ncbi.nlm.nih.gov/gap
    描述:人類(lèi)基因型和表型相互作用的數(shù)據(jù)庫(kù)禀苦。

  15. PubMed
    網(wǎng)址: https://www.ncbi.nlm.nih.gov/pmc/
    描述:生命科學(xué)和生物醫(yī)學(xué)領(lǐng)域的參考和摘要蔓肯。

  16. Oncogenomic databases
    網(wǎng)址:https://oglandscapes.irbbarcelona.org
    描述:用于癌癥研究的數(shù)據(jù)庫(kù)匯編。

  17. RIKEN integrated database of mammals
    網(wǎng)址:http://metadb.riken.jp/metadb/download/SciNetS_ria254i
    描述:Riken研究所推廣的多個(gè)大型項(xiàng)目的綜合數(shù)據(jù)庫(kù)振乏。

  18. TDR Targets
    網(wǎng)址:http://tdrtargets.org
    描述:專(zhuān)注于熱帶疾病藥物發(fā)現(xiàn)的化學(xué)基因組學(xué)數(shù)據(jù)庫(kù)蔗包。

  19. LNCipedia
    網(wǎng)址:http://www.lncipedia.org/
    描述:人類(lèi)長(zhǎng)鏈非編碼RNA的整合庫(kù)

  20. NONCODE
    網(wǎng)址: http://www.noncode.org/
    描述:存儲(chǔ)17類(lèi)(人類(lèi),小鼠慧邮,牛调限,大鼠邻储,雞,果蠅旧噪,斑馬魚(yú)吨娜,小腸,酵母淘钟,擬南芥宦赠,黑猩猩,大猩猩米母,猩猩勾扭,恒河猴,負(fù)鼠和豬)物種非編碼RNA(不包括tRNA和rRNA)的數(shù)據(jù)庫(kù)

  21. Oncomine
    網(wǎng)址:https://www.oncomine.org/resource/login.html
    描述:腫瘤相關(guān)基因研究的數(shù)據(jù)庫(kù)铁瞒,整合了GEO妙色、TCGA和已發(fā)表的文獻(xiàn)等來(lái)源的RNA和DNA-seq數(shù)據(jù)

  22. GeneVestigator(GV)
    網(wǎng)址:https://genevestigator.com/
    描述:一個(gè)基因表達(dá)的搜索引擎,集成了上萬(wàn)的人工精選慧耍、注釋的公共芯片實(shí)驗(yàn)結(jié)果

  23. immuneXpresso
    網(wǎng)址:http://immuneexpresso.org/immport-immunexpresso/public/immunexpresso/search
    描述:immuneXpresso搜索引擎可自動(dòng)從PubMed摘要中提取高分辨率細(xì)胞 - 細(xì)胞因子相互作用網(wǎng)絡(luò)身辨。

點(diǎn)擊 閱讀原文 獲得可點(diǎn)擊的鏈接。

NGS基礎(chǔ)和軟件應(yīng)用

癌癥數(shù)據(jù)庫(kù)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末踪危,一起剝皮案震驚了整個(gè)濱河市蔬浙,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌贞远,老刑警劉巖畴博,帶你破解...
    沈念sama閱讀 206,013評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異兴革,居然都是意外死亡绎晃,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門(mén)杂曲,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人袁余,你說(shuō)我怎么就攤上這事擎勘。” “怎么了颖榜?”我有些...
    開(kāi)封第一講書(shū)人閱讀 152,370評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵棚饵,是天一觀的道長(zhǎng)煤裙。 經(jīng)常有香客問(wèn)我,道長(zhǎng)噪漾,這世上最難降的妖魔是什么硼砰? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 55,168評(píng)論 1 278
  • 正文 為了忘掉前任,我火速辦了婚禮欣硼,結(jié)果婚禮上题翰,老公的妹妹穿的比我還像新娘。我一直安慰自己诈胜,他們只是感情好豹障,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,153評(píng)論 5 371
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著焦匈,像睡著了一般血公。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上缓熟,一...
    開(kāi)封第一講書(shū)人閱讀 48,954評(píng)論 1 283
  • 那天累魔,我揣著相機(jī)與錄音,去河邊找鬼够滑。 笑死薛夜,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的版述。 我是一名探鬼主播梯澜,決...
    沈念sama閱讀 38,271評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼渴析!你這毒婦竟也來(lái)了晚伙?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 36,916評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤俭茧,失蹤者是張志新(化名)和其女友劉穎咆疗,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體母债,經(jīng)...
    沈念sama閱讀 43,382評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡午磁,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,877評(píng)論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了毡们。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片迅皇。...
    茶點(diǎn)故事閱讀 37,989評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖衙熔,靈堂內(nèi)的尸體忽然破棺而出登颓,到底是詐尸還是另有隱情,我是刑警寧澤红氯,帶...
    沈念sama閱讀 33,624評(píng)論 4 322
  • 正文 年R本政府宣布框咙,位于F島的核電站咕痛,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏喇嘱。R本人自食惡果不足惜茉贡,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,209評(píng)論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望者铜。 院中可真熱鬧腔丧,春花似錦兴垦、人聲如沸星澳。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,199評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)仅偎。三九已至私痹,卻和暖如春佛南,著一層夾襖步出監(jiān)牢的瞬間武鲁,已是汗流浹背绷雏。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,418評(píng)論 1 260
  • 我被黑心中介騙來(lái)泰國(guó)打工头滔, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人涎显。 一個(gè)月前我還...
    沈念sama閱讀 45,401評(píng)論 2 352
  • 正文 我出身青樓坤检,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親期吓。 傳聞我的和親對(duì)象是個(gè)殘疾皇子早歇,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,700評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容

  • 在剛剛于2016年1月26日在新加坡結(jié)束的ITU-T SG20的全體會(huì)議上,中國(guó)電信完成Y.IoT-SPSN及Y....
    新技術(shù)論壇閱讀 302評(píng)論 0 0
  • 第四節(jié) 之所以菱鎂礦不被主流文玩市場(chǎng)認(rèn)可,其何罪之有潭千?是因?yàn)樗揪筒贿m合作文玩配飾谱姓。當(dāng)前市場(chǎng)上估質(zhì)的菱鎂礦工藝品...
    云楚風(fēng)逸閱讀 693評(píng)論 0 0
  • 讀《薛兆豐的北大經(jīng)濟(jì)學(xué)》專(zhuān)欄有感 01 商業(yè)是最大的慈善,剛看到這句話的時(shí)候刨晴,你是否也和我一樣屉来,大吃一驚,不知如何...
    尤承琪閱讀 523評(píng)論 5 6
  • 冥思苦索狈癞,路在何方茄靠? 當(dāng)今金融亂象,害得百姓明不聊生亿驾,試問(wèn):誰(shuí)之過(guò)嘹黔?是百姓貪心、是百姓沒(méi)有慧眼莫瞬?都不是儡蔓,是執(zhí)法部門(mén)...
    圓夢(mèng)入綴閱讀 223評(píng)論 0 0