今天早上難得清閑吃既,學(xué)習(xí)了NCBI中一些數(shù)據(jù)庫的知識考榨,主要如下:
①refseq數(shù)據(jù)庫,其中所有的數(shù)據(jù)都是一個非冗余的鹦倚、提供參考標(biāo)準(zhǔn)的數(shù)據(jù)河质,包括染色體、基因組(細(xì)胞器震叙、病毒掀鹅、質(zhì)粒)、蛋白媒楼、RNA等乐尊,是經(jīng)過NCBI篩選過的數(shù)據(jù)庫,可信度很高划址。其ID通常表示為XX_123456扔嵌,XX代表不同含義,如XM代表蛋白編碼序列夺颤,NR代表非編碼蛋白的mRNA序列等痢缎。
②Entrez 指的是一個綜合性生物信息數(shù)據(jù)檢索引擎,他包含了核酸世澜、蛋白質(zhì)独旷、基因、基因組、GEO嵌洼、pubMed等數(shù)據(jù)庫案疲,通常所說的去NCBI檢索一下,這時的NCBI就是指Entrez.
其中Entrez ID指的是Entrez gene數(shù)據(jù)庫的編號系統(tǒng)麻养,各種Gene ID 可以相互轉(zhuǎn)換褐啡,常用工具有:DAVID等
③GEO數(shù)據(jù)庫,指的是NCBI中基因表達數(shù)據(jù)庫回溺,Gene Expression Omnibus,存儲著各種高通量功能基因組數(shù)據(jù)集春贸。
④Taxonomy數(shù)據(jù)庫,是一個分類數(shù)據(jù)庫遗遵,它只是努力整合各種各樣來源的系統(tǒng)發(fā)育和分類學(xué)的知識萍恕,包括發(fā)表的文獻、基于網(wǎng)絡(luò)的數(shù)據(jù)庫车要、序列提交者的建議以及來自NCBI 外部的分類學(xué)專家允粤,通過它可以了解該物種在分類學(xué)上的地位,也可以在某一物種范圍內(nèi)對Entrez進行檢索
⑤SNP單核苷酸多態(tài)性翼岁,一般多由單個堿基的轉(zhuǎn)換(transition)或顛換(transversion)造成类垫,目前研究很熱,dbSNP數(shù)據(jù)庫琅坡,單核苷酸多態(tài)性數(shù)據(jù)庫悉患,一般采用featureID即rs/ss1234567
⑥PubMed數(shù)據(jù)庫,是一個提供生物醫(yī)學(xué)方面的論文搜尋以及摘要的數(shù)據(jù)庫榆俺,具有多種搜索方式售躁,還可以使用通配符進行檢索
⑦OMIM數(shù)據(jù)庫,關(guān)于人類基因和遺傳紊亂的數(shù)據(jù)庫茴晋,
⑧NR相當(dāng)于一個將核酸數(shù)據(jù)和蛋白數(shù)據(jù)聯(lián)系起來的交叉索引陪捷,GenBank是核苷酸數(shù)據(jù)庫,RefSeq是基因數(shù)據(jù)庫诺擅,UniProt是蛋白質(zhì)數(shù)據(jù)庫