(部分內容轉載宫补,出處不詳~)
1. PIR 和 PSDPIR
國際蛋白質序列數據庫(PSD)是由蛋白質信息資源(PIR)、慕尼黑蛋白質序列信息中心(MIPS)和日本國際蛋白質序列數據庫(JIPID)共同維護的國際上最大的公共蛋白質序列數據庫。這是一個全面的吹截、經過注釋的措伐、非冗余的蛋白質序列數據庫,包含超過142,000條蛋白質序列(至99年9月)秩命,其中包括來自幾十個完整基因組的蛋白質序列尉共。所有序列數據都經過整理,超過99%的序列已按蛋白質家族分類弃锐,一半以上還按蛋白質超家族進行了分類袄友。PSD的注釋中還包括對許多序列、結構霹菊、基因組和文獻數據庫的交叉索引剧蚣,以及數據庫內部條目之間的索引,這些內部索引幫助用戶在包括復合物旋廷、酶-底物相互作用鸠按、活化和調控級聯(lián)和具有共同特征的條目之間方便的檢索。每季度都發(fā)行一次完整的數據庫饶碘,每周可以得到更新部分目尖。
PSD數據庫有幾個輔助數據庫,如基于超家族的非冗余庫等扎运。PIR提供三類序列搜索服務:基于文本的交互式檢索瑟曲;標準的序列相似性搜索饮戳,包括BLAST、FASTA等测蹲;結合序列相似性莹捡、注釋信息和蛋白質家族信息的高級搜索,包括按注釋分類的相似性搜索扣甲、結構域搜索GeneFIND等篮赢。
PIR和PSD的網址是:http://pir.georgetown.edu/。
數據庫下載地址是:ftp://nbrfa.georgetown.edu/pir/琉挖。
2. SWISS-PROT
SWISS-PROT 是經過注釋的蛋白質序列數據庫启泣,由歐洲生物信息學研究所(EBI)維護。數據庫由蛋白質序列條目構成示辈,每個條目包含蛋白質序列寥茫、引用文獻信息、分類學信息矾麻、注釋等纱耻,注釋中包括蛋白質的功能、轉錄后修飾险耀、特殊位點和區(qū)域弄喘、二級結構、四級結構甩牺、與其它序列的相似性蘑志、序列殘缺與疾病的關系、序列變異體和沖突等信息贬派。SWISS-PROT中盡可能減少了冗余序列急但,并與其它30多個數據建立了交叉引用,其中包括核酸序列庫搞乏、蛋白質序列庫和蛋白質結構庫等波桩。
利用序列提取系統(tǒng)(SRS)可以方便地檢索SWISS-PROT和其它EBI的數據庫。 SWISS-PROT 只接受直接測序獲得的蛋白質序列请敦,序列提交可以在其Web頁面上完成突委。
SWISS-PROT的網址是:http://www.ebi.ac.uk/swissprot/。
3. PROSITE
PROSITE 數據庫收集了生物學有顯著意義的蛋白質位點和序列模式冬三,并能根據這些位點和模式快速和可靠地鑒別一個未知功能的蛋白質序列應該屬于哪一個蛋白質家族匀油。有的情況下,某個蛋白質與已知功能蛋白質的整體序列相似性很低勾笆,但由于功能的需要保留了與功能密切相關的序列模式敌蚜,這樣就可能通過PROSITE的搜索找到隱含的功能motif,因此是序列分析的有效工具窝爪。
PROSITE中涉及的序列模式包括酶的催化位點弛车、配體結合位點齐媒、與金屬離子結合的殘基、二硫鍵的半胱氨酸纷跛、與小分子或其它蛋白質結合的區(qū)域等喻括;除了序列模式之外,PROSITE還包括由多序列比對構建的profile贫奠,能更敏感地發(fā)現(xiàn)序列與profile的相似性唬血。PROSITE的主頁上提供各種相關檢索服務。
PROSITE的網址是:http://www.expasy.ch/prosite/唤崭。
4. PDB
蛋白質數據倉庫(PDB)是國際上唯一的生物大分子結構數據檔案庫拷恨,由美國Brookhaven國家實驗室建立。PDB收集的數據來源于X光晶體衍射和核磁共振(NMR)的數據谢肾,經過整理和確認后存檔而成腕侄。目前PDB數據庫的維護由結構生物信息學研究合作組織(RCSB)負責。RCSB的主服務器和世界各地的鏡像服務器提供數據庫的檢索和下載服務芦疏,以及關于PDB數據文件格式和其它文檔的說明冕杠,PDB數據還可以從發(fā)行的光盤獲得。使用Rasmol等軟件可以在計算機上按PDB文件顯示生物大分子的三維結構酸茴。
RCSB 的PDB數據庫網址是:http://www.rcsb.org/pdb/拌汇。
5. SCOP
蛋白質結構分類(SCOP)數據庫詳細描述了已知的蛋白質結構之間的關系。分類基于若干層次:家族弊决,描述相近的進化關系;超家族魁淳,描述遠源的進化關系飘诗;折疊子(fold),描述空間幾何結構的關系界逛;折疊類昆稿,所有折疊子被歸于全α、全β息拜、α/β溉潭、α+β和多結構域等幾個大類。SCOP還提供一個非冗余的ASTRAIL序列庫少欺,這個庫通常被用來評估各種序列比對算法喳瓣。此外,SCOP還提供一個PDB-ISL中介序列庫赞别,通過與這個庫中序列的兩兩比對畏陕,可以找到與未知結構序列遠緣的已知結構序列。
SCOP的網址是:http://scop.mrc-lmb.cam.ac.uk/scop/仿滔。
6. COG
蛋白質直系同源簇(COGs)數據庫是對細菌惠毁、藻類和真核生物的21個完整基因組的編碼蛋白犹芹,根據系統(tǒng)進化關系分類構建而成。COG庫對于預測單個蛋白質的功能和整個新基因組中蛋白質的功能都很有用鞠绰。利用COGNITOR程序腰埂,可以把某個蛋白質與所有COGs中的蛋白質進行比對,并把它歸入適當的COG簇蜈膨。COG庫提供了對COG分類數據的檢索和查詢屿笼,基于Web的COGNITOR服務,系統(tǒng)進化模式的查詢服務等丈挟。
COG庫的網址是:http://www.ncbi.nlm.nih.gov/COG刁卜。
下載COG庫和COGNITOR程序在:ftp://ncbi.nlm.nih.gov/pub/COG。