blast數(shù)據(jù)庫文檔說明(2018-06-03)

blast數(shù)據(jù)庫說明地址:ftp://ftp.ncbi.nlm.nih.gov/blast/documents/blastdb.html
更新于2017年3月6日

文檔中主要描述NCBI-FTP站點下可用的BLAST數(shù)據(jù)庫甚垦。

1 快速啟動

  • 為具有相同基名的數(shù)據(jù)庫獲取所有編號的文件:
    這些文件中的每一個代表該數(shù)據(jù)庫的子集(卷)贾节,并且所有這些文件都
    需要重建數(shù)據(jù)庫寝蹈。
  • 在提取之后啼肩,不需要連接生成的文件:
    用數(shù)據(jù)庫文件調(diào)用具有基名的數(shù)據(jù)庫剔难,使用"-db nr"爆价。
  • 為了便于下載徐伐,請使用BAST+包中的update_blastdb.pl腳本锣吼。
  • 增量更新不可用

2 概論
在NCBI-BASIC主頁的BASIC部分下的BLAST搜索頁面使用一組標準的BLAST數(shù)據(jù)庫得湘,用于核苷酸杖玲、蛋白質(zhì)和翻譯的BLAST搜索。這些數(shù)據(jù)庫可作為預(yù)格式化形式的壓縮存檔提供淘正,并且可以從BLAST-FTP站點的/db目錄中被download使用摆马。FASTA文件駐留在/FASTA目錄下。
預(yù)先格式化的數(shù)據(jù)庫具有以下優(yōu)點:

  • 預(yù)格式化消除了運行 makeblastdb的需要鸿吆;
  • 每個數(shù)據(jù)庫條目都包含物種級分類ID囤采;
  • 數(shù)據(jù)庫被分解成更小的體積,因此更容易惩淳。
    下載蕉毯;
  • FASTA格式的序列可以從預(yù)格式化數(shù)據(jù)庫生成
    通過使用BLASTBCMD實用工具;
  • 在BLAST +包中有一個方便的腳本(update_blastdb.pl)可下載預(yù)格式化的數(shù)據(jù)庫思犁。

預(yù)格式化的數(shù)據(jù)庫必須使用update_blastdb.pl腳本下載
在二進制模式下通過FTP代虾。這個腳本的文檔可以通過運行來獲得。
沒有任何參數(shù)的腳本抒倚;Perl安裝是必需的褐着。

下載的壓縮文件必須用GZIP或其他解壓縮程序膨脹。
工具托呕。然后可以從生成的焦油中提取BLAST數(shù)據(jù)庫文件含蓉。
使用UNIX/Linux上的TAR實用程序,或者WinZip和StuffIt擴展程序
Windows和Macintosh平臺项郊。

大型數(shù)據(jù)庫被格式化為多個千兆字節(jié)卷馅扣,它們被命名為
使用堿基名稱。所有具有相同基名的卷都是
必修的着降。提供別名文件以將單個卷捆綁在一起差油,以便
可以使用基名調(diào)用數(shù)據(jù)庫(不使用.NAL或.PAL)。
延伸)。例如蓄喇,要調(diào)用EST數(shù)據(jù)庫发侵,只需使用“-dB EST”選項即可。
在命令行中(沒有引號)妆偏。

未在預(yù)格式化格式中提供的附加BLAST數(shù)據(jù)庫
在FASTA子目錄中可用刃鳄。對于其他基因組爆破數(shù)據(jù)庫,
請檢查基因組FTP目錄在:
FTP://FTPNCBI.NLM.NIH.GOV/GENOMESS/

3 /BLAST/DB/目錄的內(nèi)容

預(yù)格式化的BLAST數(shù)據(jù)庫存檔在該目錄中钱骂。這些數(shù)據(jù)庫及其內(nèi)容的名稱如下叔锐。


數(shù)據(jù)庫名稱第一部分

數(shù)據(jù)庫名稱第二部分

4 /BLAST/DB/FASTA目錄的內(nèi)容

此目錄包含F(xiàn)AST-格式化的序列文件。文件名和數(shù)據(jù)庫內(nèi)容如下见秽。這些文件必須在BLAST程序使用之前愉烙,通過BLASTBCMD進行解包和處理。


數(shù)據(jù)庫.png

5 數(shù)據(jù)庫更新

blast數(shù)據(jù)庫定期更新解取。沒有建立的增量更新方案步责。我們建議定期下載完整的數(shù)據(jù)庫以保持它們的內(nèi)容。

6禀苦。非冗余偏轉(zhuǎn)句法

非冗余數(shù)據(jù)庫是NR勺择、NT和PATAA。相同的序列被合并到這些數(shù)據(jù)庫中的一個條目中伦忠。要合并兩個序列省核,必須具有相同的長度,并且每個位置上的每個殘差必須相同昆码。對于屬于一個記錄的不同條目的FASTA偏轉(zhuǎn)由控件分隔气忠,這是大多數(shù)程序不可見的字符。在下面的示例中赋咽,兩個條目Q57 29 3.1和AAB05030.1具有相同的順序旧噪,在各個方面。

單個序列現(xiàn)在簡單地通過它們的訪問版本來標識脓匿。

對于不屬于官方NCBI序列數(shù)據(jù)庫的數(shù)據(jù)庫淘钟,如跟蹤數(shù)據(jù)庫,使用GNL協(xié)議陪毡。對于自定義數(shù)據(jù)庫米母,應(yīng)遵守本公約,每個序列的ID必須是唯一的毡琉,如果你想利用索引數(shù)據(jù)庫的優(yōu)勢铁瞒,使用BLASTBCMD程序?qū)崿F(xiàn)特定的序列檢索在BASIC可執(zhí)行程序包中。應(yīng)參考文獻分布在獨立的blast包中以獲取更多細節(jié)桅滋。

7慧耍。將FASTA文件格式化為可擴展數(shù)據(jù)庫

FASTA文件需要用makeblastdb進行格式化,然后才能在本地BLAST搜索中使用。對于那些來自NCBI的芍碧,推薦以下的makeblastdb命令:

對于核苷酸FASTA文件:

 makeblastdb -in input_db -dbtype nucl -parse_seqids

用于蛋白質(zhì)FASTA文件:

 makeblastdb -in input_db -dbtype prot -parse_seqids

一般來說煌珊,如果數(shù)據(jù)庫作為BLAST數(shù)據(jù)庫可用,最好使用
預(yù)格式化數(shù)據(jù)庫泌豆。

--- 以后再來修飾語句

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末怪瓶,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子践美,更是在濱河造成了極大的恐慌,老刑警劉巖找岖,帶你破解...
    沈念sama閱讀 217,734評論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件陨倡,死亡現(xiàn)場離奇詭異,居然都是意外死亡许布,警方通過查閱死者的電腦和手機兴革,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,931評論 3 394
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來蜜唾,“玉大人杂曲,你說我怎么就攤上這事≡啵” “怎么了擎勘?”我有些...
    開封第一講書人閱讀 164,133評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長颖榜。 經(jīng)常有香客問我棚饵,道長,這世上最難降的妖魔是什么掩完? 我笑而不...
    開封第一講書人閱讀 58,532評論 1 293
  • 正文 為了忘掉前任噪漾,我火速辦了婚禮,結(jié)果婚禮上且蓬,老公的妹妹穿的比我還像新娘欣硼。我一直安慰自己,他們只是感情好恶阴,可當(dāng)我...
    茶點故事閱讀 67,585評論 6 392
  • 文/花漫 我一把揭開白布诈胜。 她就那樣靜靜地躺著,像睡著了一般冯事。 火紅的嫁衣襯著肌膚如雪耘斩。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,462評論 1 302
  • 那天桅咆,我揣著相機與錄音括授,去河邊找鬼。 笑死,一個胖子當(dāng)著我的面吹牛荚虚,可吹牛的內(nèi)容都是我干的薛夜。 我是一名探鬼主播,決...
    沈念sama閱讀 40,262評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼版述,長吁一口氣:“原來是場噩夢啊……” “哼梯澜!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起渴析,我...
    開封第一講書人閱讀 39,153評論 0 276
  • 序言:老撾萬榮一對情侶失蹤晚伙,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后俭茧,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體咆疗,經(jīng)...
    沈念sama閱讀 45,587評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,792評論 3 336
  • 正文 我和宋清朗相戀三年母债,在試婚紗的時候發(fā)現(xiàn)自己被綠了午磁。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,919評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡毡们,死狀恐怖迅皇,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情衙熔,我是刑警寧澤登颓,帶...
    沈念sama閱讀 35,635評論 5 345
  • 正文 年R本政府宣布,位于F島的核電站红氯,受9級特大地震影響挺据,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜脖隶,卻給世界環(huán)境...
    茶點故事閱讀 41,237評論 3 329
  • 文/蒙蒙 一扁耐、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧产阱,春花似錦婉称、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,855評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至庄敛,卻和暖如春俗壹,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背藻烤。 一陣腳步聲響...
    開封第一講書人閱讀 32,983評論 1 269
  • 我被黑心中介騙來泰國打工绷雏, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留头滔,地道東北人。 一個月前我還...
    沈念sama閱讀 48,048評論 3 370
  • 正文 我出身青樓涎显,卻偏偏與公主長得像坤检,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子期吓,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,864評論 2 354

推薦閱讀更多精彩內(nèi)容