本地Blast的安裝與使用

寫在前面

這一篇教程寫于很久之前沮脖,那時(shí)候才剛開始學(xué)著記錄下自己的學(xué)習(xí)過程凯正,今天將其正式貼出來,供自己也供讀者參考秸抚。

Blast的安裝

  • 說明:BLAST工具是由NCBI所提供速和。

以下摘自NCBI官網(wǎng)
BLAST (Basic Local Alignment Search Tool) finds regions of similarity between biological sequences. The program compares nucleotide or protein sequences to sequence databases and calculates the statistical significance.

  • 功能:BLAST 是一套在蛋白質(zhì)數(shù)據(jù)庫或DNA數(shù)據(jù)庫中進(jìn)行相似性比較的分析工具。[BLAST]程序能迅速與公開數(shù)據(jù)庫進(jìn)行相似性序列比較剥汤。BLAST結(jié)果中的得分是對一種對相似性的統(tǒng)計(jì)說明颠放。

  • 下載地址ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/

舊地址已失效,新鏈接為 ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ncbi-blast-2.10.1+-x64-linux.tar.gz

  • 具體安裝
wget ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ncbi-blast-2.10.1+-x64-linux.tar.gz
tar -zxvf ncbi-blast-2.7.1+-x64-linux.tar.gz ‘解壓’
mv ncbi-blast-2.7.1+-x64-linux.tar.gz blast ‘改名’

可以通過絕對路徑來直接使用BLAST的相關(guān)命令吭敢,但為了使用方便碰凶,還需要進(jìn)一步配置。將BLAST+可執(zhí)行目錄(bin)的絕對路徑加入到環(huán)境變量PATH中,方便直接通過命令名進(jìn)行調(diào)用痒留。主要有兩種方法:

方法一:
執(zhí)行以下命令
PATH=$PATH:/usr/local/BLAST/blast/bin

PATH="PATH":/usr/local/BLAST/blast/bin

PATH=${PATH}:/usr/local/BLAST/blast/bin
這種方法只在當(dāng)前終端生效谴麦,退出重新進(jìn)入終端后就無法使用,要想永久生效伸头,參見方法二匾效。

方法二:
編輯~/.bashrc文件,在最后加上:
export PATH=/usr/local/BLAST/blast/bin:$PATH
如果不會使用vi/vim等編輯器恤磷,可直接運(yùn)行下列一行命令面哼,將上述內(nèi)容添加到~/.bashrc文件
echo "export PATH=/usr/local/BLAST/blast/bin:\$PATH" >> ~/.bashrc

最后,重啟終端或執(zhí)行以下命令讓配置生效:
source ~/.bashrc

需要注意的是如果你只想在普通用戶身份下使用BLAST的相關(guān)命令扫步,那需在普通用戶身份下執(zhí)行上述命令魔策,因?yàn)閞oot和一般用戶的PATH變量的內(nèi)容不一樣。

配置本地Blast庫

BLAST分為在線和本地兩種河胎,你可以直接在NCBI網(wǎng)站上在線使用BLAST進(jìn)行相關(guān)分析闯袒,也可以在本地進(jìn)行分析。當(dāng)需要進(jìn)行大量對比的時(shí)候游岳,將BLAST數(shù)據(jù)庫本地化能極大提高效率政敢。下面以一個(gè)具體例子講一下配置本地BLAST庫的方法。

BLAST數(shù)據(jù)庫分為兩類胚迫,核酸數(shù)據(jù)庫和氨基酸數(shù)據(jù)庫喷户,可以用makeblastbd創(chuàng)建
執(zhí)行help參數(shù)簡單看下說明(help說明中可以看到該命令所支持的文件格式)

從數(shù)據(jù)庫網(wǎng)站上下載長瓜兩個(gè)品種的核酸數(shù)據(jù)庫

wget ftp://cucurbitgenomics.org/pub/cucurbit/genome/cucumber/Chinese_long/v2/cucumber_ChineseLong_v2_genome.fa.gz
wget ftp://cucurbitgenomics.org/pub/cucurbit/genome/cucumber/Gy14/V2/ Gy14_v2.cds.fa.gz

解壓

gzip -d cucumber_ChineseLong_v2_genome.fa.gz
gzip -d Gy14_v2.cds.fa.gz

構(gòu)建數(shù)據(jù)庫

makeblastdb -in cucumber_ChineseLong_v2_genome.fa -dbtype nucl -out cucumber -parse_seqids
makeblastdb -in Gy14_v2.cds.fa -dbtype nucl -out Gy14 -parse_seqids

需要注意的是設(shè)置-parse_seqids參數(shù)時(shí),建庫時(shí)會對輸入fasta文件的序列ID進(jìn)行檢查访锻,注意不要有空格褪尝,不然會報(bào)錯(cuò)。

到此期犬,本地?cái)?shù)據(jù)庫就已經(jīng)建好了河哑。下面來嘗試進(jìn)行比對

echo '>test' > query.fa 
echo TGAAAGCAAGAAGAGCGTTTGGTGGTTTCTTAACAAATCATTGCAACTCCACAAGGCGCCTGTAATAGACAGCTTGTGCATGGAACTTGGTCCACAGTGCCCTACCACTGATGATGTTGATATCGGAAAGTGGGTTGCAAAAGCTGTTGATTGTTTGGTGATGACGCTAACAATCAAGCTCCTCTGGT >> query.fa

用blastn檢索核酸數(shù)據(jù)庫。最簡單的方法就是提供數(shù)據(jù)庫所在位置和需要檢索的序列文件龟虎。
blastn -db cucumber -query querry.fa -out test.blastn@cucumber.nsn -evalue 1e-2
這樣灾馒,序列比對的結(jié)果就會存儲在 test.blastn@cucumber.nsn 這個(gè)文件中。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末遣总,一起剝皮案震驚了整個(gè)濱河市睬罗,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌旭斥,老刑警劉巖容达,帶你破解...
    沈念sama閱讀 216,402評論 6 499
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異垂券,居然都是意外死亡花盐,警方通過查閱死者的電腦和手機(jī)羡滑,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,377評論 3 392
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來算芯,“玉大人柒昏,你說我怎么就攤上這事∥踝幔” “怎么了职祷?”我有些...
    開封第一講書人閱讀 162,483評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長届囚。 經(jīng)常有香客問我有梆,道長,這世上最難降的妖魔是什么意系? 我笑而不...
    開封第一講書人閱讀 58,165評論 1 292
  • 正文 為了忘掉前任泥耀,我火速辦了婚禮,結(jié)果婚禮上蛔添,老公的妹妹穿的比我還像新娘痰催。我一直安慰自己,他們只是感情好迎瞧,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,176評論 6 388
  • 文/花漫 我一把揭開白布陨囊。 她就那樣靜靜地躺著,像睡著了一般夹攒。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上胁塞,一...
    開封第一講書人閱讀 51,146評論 1 297
  • 那天咏尝,我揣著相機(jī)與錄音,去河邊找鬼啸罢。 笑死编检,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的扰才。 我是一名探鬼主播允懂,決...
    沈念sama閱讀 40,032評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼衩匣!你這毒婦竟也來了蕾总?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,896評論 0 274
  • 序言:老撾萬榮一對情侶失蹤琅捏,失蹤者是張志新(化名)和其女友劉穎生百,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體柄延,經(jīng)...
    沈念sama閱讀 45,311評論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡蚀浆,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,536評論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片市俊。...
    茶點(diǎn)故事閱讀 39,696評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡杨凑,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出摆昧,到底是詐尸還是另有隱情撩满,我是刑警寧澤,帶...
    沈念sama閱讀 35,413評論 5 343
  • 正文 年R本政府宣布据忘,位于F島的核電站鹦牛,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏勇吊。R本人自食惡果不足惜曼追,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,008評論 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望汉规。 院中可真熱鬧礼殊,春花似錦、人聲如沸针史。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽啄枕。三九已至婚陪,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間频祝,已是汗流浹背泌参。 一陣腳步聲響...
    開封第一講書人閱讀 32,815評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留常空,地道東北人沽一。 一個(gè)月前我還...
    沈念sama閱讀 47,698評論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像漓糙,于是被迫代替她去往敵國和親铣缠。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,592評論 2 353