本地化的NCBI BLAST+的安裝及使用

在生物信息學，BLAST(基本的局部比對搜索工具)是一種算法炒事，用于比較生物的序列信息难礼，諸如蛋白質(zhì)的氨基酸序列娃圆、DNA或RNA核苷酸序列。BLAST搜索使研究人員能夠?qū)⒁粋€目標蛋白或核苷酸序列(稱為查詢)與一個數(shù)據(jù)庫進行比較蛾茉，并識別某個特定閾值以上的與目標序列相似的庫序列讼呢。在線的BLAST功能只需要將序列輸入，然后BLAST谦炬，最后會給出相似的庫序列(按照同源性高低排列)悦屏。在線BLAST明顯存在兩個缺陷：1.目標序列BLAST后的得到的庫序列是多個物種的，如果我們只是要特定物種的話，還需要再自己找础爬。2.如果目標序列有很多散劫，則需要執(zhí)行很多次，效率低幕帆。而本地化的BLAST+能很好的解決上面兩個問題获搏。

1.BLAST+的下載與安裝

BLAST+下載地址: ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/

針對不同的平臺(linux,mac,windows)選擇性的進行安裝，如圖一失乾。
下面以mac為例進行介紹：

1.下載:ncbi-blast-2.9.0+-x64-macosx.tar.gz
2.下載完成后常熙，進行解壓縮。
3.打開終端碱茁，輸入以下代碼：
#將目標地址設(shè)為環(huán)境變量
open ~/.bash_profile       #打開環(huán)境變量配置窗口裸卫。
在彈出的窗口中輸入如下：
export PATH=$PATH:/Users/bcl/Desktop/software_plugin/ncbi-blast-2.9.0+/bin    #將blast文件夾中的bin地址設(shè)為環(huán)境變量。
#驗證是否成功配置為環(huán)境變量
blastn                    #出現(xiàn)圖二說明OK纽竣。

圖一

圖二

2.BLAST+的使用

下面以一個實例來說明怎么使用墓贿。比如說你想把番茄的一部分序列對應(yīng)到桃基因組數(shù)據(jù)庫中，并按照同源性高低得到與目標序列相似的庫序列(根據(jù)不同的篩選標準蜓氨，得到的序列條數(shù)會不一樣)聋袋，應(yīng)該怎么做呢？

2.1 序列的下載

首先你得從相應(yīng)的網(wǎng)站下載番茄一部分序列(因為我們以blastp為例穴吹，所以只下載了它的蛋白序列)幽勒，以及下載得到桃的基因組文件(只用其中的蛋白序列)。下載得到的文件放在一個文件夾中港令。

2.2 庫的構(gòu)建

利用下載得到的桃的基因組文件進行構(gòu)建蛋白庫啥容。在終端中輸入如下代碼：

cd /Users/bcl/Desktop/blastp        #cd到存放文件的地址。
makeblastdb -in Prunus_persica_v2.0.a1.allTrs.pep.fa -dbtype prot  
#下面為注釋：
-in:代表用來構(gòu)庫的基因組文件的地址和文件名
-dbtype:代表構(gòu)建的是什么庫顷霹，prot代表蛋白庫咪惠。

構(gòu)建成功會出現(xiàn)圖三以及文件夾中會多出三個文件(圖四)。

圖三

圖四

2.3 目標序列與庫序列進行比對

終端下輸入如下代碼：

blastp -help     #查看幫助文檔
blastp -query JA_regulated_genes.fasta -db Prunus_persica_v2.0.a1.allTrs.pep.fa -out JA_regulated_genes_blastp.txt -evalue 1e-5 -outfmt 6        
#下面為注釋淋淀。
-query：代表的是要進行blastp的番茄一部分序列文件
-db：為前面用于建庫桃的的基因組文件
-out：為輸出文件的文件名
-evalue：為篩選標準(evalue越低遥昧，相似性越高)
-outfmt：輸出文件格式，6代表表格形式绅喉。

輸出的結(jié)果按照同源性從高到低排列(目標序列與庫序列進行同源比對時根據(jù)evalue篩選出來的可能不止一個)渠鸽，那么如何選出每個最匹配的呢?

圖5

3.R studio中提取輸出文件中同源性最高的序列

打開R studio叫乌，輸入以下代碼柴罐，即可實現(xiàn)。

#讀取文件
txt <- read.csv('/Users/bcl/Desktop/blastp/JA_regulated_genes_blastp.txt',header=FALSE,sep='\t',encoding='UTF-8')   #第一個參數(shù)為上一步比對后生成文件的地址和文件名憨奸，后面的參數(shù)不需要做調(diào)整革屠。
#構(gòu)建一個布爾向量，索引。
index<- duplicated(txt$V1) #duplicated()在數(shù)據(jù)框函數(shù)中應(yīng)用廣泛
index
#篩選數(shù)據(jù)(兩種)
            #method1
txt<-txt[which(index==FALSE),]  #選擇非重復(fù)數(shù)據(jù)
txt
            #method2
txt<-txt[!index,]                              #選擇非重復(fù)數(shù)據(jù)
txt
#數(shù)據(jù)寫入到txt中似芝，把行名和列名設(shè)為flase,并去掉引號
write.table(txt,file='/Users/bcl/Desktop/blastp/JA_regulated_genes_select.txt',row.names=FALSE,col.names = FALSE,quote=F)    #第二個參數(shù)與讀取的時候同

下圖為經(jīng)過選擇后的文件可發(fā)現(xiàn)已提取出同源性最高的序列那婉。

圖6

本文由博客一文多發(fā)平臺 OpenWrite 發(fā)布！

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末党瓮，一起剝皮案震驚了整個濱河市详炬，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌寞奸，老刑警劉巖呛谜，帶你破解...
沈念sama閱讀 218,941評論 6贊 508
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異枪萄，居然都是意外死亡隐岛，警方通過查閱死者的電腦和手機，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,397評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門瓷翻，熙熙樓的掌柜王于貴愁眉苦臉地迎上來聚凹，“玉大人，你說我怎么就攤上這事齐帚《恃溃” “怎么了？”我有些...
開封第一講書人閱讀 165,345評論 0贊 356
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵对妄，是天一觀的道長单旁。經(jīng)常有香客問我，道長饥伊，這世上最難降的妖魔是什么象浑？我笑而不...
開封第一講書人閱讀 58,851評論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮琅豆，結(jié)果婚禮上愉豺，老公的妹妹穿的比我還像新娘。我一直安慰自己茫因，他們只是感情好蚪拦，可當我...
茶點故事閱讀 67,868評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著冻押，像睡著了一般驰贷。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上洛巢，一...
開封第一講書人閱讀 51,688評論 1贊 305
城市分裂傳說
那天括袒，我揣著相機與錄音，去河邊找鬼稿茉。笑死锹锰，一個胖子當著我的面吹牛芥炭，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播恃慧，決...
沈念sama閱讀 40,414評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼园蝠，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了痢士？” 一聲冷哼從身側(cè)響起彪薛，我...
開封第一講書人閱讀 39,319評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎怠蹂，沒想到半個月后陪汽，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,775評論 1贊 315
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡褥蚯，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,945評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年挚冤，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片赞庶。...
茶點故事閱讀 40,096評論 1贊 350
活死人
序言：一個原本活蹦亂跳的男人離奇死亡训挡，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出歧强，到底是詐尸還是另有隱情澜薄，我是刑警寧澤，帶...
沈念sama閱讀 35,789評論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布摊册，位于F島的核電站肤京，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏茅特。R本人自食惡果不足惜忘分，卻給世界環(huán)境...
茶點故事閱讀 41,437評論 3贊 331
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望白修。院中可真熱鬧妒峦，春花似錦、人聲如沸兵睛。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,993評論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽祖很。三九已至笛丙，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間假颇，已是汗流浹背胚鸯。一陣腳步聲響...
開封第一講書人閱讀 33,107評論 1贊 271
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留拆融，地道東北人蠢琳。一個月前我還...
沈念sama閱讀 48,308評論 3贊 372
代替公主和親
正文我出身青樓啊终，卻偏偏與公主長得像镜豹，于是被迫代替她去往敵國和親傲须。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 45,037評論 2贊 355