本地化的NCBI BLAST+的安裝及使用

在生物信息學,BLAST(基本的局部比對搜索工具)是一種算法炒事,用于比較生物的序列信息难礼,諸如蛋白質(zhì)的氨基酸序列娃圆、DNA或RNA核苷酸序列。BLAST搜索使研究人員能夠?qū)⒁粋€目標蛋白或核苷酸序列(稱為查詢)與一個數(shù)據(jù)庫進行比較蛾茉,并識別某個特定閾值以上的與目標序列相似的庫序列讼呢。在線的BLAST功能只需要將序列輸入,然后BLAST谦炬,最后會給出相似的庫序列(按照同源性高低排列)悦屏。在線BLAST明顯存在兩個缺陷:1.目標序列BLAST后的得到的庫序列是多個物種的,如果我們只是要特定物種的話,還需要再自己找础爬。2.如果目標序列有很多散劫,則需要執(zhí)行很多次,效率低幕帆。而本地化的BLAST+能很好的解決上面兩個問題获搏。

1.BLAST+的下載與安裝

BLAST+下載地址: ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/

針對不同的平臺(linux,mac,windows)選擇性的進行安裝,如圖一失乾。
下面以mac為例進行介紹:

1.下載:ncbi-blast-2.9.0+-x64-macosx.tar.gz
2.下載完成后常熙,進行解壓縮。
3.打開終端碱茁,輸入以下代碼:
#將目標地址設(shè)為環(huán)境變量
open ~/.bash_profile       #打開環(huán)境變量配置窗口裸卫。
在彈出的窗口中輸入如下:
export PATH=$PATH:/Users/bcl/Desktop/software_plugin/ncbi-blast-2.9.0+/bin    #將blast文件夾中的bin地址設(shè)為環(huán)境變量。
#驗證是否成功配置為環(huán)境變量
blastn                    #出現(xiàn)圖二說明OK纽竣。
圖一
圖二

2.BLAST+的使用

下面以一個實例來說明怎么使用墓贿。比如說你想把番茄的一部分序列對應(yīng)到桃基因組數(shù)據(jù)庫中,并按照同源性高低得到與目標序列相似的庫序列(根據(jù)不同的篩選標準蜓氨,得到的序列條數(shù)會不一樣)聋袋,應(yīng)該怎么做呢?

2.1 序列的下載

首先你得從相應(yīng)的網(wǎng)站下載番茄一部分序列(因為我們以blastp為例穴吹,所以只下載了它的蛋白序列)幽勒,以及下載得到桃的基因組文件(只用其中的蛋白序列)。下載得到的文件放在一個文件夾中港令。

2.2 庫的構(gòu)建

利用下載得到的桃的基因組文件進行構(gòu)建蛋白庫啥容。在終端中輸入如下代碼:

cd /Users/bcl/Desktop/blastp        #cd到存放文件的地址。
makeblastdb -in Prunus_persica_v2.0.a1.allTrs.pep.fa -dbtype prot  
#下面為注釋:
-in:代表用來構(gòu)庫的基因組文件的地址和文件名
-dbtype:代表構(gòu)建的是什么庫顷霹,prot代表蛋白庫咪惠。

構(gòu)建成功會出現(xiàn)圖三以及文件夾中會多出三個文件(圖四)。


圖三
圖四

2.3 目標序列與庫序列進行比對

終端下輸入如下代碼:

blastp -help     #查看幫助文檔
blastp -query JA_regulated_genes.fasta -db Prunus_persica_v2.0.a1.allTrs.pep.fa -out JA_regulated_genes_blastp.txt -evalue 1e-5 -outfmt 6        
#下面為注釋淋淀。
-query:代表的是要進行blastp的番茄一部分序列文件
-db:為前面用于建庫桃的的基因組文件
-out:為輸出文件的文件名
-evalue:為篩選標準(evalue越低遥昧,相似性越高)
-outfmt:輸出文件格式,6代表表格形式绅喉。

輸出的結(jié)果按照同源性從高到低排列(目標序列與庫序列進行同源比對時根據(jù)evalue篩選出來的可能不止一個)渠鸽,那么如何選出每個最匹配的呢?


圖5

3.R studio中提取輸出文件中同源性最高的序列

打開R studio叫乌,輸入以下代碼柴罐,即可實現(xiàn)。

#讀取文件
txt <- read.csv('/Users/bcl/Desktop/blastp/JA_regulated_genes_blastp.txt',header=FALSE,sep='\t',encoding='UTF-8')   #第一個參數(shù)為上一步比對后生成文件的地址和文件名憨奸,后面的參數(shù)不需要做調(diào)整革屠。
#構(gòu)建一個布爾向量,索引。
index<- duplicated(txt$V1) #duplicated()在數(shù)據(jù)框函數(shù)中應(yīng)用廣泛
index
#篩選數(shù)據(jù)(兩種)
            #method1
txt<-txt[which(index==FALSE),]  #選擇非重復(fù)數(shù)據(jù)
txt
            #method2
txt<-txt[!index,]                              #選擇非重復(fù)數(shù)據(jù)
txt
#數(shù)據(jù)寫入到txt中似芝,把行名和列名設(shè)為flase,并去掉引號
write.table(txt,file='/Users/bcl/Desktop/blastp/JA_regulated_genes_select.txt',row.names=FALSE,col.names = FALSE,quote=F)    #第二個參數(shù)與讀取的時候同

下圖為經(jīng)過選擇后的文件可發(fā)現(xiàn)已提取出同源性最高的序列那婉。


圖6

本文由博客一文多發(fā)平臺 OpenWrite 發(fā)布!

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末党瓮,一起剝皮案震驚了整個濱河市详炬,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌寞奸,老刑警劉巖呛谜,帶你破解...
    沈念sama閱讀 218,941評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異枪萄,居然都是意外死亡隐岛,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,397評論 3 395
  • 文/潘曉璐 我一進店門瓷翻,熙熙樓的掌柜王于貴愁眉苦臉地迎上來聚凹,“玉大人,你說我怎么就攤上這事齐帚《恃溃” “怎么了?”我有些...
    開封第一講書人閱讀 165,345評論 0 356
  • 文/不壞的土叔 我叫張陵对妄,是天一觀的道長单旁。 經(jīng)常有香客問我,道長饥伊,這世上最難降的妖魔是什么象浑? 我笑而不...
    開封第一講書人閱讀 58,851評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮琅豆,結(jié)果婚禮上愉豺,老公的妹妹穿的比我還像新娘。我一直安慰自己茫因,他們只是感情好蚪拦,可當我...
    茶點故事閱讀 67,868評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著冻押,像睡著了一般驰贷。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上洛巢,一...
    開封第一講書人閱讀 51,688評論 1 305
  • 那天括袒,我揣著相機與錄音,去河邊找鬼稿茉。 笑死锹锰,一個胖子當著我的面吹牛芥炭,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播恃慧,決...
    沈念sama閱讀 40,414評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼园蝠,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了痢士?” 一聲冷哼從身側(cè)響起彪薛,我...
    開封第一講書人閱讀 39,319評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎怠蹂,沒想到半個月后陪汽,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,775評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡褥蚯,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,945評論 3 336
  • 正文 我和宋清朗相戀三年挚冤,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片赞庶。...
    茶點故事閱讀 40,096評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡训挡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出歧强,到底是詐尸還是另有隱情澜薄,我是刑警寧澤,帶...
    沈念sama閱讀 35,789評論 5 346
  • 正文 年R本政府宣布摊册,位于F島的核電站肤京,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏茅特。R本人自食惡果不足惜忘分,卻給世界環(huán)境...
    茶點故事閱讀 41,437評論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望白修。 院中可真熱鬧妒峦,春花似錦、人聲如沸兵睛。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,993評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽祖很。三九已至笛丙,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間假颇,已是汗流浹背胚鸯。 一陣腳步聲響...
    開封第一講書人閱讀 33,107評論 1 271
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留拆融,地道東北人蠢琳。 一個月前我還...
    沈念sama閱讀 48,308評論 3 372
  • 正文 我出身青樓啊终,卻偏偏與公主長得像镜豹,于是被迫代替她去往敵國和親傲须。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,037評論 2 355

推薦閱讀更多精彩內(nèi)容

  • Blast趟脂,全稱Basic Local Alignment Search Tool泰讽,即"基于局部比對算法的搜索工具...
    曉僉閱讀 15,015評論 1 26
  • 舉個栗子??: 最近對擬南芥中的一個叫做CBF的基因非常感興趣,現(xiàn)在我想看看這個CBF基因在一個新測序的物種Am基因...
    Ruta閱讀 13,983評論 1 19
  • 轉(zhuǎn)載自:http://www.reibang.com/p/a912ad4a8dee有部分改動 Blast昔期,全稱B...
    東風008閱讀 3,012評論 0 9
  • conda安裝: conda create --name blast conda activate blast c...
    moneir閱讀 3,067評論 0 4
  • 我知道 大多數(shù)快樂都是暫時的 所以我 也不刻意去尋找快樂
    Jones貝特萊夫閱讀 56評論 0 0