參考文獻(xiàn):
http://www.bbioo.com/experiment/24-117079-1.html
http://blog.shenwei.me/local-blast-installation/
Blast,全稱Basic Local Alignment Search Tool,即"基于局部比對(duì)算法的搜索工具"
Blast能夠?qū)崿F(xiàn)比較兩段核酸或者蛋白序列之間的同源性的功能,它能夠快速的找到兩段序列之間的同源序列并對(duì)比對(duì)區(qū)域進(jìn)行打分以確定同源性的高低瓮具。
Blast的運(yùn)行方式是先用目標(biāo)序列建數(shù)據(jù)庫(這種數(shù)據(jù)庫稱為database,里面的每一條序列稱為subject),然后用待查的序列(稱為query)在database中搜索煤傍,每一條query與database中的每一條subject都要進(jìn)行雙序列比對(duì)朦肘,從而得出全部比對(duì)結(jié)果饭弓。
Blast是一個(gè)集成的程序包,通過調(diào)用不同的比對(duì)模塊媒抠,blast實(shí)現(xiàn)了五種可能的序列比對(duì)方式:
blastp:蛋白序列與蛋白庫做比對(duì)弟断,直接比對(duì)蛋白序列的同源性。
blastx:核酸序列對(duì)蛋白庫的比對(duì)趴生,先將核酸序列翻譯成蛋白序列(根據(jù)相位可以翻譯為6種可能的蛋白序列)阀趴,然后再與蛋白庫做比對(duì)。
blastn:核酸序列對(duì)核酸庫的比對(duì)苍匆,直接比較核酸序列的同源性刘急。
tblastn:蛋白序列對(duì)核酸庫的比對(duì),將庫中的核酸翻譯成蛋白序列浸踩,然后進(jìn)行比對(duì)叔汁。
tblastx:核酸序列對(duì)核酸庫在蛋白級(jí)別的比對(duì),將庫和待查序列都翻譯成蛋白序列,然后對(duì)蛋白序列進(jìn)行比對(duì)攻柠。
理清楚兩個(gè)概念
相似性:
是指一種很直接的數(shù)量關(guān)系球订,比如部分相同或相似的百分比或其它一些合適的度量。比如說瑰钮,A序列和B序列的相似性是80%冒滩,或者4/5。這是個(gè)量化的關(guān)系浪谴。當(dāng)然可進(jìn)行自身局部比較
同源性:
指從一些數(shù)據(jù)中推斷出的兩個(gè)基因或蛋白質(zhì)序列具而共同祖先的結(jié)論开睡,屬于質(zhì)的判斷。就是說A和B的關(guān)系上苟耻,只有是同源序列篇恒,或者非同源序列兩種關(guān)系。而說A和B的同源性為80%都是不科學(xué)的
序列的相似性和序列的同源性有一定的關(guān)系凶杖,一般來說序列間的相似性越高的話胁艰,它們是同源序列的可能性就更高,所以經(jīng)持球穑可以通過序列的相似性來推測(cè)序列是否同源腾么。
正因?yàn)榇嬖谶@樣的關(guān)系,很多時(shí)候?qū)π蛄械南嗨菩院屯葱跃蜎]有做很明顯的區(qū)分杈湾,造成經(jīng)常等價(jià)混用兩個(gè)名詞解虱。所以有出現(xiàn)A序列和B序列的同源性為80%一說。