基因結(jié)構(gòu)預(yù)測(cè)中同源注釋策略绍申,將mRNA顾彰、cDNA、蛋白涨享、EST等序列比對(duì)到組裝的基因組中,在文章中通常使用以下比對(duì)軟件:
- tblastn
- gamp
- exonerate
- blat
根據(jù)我的實(shí)測(cè)厕隧,以上軟件整體都比較慢。gmap可設(shè)置多線(xiàn)程來(lái)提升速度髓迎。tblastn雖然也可以,但對(duì)提速?zèng)]什么影響排龄。exonerate和gamp巨吃?xún)?nèi)存翎朱。
以下是跑的資源情況。我的組裝基因組約400Mb闭翩。tblastn的查詢(xún)序列311764條,gmap的查詢(xún)序列1483791條疗韵,exonerate的查詢(xún)序列43632條。
image.png
另有一款軟件 spaln:https://github.com/ogotoh/spaln流译,據(jù)說(shuō)很快者疤。但文檔比較費(fèi)解,我懶得摸索驹马,暫時(shí)還沒(méi)用起來(lái)除秀。
因此算利,我的建議是如果你的服務(wù)器配置很高,首選gmap多設(shè)線(xiàn)程效拭。配置不高或者想快速獲得結(jié)果情況下,可拆分query序列(蛋白/cDNA/mRNA/EST)缎患,進(jìn)行并行比對(duì),最后進(jìn)行合并肮街。尤其是tblastn之類(lèi)的軟件,必須這樣才行低散。否則建議嘗試用spaln(影響力較低骡楼,沒(méi)用過(guò)稽鞭,還不好說(shuō))鸟整。