Minimap2是李恒大牛在2018年開發(fā)的針對(duì)于三代測(cè)序數(shù)據(jù)進(jìn)行比對(duì)的工具,minimap2的優(yōu)勢(shì)是速度快,而且聽說(shuō)比對(duì)的結(jié)果也比較不錯(cuò)蛆橡,不知道甩samtools幾條街;缺點(diǎn)呢综芥,就是耗費(fèi)內(nèi)存。
李恒大神實(shí)在是太牛了猎拨。
minimap2的主要思想是:首先將基因組序列的minimizer存儲(chǔ)在哈希表中(minimizer指一段序列內(nèi)最小哈希值的種子)膀藐;然后對(duì)于每一條待比對(duì)序列, 找到待比對(duì)序列所有的minimizer红省,通過(guò)哈希表找出其在基因組中的位置额各, 并利用chaining算法尋找待比對(duì)區(qū)域;最后將非種子區(qū)域用動(dòng)態(tài)規(guī)劃算法進(jìn)行比對(duì)吧恃,得到比對(duì)結(jié)果虾啦。minimap2方法只對(duì)最小哈希值的種子進(jìn)行存儲(chǔ),可有效降低時(shí)間復(fù)雜度痕寓。
01 Minimap2的安裝
由于我們學(xué)校的管理員很勤奮傲醉,所有很多軟件都不用我們手動(dòng)安裝。直接module 加載即可呻率。
module load minimap2/v2.17
# 簡(jiǎn)簡(jiǎn)單單
看GitHub上硬毕,要自行安裝的話也不麻煩。參考:https://github.com/lh3/minimap2
git clone https://github.com/lh3/minimap2
cd minimap2 && make
很簡(jiǎn)單筷凤,應(yīng)該沒有什么坑昭殉。
02Minimap2的使用
其實(shí)看了李恒的GitHub的話,基本上已經(jīng)很明白了(突然感覺寫這個(gè)帖子毫無(wú)意義)藐守,而且get start特別簡(jiǎn)單挪丢。
跑一下我的數(shù)據(jù)。
minimap2 -ax map-pb azyz.genome.fasta azyz.flnc.fasta > aln.sam
03結(jié)果分析
比對(duì)結(jié)果卢厂,和samtools的格式是一樣的乾蓬,這點(diǎn)沒有什么好說(shuō)的。我這里的主要目的是通過(guò)全長(zhǎng)轉(zhuǎn)錄組慎恒,來(lái)看一下我找到的那個(gè)基因(40kb任内,成精了呢)是否是一個(gè)真的基因。
我的做法是在IGV上找一下那個(gè)基因融柬,是否有ISO的read達(dá)到那么長(zhǎng)死嗦。那么接下來(lái)就是轉(zhuǎn)bam,igv導(dǎo)入數(shù)據(jù)就完事了粒氧。
samtools view -Sb aln.sam > aln.bam
所以本次的筆記就到這里越除。