寫在前面
最近在利用小麥的重測序數(shù)據(jù)進(jìn)行mapping,小麥?zhǔn)且粋€很奇特的物種愁茁,六倍體蚕钦,有ABD三個基因組,基因組大小約為17Gb鹅很,因此嘶居,制約小麥重測序數(shù)據(jù)分析的一個很大的問題就是需要消耗大量的時間,進(jìn)行index以及mapping促煮。然后bwa最近進(jìn)行了升級邮屁,升級為了bwa-mem2,因此我測試一下運(yùn)行速度,非巢こ荩快佑吝,但是也存在一些問題!
首先是bwa2的安裝绳匀,貌似現(xiàn)在不能使用conda安裝芋忿,官網(wǎng)給了詳細(xì)的介紹,我撿重點(diǎn)的給大家看一下
重點(diǎn)內(nèi)容
兩種安裝方法
#第一種
curl -L https://github.com/bwa-mem2/bwa-mem2/releases/download/v2.0pre2/bwa-mem2-2.0pre2_x64-linux.tar.bz2 \ | tar jxf -
#第二種
git clone https://github.com/bwa-mem2/bwa-mem2?
cd bwa-mem2
make
. /bwa-mem2
對參考基因組建立索引
一共生成了7個文件疾棵,其中最大的是190G戈钢,
之后使用bwa-mem2測試了一下數(shù)據(jù)
#bwa比對命令?
bwa mem -t 4 -R '@RG\tID:SRR7478247\tPL:Illumina\tSM:SRR7478251' ~/bwa-v1-index/161010_Chinese_Spring_v1.0 SRR7478251.1.fastp.fq SRR7478251.2.fastp.fq > SRR7478251.sam &
#bwa-mem2比對命令
nohup bwa-mem2 mem -R '@RG\tID:SRR7478258\tPL:illumina\tSM:SRR7478251' ~/bwa2-v1-index/161010_Chinese_Spring_v1.0_pseudomolecules.fasta SRR7478251.1.fastp.fq SRR7478251.2.fastp.fq > SRR7478251.sam
運(yùn)行速度第二個很快,大約8個小時的時間是尔,bwa-mem2可以得到50G的比對結(jié)果殉了,而bwa的結(jié)果是5.7Gb,真的是超級快了.
但是也存在一些問題拟枚,那就是在投任務(wù)的時候薪铜,bwa-mem2的第二個任務(wù)被kill了众弓,看了一下報錯結(jié)果,顯示segmentation fault隔箍。但是使用bwa就不存在這個問題田轧,個人更傾向于該版本的問題,但是還沒有很好的解決方法鞍恢。