本文就以生信小白的角度碧浊,簡述bowtie2的下載、安裝及使用必孤。關(guān)于bowtie2的使用教程非常豐富,具體的概念本文不再贅述兴想,只對操作過程進(jìn)行簡(xi)簡(zhi)單(ru)單(wei)的介紹赡勘,希望對同樣的初學(xué)者提供一些幫助闸与。
我是使用Mac終端連接服務(wù)器環(huán)境下使用的。
下載及安裝
起初我是在服務(wù)器環(huán)境下使用 wget+鏈接 下載軟件厂画,運(yùn)行時發(fā)現(xiàn)安裝失敗拷邢。
于是在服務(wù)器里下載miniconda,并添加了bioconda鏡像欲虚。(conda安裝教程http://www.reibang.com/p/edaa744ea47d)悔雹。conda環(huán)境下輸入conda iinstall gatk bowtie2荠商。檢索結(jié)果輸入y。
在miniconda/bin目錄下輸入ls初肉,可以看到bowtie2牙咏,輸入 ./bowtie2 -help嘹裂,出現(xiàn)help說明軟件就可以用了。
使用
序列數(shù)據(jù)
我已經(jīng)把需要比對的序列和參考基因組上傳服務(wù)器了。read 目錄下是我的測序文件a_0.fq伊磺、 a_20.fq 和 a_60.fq,ref 目錄下是我的參考基因組 Tas.V1.genome.fa
建索引
進(jìn)入ref目錄续崖。輸入bowtie2-build Tsa.v1.genome.fa(參考基因組) Tas(輸出文件名前綴)
需要一段時間严望,我170M的基因組大概1分鐘多時間莺丑。完成后會獲得6個 .bt2后綴的文件墩蔓,如下,說明索引建立成功昏名。
序列比對
這里的參數(shù)較多轻局,選取主要的使用即可样刷。通常測序文件是雙端的置鼻,這里我的是序列是單端,所以使用的參數(shù)也不同储藐。首先是雙端序列(我沒跑雙端嘶是,結(jié)果就不呈現(xiàn)了),單端序列結(jié)果如下辖源。
進(jìn)入read目錄下輸入:
雙端:$ bowtie2 -x ../ref/Tsa(索引所在目錄,因為在上一級浮梢,所以使用../) -1 read1_1.fq(第一端) -2 read1_2.fq(第二端) -S read1.sam(指定輸出文件名)
單端:$ bowtie2 -x ../ref/Tsa(索引所在目錄)?-U a_0.fq(第一端) -S a_0_Tsa.sam(指定輸出文件名)
初步結(jié)果顯示,a_0.fp 文件中有172333條序列洲尊,其中只有8.79%的序列比對到參考基因組上坞嘀。
以此類推,我獲得了其余兩個序列的sam文件棺滞。
參考及其感謝
hsy_hzauer??http://www.reibang.com/u/49bcf3035565
賣萌哥????conda的安裝與使用(最新版):http://www.reibang.com/p/edaa744ea47d
郭威 ? ?序列比對軟件bowtie2--快速入門:https://v.qq.com/x/page/m0846mwp8cl.html