1.下載參考基因組的fasta文件(ref.fa)(UCSC, NCBI, Ensembl.)
2.bowtie2-build ref.fa XXX
3.output:6個(gè)文件
XXX.1.bt2 , XXX.2.bt2 , XXX.3.bt2 , XXX .4.bt2 , XXX.rev.1.bt2 , XXX.rev.2.bt2
4.比對(duì)(-x 6個(gè)index文件的位置/前綴)
bowtie2 -x XXX -U R1.fq.gz -S output.sam
bowtie2 -x XXX -1 R1.fq.gz -2 R2.fq.gz -S output.sam
5.轉(zhuǎn)bam
samtools view -bS output.sam > output.bam
samtools sort output.bam -o output.sorted.bam
The bowtie2-build indexer
bowtie2比對(duì)軟件的安裝及參數(shù)詳解 - 簡書 (jianshu.com)
Installation
conda install bowtie2
Usage
bowtie2-build [options]* <reference_in> <bt2_base>
bowtie2 [options]* -x <bt2-idx> {-1 <m1> -2 <m2> | -U <r> | --interleaved <i> | --sra-acc <acc> | b <bam>} -S [<sam>]
-x 由bowtie2-build所生成的索引文件的前綴,需要指定路徑及其共用文件名
-1 使用trimmomatic質(zhì)控后與read2配對(duì)(paired)的read1掌动」沤瘢可以為多個(gè)文件葱跋,并用逗號(hào)分開蜀细;多個(gè)文件必須和 -2 <m2> 中制定的文件一一對(duì)應(yīng)滔迈。
-2 使用trimmomatic質(zhì)控后與read1配對(duì)的read2
-U 使用trimmomatic質(zhì)控后未配對(duì)(unpaired)的reads±谜可以為多個(gè)文件辽俗,并用逗號(hào)分開,測(cè)序文件中的reads的長度可以不一樣拴魄。
-S 所生成的SAM格式的文件前綴冗茸。默認(rèn)是輸入到標(biāo)準(zhǔn)輸出。
#-p/--threads NTHREADS 設(shè)置線程數(shù). Default: 1
bowtie2-inspect [options]* <bt2_base>
可選參數(shù)
輸入?yún)?shù)
-q 輸入的文件為FASTQ格式文件匹中,此項(xiàng)為默認(rèn)值
-f 輸入的文件為FASTA格式文件
-5/--trim5 <int> 剪掉5'端<int>長度的堿基夏漱,再用于比對(duì)。(default: 0)
-3/--trim3 <int> 剪掉3'端<int>長度的堿基顶捷,再用于比對(duì)挂绰。(default: 0).
--phred33 輸入的堿基質(zhì)量等于ASCII+33
Paired-end 參數(shù)
--no-mixed 默認(rèn)設(shè)置下, 一對(duì)reads不能成對(duì)比對(duì)到參考序列上, 則單獨(dú)對(duì)每個(gè)read進(jìn)行比對(duì). 該選項(xiàng)則阻止此行為.
--no-discordant 默認(rèn)設(shè)置下, 一對(duì)reads不能和諧比對(duì)(concordant alignment,即滿足-I, -X, --fr/--rf/--ff的條件)到參考序列上, 則搜尋其不和諧比對(duì)(disconcordant alignment, 即兩條reads都能獨(dú)一無二地比對(duì)到參考序列上, 但是不滿足-I,-X,--fr/--rf/--ff的條件). 該選項(xiàng)阻止此行為.
–end-to-end模式下的預(yù)設(shè)參數(shù)
--end-to-end 比對(duì)是將整個(gè)read和參考序列進(jìn)行比對(duì). 該模式--ma的值為0. 該模式為默認(rèn)模式, --local模式?jīng)_突.
--local 該模式下對(duì)read進(jìn)行局部比對(duì), 從而, read兩端的一些堿基不比對(duì),從而使比對(duì)得分滿足要求. 該模式下 –ma默認(rèn)為2.
--very-fast Same as: -D 5 -R 1 -N 0 -L 22 -i S,0,2.50
--fast Same as: -D 10 -R 2 -N 0 -L 22 -i S,0,2.50
--sensitive Same as: -D 15 -R 2 -N 0 -L 22 -i S,1,1.15 (default in --end-to-end mode)
--very-sensitive Same as: -D 20 -R 3 -N 0 -L 20 -i S,1,0.50
報(bào)告參數(shù)
-k 默認(rèn)設(shè)置下, bowtie2搜索出了一個(gè)read不同的比對(duì)結(jié)果, 并報(bào)告其中最好的比對(duì)結(jié)果(如果好幾個(gè)最好的比對(duì)結(jié)果得分一致, 則隨機(jī)挑選出其中一個(gè)). 而在該模式下, bowtie2最多搜索出一個(gè)read <int>個(gè)比對(duì)結(jié)果, 并將這些結(jié)果按得分降序報(bào)告出來.
-a 和-k參數(shù)一樣, 不過不限制搜索的結(jié)果數(shù)目. 并將所有的比對(duì)結(jié)果都按降序報(bào)告出來. 此參數(shù)和-k參數(shù)沖突. 值得注意的是: 如果基因組含有很多重復(fù)序列時(shí), 該參數(shù)會(huì)導(dǎo)致程序運(yùn)行極其緩慢.
Sam 參數(shù)
--no-unal 不記錄沒比對(duì)上的reads.
--no-hd 不記錄SAM header lines (以@開頭).
--no-sq 不記錄@SQ的SAM header lines.
--rg-id <text> 設(shè)定read group Id到<text>.
--rg <text> 增加<text>作為一行@RG.
輸出參數(shù)
-t/--time --un <path> 將unpaired reads寫入到<path>.
--no-unal 不能map到GENOME的reads,不保留sam記錄
--un-conc <path> 不能map到GENOME的reads服赎,fasta格式.
--un-conc-gz <path> 不能map到GENOME的reads葵蒂,fasta格式, gzip壓縮.
--al-conc <path> 能map到GENOME的reads交播,fasta格式.
--al-conc-gz <path> 能map到GENOME的reads,fasta格式, gzip壓縮.
-p/--threads NTHREADS 設(shè)置線程數(shù). Default: 1
作者:husy_
鏈接:http://www.reibang.com/p/f84ffba2ec1e
來源:簡書
#官網(wǎng)示例
bowtie2 -x lambda_virus -U BT2_HOME/example/reads/reads_1.fq -S eg1.sam
# paired-end example:
bowtie2 -x $BT2_HOME/example/index/lambda_virus -1 _1.fq -2 _2.fq -S eg2.sam
#Use samtools view to convert the SAM file into a BAM file. BAM is the binary format corresponding to the SAM text format. Run:
samtools view -bS eg2.sam > eg2.bam
#Use samtools sort to convert the BAM file to a sorted BAM file.
samtools sort eg2.bam -o eg2.sorted.bam
#We now have a sorted BAM file called eg2.sorted.bam. Sorted BAM is a useful format because the alignments are (a) compressed, which is convenient for long-term storage, and (b) sorted, which is conveneint for variant discovery.
#To generate variant calls in VCF format, run:
bcftools mpileup -f $BT2_HOME/example/reference/lambda_virus.fa eg2.sorted.bam | bcftools view -Ov - > eg2.raw.bcf
Then to view the variants, run:
bcftools view eg2.raw.bcf
conda activate
bowtie2-build hg38.fa hg38
bowtie2 -p 10 -x /data/ref/bowtie2/mm10/mm10 -1 input_1.fq -2 input_2.fq | samtools sort -O bam -@ 10 -o - > output.bam
$bowtie2 -x bowtie_build_index/mm10 -U ATAC1014_gDNA.fastq.gz -p 20 -S mm10.sam
2021-04-22 bam文件中提取比對(duì)(mapped)或未比對(duì)上(unmapped)reads - 簡書 (jianshu.com)