bowtie2比對軟件的安裝及參數(shù)詳解

測序數(shù)據(jù)分析軟件皇筛，Bowtie是一個超快的，存儲高效的短序列片段比對程序。它能夠以每小時處理2500萬35bp reads的速度仔雷，將短的DNA序列片段（reads）比對到人類基因組上。

一舔示、安裝

conda安裝

conda install -y bowtie2

傳統(tǒng)安裝

1碟婆、下載源碼包

nohup wget https://nchc.dl.sourceforge.net/project/bowtie-bio/bowtie2/2.3.5.1/bowtie2-2.3.5.1-linux-x86_64.zip

2、解壓

unzip bowtie2-2.3.5.1-linux-x86_64.zip

3惕稻、添加環(huán)境變量

vim ~/.bashrc
export PATH="/data/hushy/tools/bowtie2:$PATH"
source ~/.bashrc  # source命令通常用于重新執(zhí)行剛修改的初始化文件

4竖共、測試

bowtie2 --help

二、創(chuàng)建索引

1俺祠、下載參考基因組

less -S /data/database/kraken2/NT/library/nt/library.fna

2公给、創(chuàng)建索引

nohup bowtie2-build /data/database/kraken2/NT/library/nt/library.fna index &  #內存很大，可能會把服務器節(jié)點搞掛

三锻煌、下載官方索引

nohup wget ftp://ftp.ccb.jhu.edu/pub/data/bowtie2_indexes/mm10.zip &
unzip mm10.zip
rm mm10.zip make_mm10.sh

四妓布、基本用法

語法

Usage: 
  bowtie2 [options]* -x <index> {-1 <m1> -2 <m2> | -U <r> | --interleaved <i> | -b <bam>} [-S <sam>]

參數(shù)選項
- 必選參數(shù)

-x  由bowtie2-build所生成的索引文件的前綴,需要指定路徑及其共用文件名
-1  使用trimmomatic質控后與read2配對（paired）的read1∷挝啵可以為多個文件匣沼，并用逗號分開；多個文件必須和 -2 <m2> 中制定的文件一一對應捂龄。
-2  使用trimmomatic質控后與read1配對的read2
-U  使用trimmomatic質控后未配對（unpaired）的reads释涛。可以為多個文件倦沧，并用逗號分開唇撬，測序文件中的reads的長度可以不一樣。
-S  所生成的SAM格式的文件前綴展融。默認是輸入到標準輸出窖认。

可選參數(shù)
- 輸入?yún)?shù)

-q                輸入的文件為FASTQ格式文件，此項為默認值
-f                輸入的文件為FASTA格式文件
-5/--trim5 <int>  剪掉5'端<int>長度的堿基，再用于比對扑浸。(default: 0)
-3/--trim3 <int>  剪掉3'端<int>長度的堿基烧给，再用于比對。(default: 0).
--phred33         輸入的堿基質量等于ASCII+33

Paired-end 參數(shù)

--no-mixed       默認設置下, 一對reads不能成對比對到參考序列上, 則單獨對每個read進行比對. 該選項則阻止此行為.
--no-discordant  默認設置下, 一對reads不能和諧比對(concordant alignment,即滿足-I, -X, --fr/--rf/--ff的條件)到參考序列上, 則搜尋其不和諧比對(disconcordant alignment, 即兩條reads都能獨一無二地比對到參考序列上, 但是不滿足-I,-X,--fr/--rf/--ff的條件). 該選項阻止此行為.

–end-to-end模式下的預設參數(shù)

--end-to-end 比對是將整個read和參考序列進行比對. 該模式--ma的值為0. 該模式為默認模式, --local模式?jīng)_突.
--local 該模式下對read進行局部比對, 從而, read兩端的一些堿基不比對喝噪，從而使比對得分滿足要求. 該模式下 –ma默認為2.
--very-fast Same as: -D 5 -R 1 -N 0 -L 22 -i S,0,2.50 
--fast Same as: -D 10 -R 2 -N 0 -L 22 -i S,0,2.50 
--sensitive Same as: -D 15 -R 2 -N 0 -L 22 -i S,1,1.15 (default in --end-to-end mode) 
--very-sensitive Same as: -D 20 -R 3 -N 0 -L 20 -i S,1,0.50

報告參數(shù)

-k   默認設置下, bowtie2搜索出了一個read不同的比對結果, 并報告其中最好的比對結果(如果好幾個最好的比對結果得分一致, 則隨機挑選出其中一個). 而在該模式下, bowtie2最多搜索出一個read <int>個比對結果, 并將這些結果按得分降序報告出來.
-a   和-k參數(shù)一樣, 不過不限制搜索的結果數(shù)目. 并將所有的比對結果都按降序報告出來. 此參數(shù)和-k參數(shù)沖突. 值得注意的是: 如果基因組含有很多重復序列時, 該參數(shù)會導致程序運行極其緩慢.

Sam 參數(shù)

--no-unal 不記錄沒比對上的reads.
--no-hd 不記錄SAM header lines (以@開頭).
--no-sq 不記錄@SQ的SAM header lines.
--rg-id <text> 設定read group Id到<text>.
--rg <text> 增加<text>作為一行@RG.

輸出參數(shù)

-t/--time  --un <path>        將unpaired reads寫入到<path>.
--no-unal                     不能map到GENOME的reads,不保留sam記錄
--un-conc <path>              不能map到GENOME的reads础嫡，fasta格式.
--un-conc-gz <path>           不能map到GENOME的reads，fasta格式, gzip壓縮.
--al-conc <path>              能map到GENOME的reads酝惧，fasta格式.
--al-conc-gz <path>           能map到GENOME的reads榴鼎，fasta格式, gzip壓縮.
-p/--threads NTHREADS         設置線程數(shù). Default: 1  如果你的計算機有多個CPU或者CPU內核，那么請使用-p參數(shù)晚唇。-p參數(shù)會讓bowtie進入多線程模式巫财。每一個線程都會使用單獨的CPU或者CPU內核。這種并行的運算模式也會大大加快運算速度哩陕。

示例

bowtie2 -p 10 -x /data/ref/bowtie2/mm10/mm10 -1 input_1.fq -2 input_2.fq | samtools sort -O bam -@ 10 -o - > output.bam
##雙端測序數(shù)據(jù)去宿主：
bowtie2 --end-to-end --no-mixed --no-discordant --no-unal --sensitive --threads 8 \
        -x /data/hostClean/Index/host.fa \
        -1 /data/hospital_microbiome/trimmed_reads/ERR320975-trimmed-pair1.fastq.gz \
        -2 /data/hospital_microbiome/trimmed_reads/ERR320975-trimmed-pair2.fastq.gz \
        --un-conc-gz /data/hospital_microbiome/cleanData/ERR320975.clean.fastq.gz \

最后編輯于：2020.07.17 14:04:14

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者

人面猴
序言：七十年代末翁涤，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子萌踱，更是在濱河造成了極大的恐慌，老刑警劉巖号阿，帶你破解...
沈念sama閱讀 218,122評論 6贊 505
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件并鸵，死亡現(xiàn)場離奇詭異，居然都是意外死亡扔涧，警方通過查閱死者的電腦和手機园担，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,070評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來枯夜，“玉大人弯汰，你說我怎么就攤上這事『ⅲ” “怎么了咏闪？”我有些...
開封第一講書人閱讀 164,491評論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長摔吏。經(jīng)常有香客問我鸽嫂，道長，這世上最難降的妖魔是什么征讲？我笑而不...
開封第一講書人閱讀 58,636評論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任据某，我火速辦了婚禮，結果婚禮上诗箍，老公的妹妹穿的比我還像新娘癣籽。我一直安慰自己，他們只是感情好，可當我...
茶點故事閱讀 67,676評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布筷狼。她就那樣靜靜地躺著瓶籽，像睡著了一般。火紅的嫁衣襯著肌膚如雪桑逝。梳的紋絲不亂的頭發(fā)上棘劣，一...
開封第一講書人閱讀 51,541評論 1贊 305
城市分裂傳說
那天，我揣著相機與錄音楞遏，去河邊找鬼茬暇。笑死，一個胖子當著我的面吹牛寡喝，可吹牛的內容都是我干的糙俗。我是一名探鬼主播，決...
沈念sama閱讀 40,292評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼预鬓，長吁一口氣：“原來是場噩夢啊……” “哼巧骚！你這毒婦竟也來了？” 一聲冷哼從身側響起格二，我...
開封第一講書人閱讀 39,211評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤劈彪，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后顶猜，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體沧奴，經(jīng)...
沈念sama閱讀 45,655評論 1贊 314
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 37,846評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年长窄，在試婚紗的時候發(fā)現(xiàn)自己被綠了滔吠。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 39,965評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡挠日，死狀恐怖疮绷，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情嚣潜，我是刑警寧澤冬骚，帶...
沈念sama閱讀 35,684評論 5贊 347
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站郑原，受9級特大地震影響唉韭，放射性物質發(fā)生泄漏。R本人自食惡果不足惜犯犁，卻給世界環(huán)境...
茶點故事閱讀 41,295評論 3贊 329
男人毒藥：我在死后第九天來索命
文/蒙蒙一属愤、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧酸役，春花似錦住诸、人聲如沸驾胆。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,894評論 0贊 22
一樁弒父案贱呐，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽丧诺。三九已至，卻和暖如春奄薇，著一層夾襖步出監(jiān)牢的瞬間驳阎，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 33,012評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工馁蒂，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留呵晚，地道東北人弄诲。一個月前我還...
沈念sama閱讀 48,126評論 3贊 370
代替公主和親
正文我出身青樓隧出，卻偏偏與公主長得像，于是被迫代替她去往敵國和親歌粥。傳聞我的和親對象是個殘疾皇子沮脖，可洞房花燭夜當晚...
茶點故事閱讀 44,914評論 2贊 355

bowtie2比對軟件的安裝及參數(shù)詳解

推薦閱讀更多精彩內容