Samtools和Bcftools簡(jiǎn)介
SAMtools是一個(gè)用于操作sam和bam文件的工具合集囚聚,包含有許多命令思劳。
BCFtools主要是用來(lái)操作vcf和BCF文件的工具合集崔梗,包含有許多命令。
這些命令的使用方法如下:
1. view
view命令的主要功能是查看bam和sam文件的內(nèi)容。
bam文件是sam文件的二進(jìn)制格式躏筏,占用空間小,運(yùn)算速度快呈枉。
view命令的用法和常用參數(shù):
Usage: samtools view [options] <in.bam>|<in.sam> [region [...]]
默認(rèn)情況下不加region趁尼,則是輸出所有的region.
Options:
-b 默認(rèn)輸出sam格式文件埃碱,該參數(shù)設(shè)置輸出bam格式
-h 默認(rèn)輸出的sam格式文件不帶header,該參數(shù)設(shè)定輸出sam文件時(shí)帶header信息
-H 只輸出header部分
-S 默認(rèn)情況下輸入時(shí)bam文件酥泞,若輸入是sam文件砚殿,則最好加該參數(shù),否則有時(shí)候會(huì)報(bào)錯(cuò)
-u 該參數(shù)的使用需要-b參數(shù)芝囤。默認(rèn)情況下會(huì)對(duì)輸出的bam文件進(jìn)行壓縮似炎,設(shè)置此參數(shù)后不對(duì)文件進(jìn)行壓縮,能節(jié)約時(shí)間但是需要更多的磁盤(pán)空間
-c 不輸出比對(duì)結(jié)果悯姊,僅僅打印匹配上的結(jié)果的總數(shù)羡藐。常常和'-f','-F','-q'聯(lián)合使用
-t File 使用一個(gè)list文件來(lái)作為header的輸入,該文件中包含序列的id和長(zhǎng)度
-T File 使用序列fasta文件作為header的輸入
-o File 將結(jié)果輸入到文件中悯许,默認(rèn)輸出到標(biāo)準(zhǔn)輸出
-f INT 比對(duì)結(jié)果中必須要包含的flag仆嗦,相當(dāng)于一個(gè)過(guò)濾條件
-F INT 比對(duì)結(jié)果中不能包含的flag,數(shù)字4代表該序列沒(méi)有比對(duì)到參考序列上先壕,數(shù)字8代表該序列的mate序列沒(méi)有比對(duì)到參考序列上
-q INT 允許的最小比對(duì)質(zhì)量
-瘩扼? 給出更多的幫助信息,包括flag的解釋
一些栗子:
#將sam文件轉(zhuǎn)換成bam文件
$ samtools view -bS a.sam > a.bam
#提取比對(duì)到參考序列上的比對(duì)結(jié)果
$ samtools view -bF 4 a.bam > a.F4.bam
#提取paired reads中兩條reads都比對(duì)到參考序列的比對(duì)結(jié)果垃僚,只需要把兩個(gè)4+8的值12作為過(guò)濾參數(shù)即可
$ samtools view -b -F 12 a.bam > a.F12.bam
#提取沒(méi)有比對(duì)到參考序列上的比對(duì)結(jié)果
$ samtools view -b -f 4 a.bam > a.f4.bam
#提取bam文件比對(duì)到scaffold1上的比對(duì)結(jié)果集绰,并保存成sam文件格式
#提取目的區(qū)域的比對(duì)結(jié)果前需先對(duì)bam文件進(jìn)行排序
$ samtools view a.bam scaffold1 > scaffold1.sam
#提取scaffold1上比對(duì)到30k到40k區(qū)域的比對(duì)結(jié)果
$ samtools view a.bam scaffold1:30000-40000 > scaffold_30k_40K.sam
#根據(jù)fasta文件,將header加入到sam或者bam文件中
$ samtools view -T genome.fasta -h scaffold1.bam > scaffold1.h.sam
2. sort
sort用來(lái)對(duì)bam文件進(jìn)行排序
Usage: samtools sort [-n] [-m <maxMem>] <in.bam> <out.prefix>
Options:
-m 設(shè)置運(yùn)行內(nèi)存大小冈在,默認(rèn)是500,000,000(即500M倒慧,支持K/M/G縮寫(xiě))。對(duì)于處理大數(shù)據(jù)時(shí)包券,如果內(nèi)存夠用纫谅,可設(shè)置大些,以節(jié)約時(shí)間溅固。
-n 設(shè)定排序方式付秕,按short reads的ID排序。默認(rèn)下是按序列在fasta文件中的順序(即header和序列從左往右的位點(diǎn))
-l INT 設(shè)置壓縮水平侍郭,0(未壓縮)--9(最佳壓縮)
-@ INT 設(shè)置使用的線程數(shù)
例子
$ samtools sort a.bam a.sort
3. merge
將2個(gè)或2個(gè)以上的已經(jīng)sort的bam文件合并成一個(gè)bam文件询吴,合并后的文件不需要再次sort,是已經(jīng)sort過(guò)了的亮元。
Usage: samtools merge [-nr] [-h inh.sam] <out.bam> <in1.bam> <in2.bam> [...]
默認(rèn)下猛计,合并得到的bam文件的header信息是in1.bam中的header”蹋可以使用-h參數(shù)指定某一個(gè)sam或bam文件的header為out.bam的header奉瘤。
Options:
-n Input files are sorted by read name
-t TAG Input files are sorted by TAG value
-r Attach RG tag (inferred from file names)
-u Uncompressed BAM output
-f Overwrite the output BAM if exist
-1 Compress level 1
-l INT Compression level, from 0 to 9 [-1]
-R STR Merge file in the specified region STR [all]
-h FILE Copy the header in FILE to <out.bam> [in1.bam]
-c Combine @RG headers with colliding IDs [alter IDs to be distinct]
-p Combine @PG headers with colliding IDs [alter IDs to be distinct]
-s VALUE Override random seed
-b FILE List of input BAM filenames, one per line [null]
--input-fmt-option OPT[=VAL]
Specify a single input file format option in the form
of OPTION or OPTION=VALUE
-O, --output-fmt FORMAT[,OPT[=VAL]]...
Specify output format (SAM, BAM, CRAM)
--output-fmt-option OPT[=VAL]
Specify a single output file format option in the form
of OPTION or OPTION=VALUE
--reference FILE
Reference sequence FASTA FILE [null]
-@, --threads INT
Number of additional threads to use [0]
4. index
對(duì)bam文件建立索引,生成后綴為.bai的文件,用于快速檢索reads盗温。
需要對(duì)bam文件先進(jìn)行排序藕赞,否則會(huì)報(bào)錯(cuò)。
很多時(shí)候都需要索引文件的存在卖局,特別是顯示序列比對(duì)的情況下斧蜕。比如samtools tview
,gbrowse2等。
Usage:samtools index <in.bam> [out.index]
#栗子:
$ samtools index a.bam
5. faidx
對(duì)fasta序列建立索引砚偶,生成后綴為.fai的文件批销。該命令也能依據(jù)索引文件快速提取fasta文件中的某一條序列。
Usage: samtools faidx <in.bam> [...]
#對(duì)基因組文件建立索引
$ samtools faidx genome.fa
生成索引文件為genome.fa.fai染坯,是一個(gè)文本文件风钻,分成了5列。第一列是子序列的名稱酒请;第二列是子序列的長(zhǎng)度骡技。
第三列代表第一個(gè)堿基的偏移量, 從0開(kāi)始計(jì)數(shù)羞反,換行符也統(tǒng)計(jì)進(jìn)行布朦。第四列表示除了最后一行外, 其他代表序
列的行的堿基數(shù)昼窗, 單位為bp是趴。第五列表示行寬, 除了最后一行外澄惊, 其他代表序列的行的長(zhǎng)度唆途, 包括換行符,
在windows系統(tǒng)中換行符為\r\n, 要在序列長(zhǎng)度的基礎(chǔ)上加2掸驱。
#有了索引文件后肛搬,可以使用以下命令很快從基因組中提取到fasta格式的子序列
$ samtools faidx genome.fa chr1 > chr1.fa
6. tview
tview能直觀的顯示出reads比對(duì)到基因組的情況,和基因組瀏覽器有點(diǎn)類似毕贼。
Usage: samtools tview <aln.bam> [ref.fasta]
當(dāng)給出參考基因組的時(shí)候温赔,會(huì)在第一排顯示參考基因組的序列,否則第一排全用N表示鬼癣。
按下g陶贼,則提示輸入要到達(dá)基因組的某一位點(diǎn)。例如"chr1:100"表示到達(dá)chr1的第100個(gè)堿基處待秃。
使用H(左)J(上)K(右)L(下)移動(dòng)顯示界面拜秧,大寫(xiě)字母移動(dòng)快,小寫(xiě)字母移動(dòng)慢章郁。
使用空格鍵向右快速移動(dòng)(同L)枉氮,使用Backspace快速向左移動(dòng)(同H)
Ctrl+H向左移動(dòng)1kb堿基距離,Ctrl+L向右移動(dòng)1kb堿基距離
輸入'm','b','n',則使用顏色標(biāo)注比對(duì)質(zhì)量,堿基質(zhì)量嘲恍,核苷酸等。30-40的堿基質(zhì)量或比對(duì)質(zhì)量用白色表示雄驹;20-30黃色佃牛;0-10藍(lán)色。
輸入'.',則開(kāi)啟或關(guān)閉點(diǎn)號(hào)視圖医舆,此時(shí)點(diǎn)號(hào)表示比對(duì)到正義鏈上俘侠,逗號(hào)表示匹配到負(fù)義鏈上
輸入'r',開(kāi)啟或關(guān)閉read name的顯示
其他的一些命令可使用'?'查看
7. flagstat
給出bam文件的比對(duì)結(jié)果的summary蔬将。
Usage: samtools flagstat <in.bam>
$ samtools flagstat a.bam
187018343 + 0 in total (QC-passed reads + QC-failed reads) #總reads數(shù)
280885 + 0 secondary #不知道
0 + 0 supplementary #不知道
0 + 0 duplicates #重復(fù)reads的數(shù)量
186439767 + 0 mapped (99.69% : N/A) #比對(duì)到參考基因組上的reads數(shù)量
186737458 + 0 paired in sequencing #paired reads數(shù)據(jù)數(shù)量
93368729 + 0 read1 #read1的數(shù)量
93368729 + 0 read2 #read2 的數(shù)量
180901328 + 0 properly paired (96.87% : N/A) #正確地匹配到參考序列的reads數(shù)量
185855190 + 0 with itself and mate mapped #一對(duì)reads都比對(duì)到了參考序列上的數(shù)量爷速,但是并不一定比對(duì)到同一條染色體上
303692 + 0 singletons (0.16% : N/A) # 一對(duì)reads中只有一條與參考序列相匹配的數(shù)量
2828852 + 0 with mate mapped to a different chr # 一對(duì)reads比對(duì)到不同染色體的數(shù)量
1367179 + 0 with mate mapped to a different chr (mapQ>=5) #一對(duì)reads比對(duì)到不同染色體的且比對(duì)質(zhì)量值大于5的數(shù)量
8. depth
得到每個(gè)位點(diǎn)的測(cè)序深度,并輸出到標(biāo)準(zhǔn)輸出
Usage: samtools depth [options] in1.bam [in2.bam [...]]
Options:
-a output all positions (including zero depth)
#輸出所有位點(diǎn)霞怀,包括零深度的位點(diǎn)
-a -a (or -aa) output absolutely all positions, including unused ref. sequences
#完全輸出所有位點(diǎn)惫东,包括未使用到的參考序列
-b <bed> list of positions or regions
#計(jì)算BED文件中指定位置或區(qū)域的深度
-f <list> list of input BAM filenames, one per line [null]
#使用在FILE中的指定bam文件
-l <int> read length threshold (ignore reads shorter than <int>) [0]
#忽略掉長(zhǎng)度小于此INT值的reads
-d/-m <int> maximum coverage depth [8000]
#最大深度值
-q <int> base quality threshold [0]
#只計(jì)算堿基質(zhì)量值大于此值的reads
-Q <int> mapping quality threshold [0]
#只計(jì)算比對(duì)質(zhì)量值大于此值的reads
-r <chr:from-to> region
#只計(jì)算指定區(qū)域的reads
--input-fmt-option OPT[=VAL]
Specify a single input file format option in the form
of OPTION or OPTION=VALUE
--reference FILE
Reference sequence FASTA FILE [null]
The output is a simple tab-separated table with three columns: reference name,
position, and coverage depth. Note that positions with zero coverage may be
omitted by default; see the -a option.
#栗子
$ samtools depth a.bam | less
9. rmdup
去除PCR重復(fù)和光學(xué)重復(fù),重復(fù)的reads僅保留一對(duì)毙石。
Usage: samtools rmdup [-sS] <input.srt.bam> <output.bam>
Options:
-s 對(duì)SE reads去除重復(fù)廉沮。默認(rèn)情況下只對(duì)PE reads去除重復(fù)
-S 將PE reads作為SE reads來(lái)去除重復(fù)
#栗子
$ samtools a.bam b.bam
10. 一些其他有用的命令
reheader替換bam文件的頭文件
Usage: samtools reheader [-P] in.header.sam in.bam > out.bam
or samtools reheader [-P] -i in.header.sam file.bam
Options:
-P, --no-PG Do not generate an @PG header line.
-i, --in-place Modify the bam/cram file directly.
(Defaults to outputting to stdout.)
#栗子
$ samtools reheader -i in.header.sam out.bam
$ samtools reheader in.header.sam in.bam > out.bam
cat鏈接多個(gè)bam文件,適用于非sorted的bam文件
Usage: samtools cat [options] <in1.bam> [... <inN.bam>]
samtools cat [options] <in1.cram> [... <inN.cram>]
Concatenate BAM or CRAM files, first those in <bamlist.fofn>, then those
on the command line.
Options: -b FILE list of input BAM/CRAM file names, one per line
-h FILE copy the header from FILE [default is 1st input file]
-o FILE output BAM/CRAM
idxstats 統(tǒng)計(jì)一個(gè)表格滞时,4列滤灯,分別為"序列名,序列長(zhǎng)度鳞骤,比對(duì)上的reads數(shù)窒百,未比對(duì)上的reads數(shù)",最后一排則顯示沒(méi)有比對(duì)到任何一條序列的reads number贝咙。
chr1 195471971 6112404 0
chr10 130694993 3933316 0
chr11 122082543 6550325 0
chr12 120129022 3876527 0
chr13 120421639 5511799 0
chr14 124902244 3949332 0
chr15 104043685 3872649 0
chr16 98207768 6038669 0
chr17 94987271 13544866 0
chr18 90702639 4739331 0
chr19 61431566 2706779 0
chr2 182113224 8517357 0
chr3 160039680 5647950 0
chr4 156508116 4880584 0
chr5 151834684 6134814 0
chr6 149736546 7955095 0
chr7 145441459 5463859 0
chr8 129401213 5216734 0
chr9 124595110 7122219 0
chrM 16299 1091260 0
chrX 171031299 3248378 0
chrY 91744698 259078 0
* 0 0 0
11. mpileup
使用samtools的子命令mpileup分析參考序列上的每個(gè)堿基位點(diǎn)的比對(duì)結(jié)果拂募,并生成VCF/BCF格式文件庭猩,BCF是VCF的二進(jìn)制文件。再使用Bcftools對(duì)VCF/BCF格式文件進(jìn)行SNP/Indel calling陈症。其中,Bcftools是附屬于samtools的程序趴腋。
mpileup的常用參數(shù):
Usage: samtools mpileup [options] in1.bam [in2.bam [...]]
Input options:
-6, --illumina1.3+ quality is in the Illumina-1.3+ encoding
#堿基質(zhì)量格式為Illumina 1.3+打分方式
-A, --count-orphans do not discard anomalous read pairs
#在檢測(cè)變異中,不忽略異常的reads對(duì)
-b, --bam-list FILE list of input BAM filenames, one per line
#以list形式輸入BAM文件颁井。每一行代表一個(gè)bam文件路徑
-B, --no-BAQ disable BAQ (per-Base Alignment Quality)
-C, --adjust-MQ INT adjust mapping quality; recommended:50, disable:0 [0]
#用于降低比對(duì)質(zhì)量的系數(shù)蠢护,如果reads中含有過(guò)多的錯(cuò)配,不能設(shè)置為零葵硕。BWA推薦值為50
-d, --max-depth INT max per-file depth; avoids excessive memory usage [250]
#對(duì)參考基因組上的每個(gè)位點(diǎn)進(jìn)行SNP/Indel分析的時(shí)候懈凹,samtools對(duì)每個(gè)輸入文件僅讀取的
reads數(shù)目有上限,該上限默認(rèn)值是8000/n介评,其中n表示輸入的BAM文件個(gè)數(shù)。當(dāng)該參數(shù)設(shè)置
的值>8000/n,則此上限有-d參數(shù)決定贤惯,否則-d參數(shù)無(wú)效棒掠。例如:當(dāng)對(duì)1000個(gè)樣品進(jìn)行重測(cè)序
后進(jìn)行SNP/Indel分析烟很,上限若為8000/n,則過(guò)形砀ぁ(可能低于測(cè)序覆蓋度了)恤筛,此時(shí)-d參數(shù)
生效;而當(dāng)需要分析的樣品數(shù)較少的時(shí)候芹橡,對(duì)每個(gè)位點(diǎn)讀取的reads數(shù)目上限則為8000/n,
能充分利用測(cè)序深度非常高位點(diǎn)的數(shù)據(jù)
-E, --redo-BAQ recalculate BAQ on the fly, ignore existing BQs
-f, --fasta-ref FILE faidx indexed reference sequence file
#輸入?yún)⒖蓟蚪M序列fasta文件煎殷,fasta文件必須有以fai為后綴的索引文件
-G, --exclude-RG FILE exclude read groups listed in FILE
-l, --positions FILE skip unlisted positions (chr pos) or regions (BED)
#輸入bed文件腿箩,僅在指定區(qū)間內(nèi)進(jìn)行分析
-q, --min-MQ INT skip alignments with mapQ smaller than INT [0]
#用于分析的比對(duì)質(zhì)量最小值
-Q, --min-BQ INT skip bases with baseQ/BAQ smaller than INT [13]
#用于分析的堿基質(zhì)量最小值
-r, --region REG region in which pileup is generated
#僅僅在此區(qū)間進(jìn)行分析珠移。默認(rèn)對(duì)所有區(qū)間進(jìn)行分析
-R, --ignore-RG ignore RG tags (one BAM = one sample)
#忽略BAM文件中的@RG信息末融,認(rèn)為一個(gè)BAM文件就是一個(gè)樣品的數(shù)據(jù)
--rf, --incl-flags STR|INT required flags: skip reads with mask bits unset []
--ff, --excl-flags STR|INT filter flags: skip reads with mask bits set
[UNMAP,SECONDARY,QCFAIL,DUP]
-x, --ignore-overlaps disable read-pair overlap detection
Output options:
-o, --output FILE write output to FILE [standard output]
#將結(jié)果輸出到指定文件勾习,默認(rèn)輸出到標(biāo)準(zhǔn)輸出
-g, --BCF generate genotype likelihoods in BCF format
#進(jìn)行基因分型懈玻,將結(jié)果輸出到BCF格式
-v, --VCF generate genotype likelihoods in VCF format
#進(jìn)行基因分型,將結(jié)果輸出到VCF格式。默認(rèn)輸出bgzip壓縮格式的VCF文件骂倘,若加入-u參數(shù)后則不進(jìn)行bgzip壓縮
Output options for mpileup format (without -g/-v): #不使用-g/-v參數(shù)時(shí)有效
-O, --output-BP output base positions on reads
#輸出每個(gè)reads的堿基位點(diǎn)
-s, --output-MQ output mapping quality
#輸出比對(duì)質(zhì)量
--output-QNAME output read names
-a output all positions (including zero depth)
#輸出所有位點(diǎn)巴席,包括覆蓋深度為0的位點(diǎn)
-a -a (or -aa) output absolutely all positions, including unused ref. sequences
#輸出所有位點(diǎn)漾唉,包括參考基因組中為比對(duì)上的位點(diǎn)
Output options for genotype likelihoods (when -g/-v is used): #當(dāng)使用-g/-v參數(shù)時(shí)
-t, --output-tags LIST optional tags to output:
DP,AD,ADF,ADR,SP,INFO/AD,INFO/ADF,INFO/ADR []
#設(shè)置FORMAT和INFO的列表內(nèi)容,以逗號(hào)分割分衫。
-u, --uncompressed generate uncompressed VCF/BCF output
#不對(duì)BCF進(jìn)行壓縮般此,通常用于管道中輸入到下一個(gè)命令進(jìn)行分析
SNP/INDEL genotype likelihoods options (effective with -g/-v): #SNP/Indel 基因分型參數(shù)
-e, --ext-prob INT Phred-scaled gap extension seq error probability [20]
-F, --gap-frac FLOAT minimum fraction of gapped reads [0.002]
#含有間隔reads的最小片段
-h, --tandem-qual INT coefficient for homopolymer errors [100]
-I, --skip-indels do not perform indel calling
#不檢測(cè)indel變異
-L, --max-idepth INT maximum per-file depth for INDEL calling [250]
-m, --min-ireads INT minimum number gapped reads for indel candidates [1]
#候選INDEL的最小間隔的reads
-o, --open-prob INT Phred-scaled gap open seq error probability [40]
-p, --per-sample-mF apply -m and -F per-sample for increased sensitivity
-P, --platforms STR comma separated list of platforms for indels [all]
--input-fmt-option OPT[=VAL]
Specify a single input file format option in the form
of OPTION or OPTION=VALUE
--reference FILE
Reference sequence FASTA FILE [null]
Notes: Assuming diploid individuals.
mpileup生成的結(jié)果包含6列:參考序列名铐懊;位置;參考基因組堿基壁畸;比對(duì)上的reads數(shù)茅茂;比對(duì)情況空闲;比對(duì)上的堿基的質(zhì)量。
其中第5列比較復(fù)雜进副,解釋如下:
1. '.'代表read比對(duì)到參考基因組正鏈上
2. ','代表比對(duì)到參考基因組負(fù)鏈上
3. 'ATGCN'表示正鏈上的不匹配
4. 'atgcn'表示在負(fù)鏈上的不匹配
5. '*'代表模糊堿基
6. '^'代表匹配的堿基是一個(gè)read的開(kāi)始;'^'后面緊跟的ascii碼減去33代表比對(duì)質(zhì)量给赞;這兩個(gè)符號(hào)修飾的是后面的堿基片迅,氣候緊跟的堿基代表read的第一個(gè)堿基
7. '$'代表一個(gè)read的結(jié)束,該符號(hào)修飾的是其前面的堿基
8.正則式'+[0-9]+[ACGTNacgtn]+'代表在該位點(diǎn)后插入的堿基
9. 正則式'-[0-9]+[ACGTNacgtn]+'代表在該位點(diǎn)后缺失的堿基
使用Bcftools進(jìn)行variation calling
Bcftools常用來(lái)進(jìn)行變異檢測(cè)芥挣,用法及參數(shù)如下:
Usage: bcftools [--version|--version-only] [--help] <command> <argument>
Commands:
-- Indexing
index index VCF/BCF files
-- VCF/BCF manipulation
annotate annotate and edit VCF/BCF files
concat concatenate VCF/BCF files from the same set of samples
convert convert VCF/BCF files to different formats and back
isec intersections of VCF/BCF files
merge merge VCF/BCF files files from non-overlapping sample sets
norm left-align and normalize indels
plugin user-defined plugins
query transform VCF/BCF into user-defined formats
reheader modify VCF/BCF header, change sample names
sort sort VCF/BCF file
view VCF/BCF conversion, view, subset and filter VCF/BCF files
-- VCF/BCF analysis
call SNP/indel calling
consensus create consensus sequence by applying VCF variants
cnv HMM CNV calling
csq call variation consequences
filter filter VCF/BCF files using fixed thresholds
gtcheck check sample concordance, detect sample swaps and contamination
mpileup multi-way pileup producing genotype likelihoods
roh identify runs of autozygosity (HMM)
stats produce VCF/BCF stats
Most commands accept VCF, bgzipped VCF, and BCF with the file type detected
automatically even when streaming from a pipe. Indexed VCF and BCF will work
in all situations. Un-indexed VCF and BCF and streams will work in most but
not all situations.
#其中call常用命令參數(shù)如下:
Usage: bcftools call [options] <in.vcf.gz>
Options:
-V, --skip-variants <type> skip indels/snps
#不進(jìn)行snp/indel檢測(cè)
-v, --variants-only output variant sites only
#僅僅輸出變異位點(diǎn)信息
-c, --consensus-caller the original calling method (conflicts with -m)
#SNP/INDEL分析的原始算法空免,適用于對(duì)一個(gè)樣本分析蹋砚,與-m參數(shù)只能二選一
-m, --multiallelic-caller alternative model for multiallelic and rare-variant calling (conflicts with -c)
#適用于多種allele和稀有allele分析的算法摄杂,適用于多個(gè)樣本的分析,與-c參數(shù)只能二選一
-o, --output <file> write output to a file [standard output]
#設(shè)置輸出文件
-O, --output-type <b|u|z|v> output type: 'b' compressed BCF; 'u' uncompressed BCF; 'z' compressed VCF; 'v' uncompressed VCF [v]
#設(shè)置輸出文件的格式墨坚,該參數(shù)的值有:b(壓縮BCF格式)映挂,u(不壓縮BCF格式)袖肥,z(壓縮VCF格式),v(不壓縮VCF格式)