Samtools和Bcftools

Samtools和Bcftools簡(jiǎn)介

SAMtools是一個(gè)用于操作sam和bam文件的工具合集囚聚,包含有許多命令思劳。
BCFtools主要是用來(lái)操作vcf和BCF文件的工具合集崔梗,包含有許多命令。
這些命令的使用方法如下:

1. view

view命令的主要功能是查看bam和sam文件的內(nèi)容。
bam文件是sam文件的二進(jìn)制格式躏筏,占用空間小,運(yùn)算速度快呈枉。
view命令的用法和常用參數(shù):

Usage: samtools view [options] <in.bam>|<in.sam> [region [...]]
默認(rèn)情況下不加region趁尼,則是輸出所有的region.

Options:
-b  默認(rèn)輸出sam格式文件埃碱,該參數(shù)設(shè)置輸出bam格式
-h  默認(rèn)輸出的sam格式文件不帶header,該參數(shù)設(shè)定輸出sam文件時(shí)帶header信息
-H  只輸出header部分
-S  默認(rèn)情況下輸入時(shí)bam文件酥泞,若輸入是sam文件砚殿,則最好加該參數(shù),否則有時(shí)候會(huì)報(bào)錯(cuò)
-u  該參數(shù)的使用需要-b參數(shù)芝囤。默認(rèn)情況下會(huì)對(duì)輸出的bam文件進(jìn)行壓縮似炎,設(shè)置此參數(shù)后不對(duì)文件進(jìn)行壓縮,能節(jié)約時(shí)間但是需要更多的磁盤(pán)空間
-c  不輸出比對(duì)結(jié)果悯姊,僅僅打印匹配上的結(jié)果的總數(shù)羡藐。常常和'-f','-F','-q'聯(lián)合使用
-t  File 使用一個(gè)list文件來(lái)作為header的輸入,該文件中包含序列的id和長(zhǎng)度
-T  File 使用序列fasta文件作為header的輸入
-o  File 將結(jié)果輸入到文件中悯许,默認(rèn)輸出到標(biāo)準(zhǔn)輸出
-f  INT 比對(duì)結(jié)果中必須要包含的flag仆嗦,相當(dāng)于一個(gè)過(guò)濾條件
-F  INT 比對(duì)結(jié)果中不能包含的flag,數(shù)字4代表該序列沒(méi)有比對(duì)到參考序列上先壕,數(shù)字8代表該序列的mate序列沒(méi)有比對(duì)到參考序列上
-q  INT 允許的最小比對(duì)質(zhì)量
-瘩扼? 給出更多的幫助信息,包括flag的解釋

一些栗子:

#將sam文件轉(zhuǎn)換成bam文件
$ samtools view -bS a.sam > a.bam

#提取比對(duì)到參考序列上的比對(duì)結(jié)果
$ samtools view -bF 4 a.bam > a.F4.bam

#提取paired reads中兩條reads都比對(duì)到參考序列的比對(duì)結(jié)果垃僚,只需要把兩個(gè)4+8的值12作為過(guò)濾參數(shù)即可
$ samtools view -b -F 12 a.bam > a.F12.bam

#提取沒(méi)有比對(duì)到參考序列上的比對(duì)結(jié)果
$ samtools view -b -f 4 a.bam > a.f4.bam

#提取bam文件比對(duì)到scaffold1上的比對(duì)結(jié)果集绰,并保存成sam文件格式
#提取目的區(qū)域的比對(duì)結(jié)果前需先對(duì)bam文件進(jìn)行排序
$ samtools view a.bam scaffold1 > scaffold1.sam

#提取scaffold1上比對(duì)到30k到40k區(qū)域的比對(duì)結(jié)果
$ samtools view a.bam scaffold1:30000-40000 > scaffold_30k_40K.sam

#根據(jù)fasta文件,將header加入到sam或者bam文件中
$ samtools view -T genome.fasta -h scaffold1.bam > scaffold1.h.sam

2. sort

sort用來(lái)對(duì)bam文件進(jìn)行排序

Usage: samtools sort [-n] [-m <maxMem>] <in.bam> <out.prefix>

Options:
-m  設(shè)置運(yùn)行內(nèi)存大小冈在,默認(rèn)是500,000,000(即500M倒慧,支持K/M/G縮寫(xiě))。對(duì)于處理大數(shù)據(jù)時(shí)包券,如果內(nèi)存夠用纫谅,可設(shè)置大些,以節(jié)約時(shí)間溅固。
-n  設(shè)定排序方式付秕,按short reads的ID排序。默認(rèn)下是按序列在fasta文件中的順序(即header和序列從左往右的位點(diǎn))
-l  INT 設(shè)置壓縮水平侍郭,0(未壓縮)--9(最佳壓縮)

-@  INT 設(shè)置使用的線程數(shù)

例子

$ samtools sort a.bam a.sort

3. merge

將2個(gè)或2個(gè)以上的已經(jīng)sort的bam文件合并成一個(gè)bam文件询吴,合并后的文件不需要再次sort,是已經(jīng)sort過(guò)了的亮元。

Usage: samtools merge [-nr] [-h inh.sam] <out.bam> <in1.bam> <in2.bam> [...]
默認(rèn)下猛计,合并得到的bam文件的header信息是in1.bam中的header”蹋可以使用-h參數(shù)指定某一個(gè)sam或bam文件的header為out.bam的header奉瘤。

Options:
  -n         Input files are sorted by read name
  -t TAG     Input files are sorted by TAG value
  -r         Attach RG tag (inferred from file names)
  -u         Uncompressed BAM output
  -f         Overwrite the output BAM if exist
  -1         Compress level 1
  -l INT     Compression level, from 0 to 9 [-1]
  -R STR     Merge file in the specified region STR [all]
  -h FILE    Copy the header in FILE to <out.bam> [in1.bam]
  -c         Combine @RG headers with colliding IDs [alter IDs to be distinct]
  -p         Combine @PG headers with colliding IDs [alter IDs to be distinct]
  -s VALUE   Override random seed
  -b FILE    List of input BAM filenames, one per line [null]
      --input-fmt-option OPT[=VAL]
               Specify a single input file format option in the form
               of OPTION or OPTION=VALUE
  -O, --output-fmt FORMAT[,OPT[=VAL]]...
               Specify output format (SAM, BAM, CRAM)
      --output-fmt-option OPT[=VAL]
               Specify a single output file format option in the form
               of OPTION or OPTION=VALUE
      --reference FILE
               Reference sequence FASTA FILE [null]
  -@, --threads INT
               Number of additional threads to use [0]

4. index

對(duì)bam文件建立索引,生成后綴為.bai的文件,用于快速檢索reads盗温。
需要對(duì)bam文件先進(jìn)行排序藕赞,否則會(huì)報(bào)錯(cuò)。
很多時(shí)候都需要索引文件的存在卖局,特別是顯示序列比對(duì)的情況下斧蜕。比如samtools tview,gbrowse2等。

Usage:samtools index <in.bam> [out.index]

#栗子:
$ samtools index a.bam

5. faidx

對(duì)fasta序列建立索引砚偶,生成后綴為.fai的文件批销。該命令也能依據(jù)索引文件快速提取fasta文件中的某一條序列。

Usage: samtools faidx <in.bam> [...]

#對(duì)基因組文件建立索引
$ samtools faidx genome.fa 
生成索引文件為genome.fa.fai染坯,是一個(gè)文本文件风钻,分成了5列。第一列是子序列的名稱酒请;第二列是子序列的長(zhǎng)度骡技。 
 第三列代表第一個(gè)堿基的偏移量, 從0開(kāi)始計(jì)數(shù)羞反,換行符也統(tǒng)計(jì)進(jìn)行布朦。第四列表示除了最后一行外, 其他代表序
列的行的堿基數(shù)昼窗, 單位為bp是趴。第五列表示行寬, 除了最后一行外澄惊, 其他代表序列的行的長(zhǎng)度唆途, 包括換行符, 
在windows系統(tǒng)中換行符為\r\n, 要在序列長(zhǎng)度的基礎(chǔ)上加2掸驱。

#有了索引文件后肛搬,可以使用以下命令很快從基因組中提取到fasta格式的子序列
$ samtools faidx genome.fa chr1 > chr1.fa

6. tview

tview能直觀的顯示出reads比對(duì)到基因組的情況,和基因組瀏覽器有點(diǎn)類似毕贼。

Usage: samtools tview <aln.bam> [ref.fasta]
當(dāng)給出參考基因組的時(shí)候温赔,會(huì)在第一排顯示參考基因組的序列,否則第一排全用N表示鬼癣。
按下g陶贼,則提示輸入要到達(dá)基因組的某一位點(diǎn)。例如"chr1:100"表示到達(dá)chr1的第100個(gè)堿基處待秃。
使用H(左)J(上)K(右)L(下)移動(dòng)顯示界面拜秧,大寫(xiě)字母移動(dòng)快,小寫(xiě)字母移動(dòng)慢章郁。
使用空格鍵向右快速移動(dòng)(同L)枉氮,使用Backspace快速向左移動(dòng)(同H)
Ctrl+H向左移動(dòng)1kb堿基距離,Ctrl+L向右移動(dòng)1kb堿基距離
輸入'm','b','n',則使用顏色標(biāo)注比對(duì)質(zhì)量,堿基質(zhì)量嘲恍,核苷酸等。30-40的堿基質(zhì)量或比對(duì)質(zhì)量用白色表示雄驹;20-30黃色佃牛;0-10藍(lán)色。
輸入'.',則開(kāi)啟或關(guān)閉點(diǎn)號(hào)視圖医舆,此時(shí)點(diǎn)號(hào)表示比對(duì)到正義鏈上俘侠,逗號(hào)表示匹配到負(fù)義鏈上
輸入'r',開(kāi)啟或關(guān)閉read name的顯示
其他的一些命令可使用'?'查看

7. flagstat

給出bam文件的比對(duì)結(jié)果的summary蔬将。

Usage: samtools flagstat <in.bam>

$ samtools flagstat a.bam
187018343 + 0 in total (QC-passed reads + QC-failed reads)  #總reads數(shù)
280885 + 0 secondary  #不知道
0 + 0 supplementary  #不知道
0 + 0 duplicates  #重復(fù)reads的數(shù)量
186439767 + 0 mapped (99.69% : N/A)  #比對(duì)到參考基因組上的reads數(shù)量
186737458 + 0 paired in sequencing  #paired reads數(shù)據(jù)數(shù)量
93368729 + 0 read1  #read1的數(shù)量
93368729 + 0 read2  #read2 的數(shù)量
180901328 + 0 properly paired (96.87% : N/A)  #正確地匹配到參考序列的reads數(shù)量
185855190 + 0 with itself and mate mapped  #一對(duì)reads都比對(duì)到了參考序列上的數(shù)量爷速,但是并不一定比對(duì)到同一條染色體上
303692 + 0 singletons (0.16% : N/A)  #  一對(duì)reads中只有一條與參考序列相匹配的數(shù)量
2828852 + 0 with mate mapped to a different chr  # 一對(duì)reads比對(duì)到不同染色體的數(shù)量
1367179 + 0 with mate mapped to a different chr (mapQ>=5)  #一對(duì)reads比對(duì)到不同染色體的且比對(duì)質(zhì)量值大于5的數(shù)量

8. depth

得到每個(gè)位點(diǎn)的測(cè)序深度,并輸出到標(biāo)準(zhǔn)輸出

Usage: samtools depth [options] in1.bam [in2.bam [...]]
Options:
   -a                  output all positions (including zero depth)
                       #輸出所有位點(diǎn)霞怀,包括零深度的位點(diǎn)
   -a -a (or -aa)      output absolutely all positions, including unused ref. sequences
                       #完全輸出所有位點(diǎn)惫东,包括未使用到的參考序列
   -b <bed>            list of positions or regions
                       #計(jì)算BED文件中指定位置或區(qū)域的深度
   -f <list>           list of input BAM filenames, one per line [null]
                       #使用在FILE中的指定bam文件
   -l <int>            read length threshold (ignore reads shorter than <int>) [0]
                       #忽略掉長(zhǎng)度小于此INT值的reads
   -d/-m <int>         maximum coverage depth [8000]
                       #最大深度值
   -q <int>            base quality threshold [0]
                       #只計(jì)算堿基質(zhì)量值大于此值的reads
   -Q <int>            mapping quality threshold [0]
                       #只計(jì)算比對(duì)質(zhì)量值大于此值的reads
   -r <chr:from-to>    region
                       #只計(jì)算指定區(qū)域的reads
      --input-fmt-option OPT[=VAL]
               Specify a single input file format option in the form
               of OPTION or OPTION=VALUE
      --reference FILE
               Reference sequence FASTA FILE [null]

The output is a simple tab-separated table with three columns: reference name,
position, and coverage depth.  Note that positions with zero coverage may be
omitted by default; see the -a option.

#栗子
$ samtools depth a.bam | less

9. rmdup

去除PCR重復(fù)和光學(xué)重復(fù),重復(fù)的reads僅保留一對(duì)毙石。

Usage:  samtools rmdup [-sS] <input.srt.bam> <output.bam>

Options:
  -s  對(duì)SE reads去除重復(fù)廉沮。默認(rèn)情況下只對(duì)PE reads去除重復(fù)
  -S  將PE reads作為SE reads來(lái)去除重復(fù)

#栗子
$ samtools a.bam b.bam

10. 一些其他有用的命令

reheader替換bam文件的頭文件

Usage: samtools reheader [-P] in.header.sam in.bam > out.bam
   or  samtools reheader [-P] -i in.header.sam file.bam

Options:
    -P, --no-PG      Do not generate an @PG header line.
    -i, --in-place   Modify the bam/cram file directly.
                     (Defaults to outputting to stdout.)

#栗子
$ samtools reheader -i in.header.sam out.bam 
$ samtools reheader in.header.sam in.bam > out.bam

cat鏈接多個(gè)bam文件,適用于非sorted的bam文件

Usage: samtools cat [options] <in1.bam>  [... <inN.bam>]
       samtools cat [options] <in1.cram> [... <inN.cram>]

Concatenate BAM or CRAM files, first those in <bamlist.fofn>, then those
on the command line.

Options: -b FILE  list of input BAM/CRAM file names, one per line
         -h FILE  copy the header from FILE [default is 1st input file]
         -o FILE  output BAM/CRAM

idxstats 統(tǒng)計(jì)一個(gè)表格滞时,4列滤灯,分別為"序列名,序列長(zhǎng)度鳞骤,比對(duì)上的reads數(shù)窒百,未比對(duì)上的reads數(shù)",最后一排則顯示沒(méi)有比對(duì)到任何一條序列的reads number贝咙。

chr1 195471971 6112404 0
chr10 130694993 3933316 0
chr11 122082543 6550325 0
chr12 120129022 3876527 0
chr13 120421639 5511799 0
chr14 124902244 3949332 0
chr15 104043685 3872649 0
chr16 98207768 6038669 0
chr17 94987271 13544866 0
chr18 90702639 4739331 0
chr19 61431566 2706779 0
chr2 182113224 8517357 0
chr3 160039680 5647950 0
chr4 156508116 4880584 0
chr5 151834684 6134814 0
chr6 149736546 7955095 0
chr7 145441459 5463859 0
chr8 129401213 5216734 0
chr9 124595110 7122219 0
chrM 16299 1091260 0
chrX 171031299 3248378 0
chrY 91744698 259078 0
* 0 0 0

11. mpileup

使用samtools的子命令mpileup分析參考序列上的每個(gè)堿基位點(diǎn)的比對(duì)結(jié)果拂募,并生成VCF/BCF格式文件庭猩,BCF是VCF的二進(jìn)制文件。再使用Bcftools對(duì)VCF/BCF格式文件進(jìn)行SNP/Indel calling陈症。其中,Bcftools是附屬于samtools的程序趴腋。
mpileup的常用參數(shù):

Usage: samtools mpileup [options] in1.bam [in2.bam [...]]

Input options:
  -6, --illumina1.3+      quality is in the Illumina-1.3+ encoding
                          #堿基質(zhì)量格式為Illumina 1.3+打分方式
  -A, --count-orphans     do not discard anomalous read pairs
                          #在檢測(cè)變異中,不忽略異常的reads對(duì)
  -b, --bam-list FILE     list of input BAM filenames, one per line
                          #以list形式輸入BAM文件颁井。每一行代表一個(gè)bam文件路徑
  -B, --no-BAQ            disable BAQ (per-Base Alignment Quality)
                          
  -C, --adjust-MQ INT     adjust mapping quality; recommended:50, disable:0 [0]
                          #用于降低比對(duì)質(zhì)量的系數(shù)蠢护,如果reads中含有過(guò)多的錯(cuò)配,不能設(shè)置為零葵硕。BWA推薦值為50
  -d, --max-depth INT     max per-file depth; avoids excessive memory usage [250]
                         #對(duì)參考基因組上的每個(gè)位點(diǎn)進(jìn)行SNP/Indel分析的時(shí)候懈凹,samtools對(duì)每個(gè)輸入文件僅讀取的
                          reads數(shù)目有上限,該上限默認(rèn)值是8000/n介评,其中n表示輸入的BAM文件個(gè)數(shù)。當(dāng)該參數(shù)設(shè)置
                          的值>8000/n,則此上限有-d參數(shù)決定贤惯,否則-d參數(shù)無(wú)效棒掠。例如:當(dāng)對(duì)1000個(gè)樣品進(jìn)行重測(cè)序
                          后進(jìn)行SNP/Indel分析烟很,上限若為8000/n,則過(guò)形砀ぁ(可能低于測(cè)序覆蓋度了)恤筛,此時(shí)-d參數(shù)
                          生效;而當(dāng)需要分析的樣品數(shù)較少的時(shí)候芹橡,對(duì)每個(gè)位點(diǎn)讀取的reads數(shù)目上限則為8000/n,
                          能充分利用測(cè)序深度非常高位點(diǎn)的數(shù)據(jù)
  -E, --redo-BAQ          recalculate BAQ on the fly, ignore existing BQs

  -f, --fasta-ref FILE    faidx indexed reference sequence file
                          #輸入?yún)⒖蓟蚪M序列fasta文件煎殷,fasta文件必須有以fai為后綴的索引文件
  -G, --exclude-RG FILE   exclude read groups listed in FILE

  -l, --positions FILE    skip unlisted positions (chr pos) or regions (BED)
                          #輸入bed文件腿箩,僅在指定區(qū)間內(nèi)進(jìn)行分析
  -q, --min-MQ INT        skip alignments with mapQ smaller than INT [0]
                          #用于分析的比對(duì)質(zhì)量最小值
  -Q, --min-BQ INT        skip bases with baseQ/BAQ smaller than INT [13]
                          #用于分析的堿基質(zhì)量最小值
  -r, --region REG        region in which pileup is generated
                          #僅僅在此區(qū)間進(jìn)行分析珠移。默認(rèn)對(duì)所有區(qū)間進(jìn)行分析
  -R, --ignore-RG         ignore RG tags (one BAM = one sample)
                          #忽略BAM文件中的@RG信息末融,認(rèn)為一個(gè)BAM文件就是一個(gè)樣品的數(shù)據(jù)
  --rf, --incl-flags STR|INT  required flags: skip reads with mask bits unset []
  --ff, --excl-flags STR|INT  filter flags: skip reads with mask bits set
                                            [UNMAP,SECONDARY,QCFAIL,DUP]
  -x, --ignore-overlaps   disable read-pair overlap detection

Output options:
  -o, --output FILE       write output to FILE [standard output]
                          #將結(jié)果輸出到指定文件勾习,默認(rèn)輸出到標(biāo)準(zhǔn)輸出
  -g, --BCF               generate genotype likelihoods in BCF format
                          #進(jìn)行基因分型懈玻,將結(jié)果輸出到BCF格式
  -v, --VCF               generate genotype likelihoods in VCF format
                          #進(jìn)行基因分型,將結(jié)果輸出到VCF格式。默認(rèn)輸出bgzip壓縮格式的VCF文件骂倘,若加入-u參數(shù)后則不進(jìn)行bgzip壓縮

Output options for mpileup format (without -g/-v):   #不使用-g/-v參數(shù)時(shí)有效
  -O, --output-BP         output base positions on reads
                          #輸出每個(gè)reads的堿基位點(diǎn)
  -s, --output-MQ         output mapping quality
                          #輸出比對(duì)質(zhì)量
      --output-QNAME      output read names
  -a                      output all positions (including zero depth)
                          #輸出所有位點(diǎn)巴席,包括覆蓋深度為0的位點(diǎn)
  -a -a (or -aa)          output absolutely all positions, including unused ref. sequences
                          #輸出所有位點(diǎn)漾唉,包括參考基因組中為比對(duì)上的位點(diǎn)
Output options for genotype likelihoods (when -g/-v is used):   #當(dāng)使用-g/-v參數(shù)時(shí)
  -t, --output-tags LIST  optional tags to output:
               DP,AD,ADF,ADR,SP,INFO/AD,INFO/ADF,INFO/ADR []
                          #設(shè)置FORMAT和INFO的列表內(nèi)容,以逗號(hào)分割分衫。
  -u, --uncompressed      generate uncompressed VCF/BCF output
                          #不對(duì)BCF進(jìn)行壓縮般此,通常用于管道中輸入到下一個(gè)命令進(jìn)行分析

SNP/INDEL genotype likelihoods options (effective with -g/-v):      #SNP/Indel 基因分型參數(shù)
  -e, --ext-prob INT      Phred-scaled gap extension seq error probability [20]
  -F, --gap-frac FLOAT    minimum fraction of gapped reads [0.002]
                           #含有間隔reads的最小片段
  -h, --tandem-qual INT   coefficient for homopolymer errors [100]
  -I, --skip-indels       do not perform indel calling
                          #不檢測(cè)indel變異
  -L, --max-idepth INT    maximum per-file depth for INDEL calling [250]
  -m, --min-ireads INT    minimum number gapped reads for indel candidates [1]
                          #候選INDEL的最小間隔的reads
  -o, --open-prob INT     Phred-scaled gap open seq error probability [40]
  -p, --per-sample-mF     apply -m and -F per-sample for increased sensitivity
  -P, --platforms STR     comma separated list of platforms for indels [all]
      --input-fmt-option OPT[=VAL]
               Specify a single input file format option in the form
               of OPTION or OPTION=VALUE
      --reference FILE
               Reference sequence FASTA FILE [null]

Notes: Assuming diploid individuals.

mpileup生成的結(jié)果包含6列:參考序列名铐懊;位置;參考基因組堿基壁畸;比對(duì)上的reads數(shù)茅茂;比對(duì)情況空闲;比對(duì)上的堿基的質(zhì)量。
其中第5列比較復(fù)雜进副,解釋如下:

1. '.'代表read比對(duì)到參考基因組正鏈上
2. ','代表比對(duì)到參考基因組負(fù)鏈上
3. 'ATGCN'表示正鏈上的不匹配
4. 'atgcn'表示在負(fù)鏈上的不匹配
5. '*'代表模糊堿基
6. '^'代表匹配的堿基是一個(gè)read的開(kāi)始;'^'后面緊跟的ascii碼減去33代表比對(duì)質(zhì)量给赞;這兩個(gè)符號(hào)修飾的是后面的堿基片迅,氣候緊跟的堿基代表read的第一個(gè)堿基
7. '$'代表一個(gè)read的結(jié)束,該符號(hào)修飾的是其前面的堿基
8.正則式'+[0-9]+[ACGTNacgtn]+'代表在該位點(diǎn)后插入的堿基
9. 正則式'-[0-9]+[ACGTNacgtn]+'代表在該位點(diǎn)后缺失的堿基

使用Bcftools進(jìn)行variation calling

Bcftools常用來(lái)進(jìn)行變異檢測(cè)芥挣,用法及參數(shù)如下:

Usage:   bcftools [--version|--version-only] [--help] <command> <argument>

Commands:

 -- Indexing
    index        index VCF/BCF files

 -- VCF/BCF manipulation
    annotate     annotate and edit VCF/BCF files
    concat       concatenate VCF/BCF files from the same set of samples
    convert      convert VCF/BCF files to different formats and back
    isec         intersections of VCF/BCF files
    merge        merge VCF/BCF files files from non-overlapping sample sets
    norm         left-align and normalize indels
    plugin       user-defined plugins
    query        transform VCF/BCF into user-defined formats
    reheader     modify VCF/BCF header, change sample names
    sort         sort VCF/BCF file
    view         VCF/BCF conversion, view, subset and filter VCF/BCF files

 -- VCF/BCF analysis
    call         SNP/indel calling
    consensus    create consensus sequence by applying VCF variants
    cnv          HMM CNV calling
    csq          call variation consequences
    filter       filter VCF/BCF files using fixed thresholds
    gtcheck      check sample concordance, detect sample swaps and contamination
    mpileup      multi-way pileup producing genotype likelihoods
    roh          identify runs of autozygosity (HMM)
    stats        produce VCF/BCF stats

 Most commands accept VCF, bgzipped VCF, and BCF with the file type detected
 automatically even when streaming from a pipe. Indexed VCF and BCF will work
 in all situations. Un-indexed VCF and BCF and streams will work in most but
 not all situations.

#其中call常用命令參數(shù)如下:
Usage:   bcftools call [options] <in.vcf.gz>

Options:
  -V, --skip-variants <type>      skip indels/snps
                                  #不進(jìn)行snp/indel檢測(cè)
  -v, --variants-only             output variant sites only
                                  #僅僅輸出變異位點(diǎn)信息
  -c, --consensus-caller          the original calling method (conflicts with -m)
                                  #SNP/INDEL分析的原始算法空免,適用于對(duì)一個(gè)樣本分析蹋砚,與-m參數(shù)只能二選一
  -m, --multiallelic-caller       alternative model for multiallelic and rare-variant calling (conflicts with -c)
                                  #適用于多種allele和稀有allele分析的算法摄杂,適用于多個(gè)樣本的分析,與-c參數(shù)只能二選一
  -o, --output <file>             write output to a file [standard output]
                                  #設(shè)置輸出文件
  -O, --output-type <b|u|z|v>     output type: 'b' compressed BCF; 'u' uncompressed BCF; 'z' compressed VCF; 'v' uncompressed VCF [v]
                                  #設(shè)置輸出文件的格式墨坚,該參數(shù)的值有:b(壓縮BCF格式)映挂,u(不壓縮BCF格式)袖肥,z(壓縮VCF格式),v(不壓縮VCF格式)
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末油狂,一起剝皮案震驚了整個(gè)濱河市寸癌,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌磷蛹,老刑警劉巖溪烤,帶你破解...
    沈念sama閱讀 206,839評(píng)論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異责嚷,居然都是意外死亡掂铐,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門(mén)爆班,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)辱姨,“玉大人炮叶,你說(shuō)我怎么就攤上這事渡处。” “怎么了侣肄?”我有些...
    開(kāi)封第一講書(shū)人閱讀 153,116評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵醇份,是天一觀的道長(zhǎng)僚纷。 經(jīng)常有香客問(wèn)我,道長(zhǎng)锥债,這世上最難降的妖魔是什么痊臭? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 55,371評(píng)論 1 279
  • 正文 為了忘掉前任广匙,我火速辦了婚禮,結(jié)果婚禮上鸦致,老公的妹妹穿的比我還像新娘。我一直安慰自己鲁纠,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,384評(píng)論 5 374
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著捍壤,像睡著了一般。 火紅的嫁衣襯著肌膚如雪专酗。 梳的紋絲不亂的頭發(fā)上盗扇,一...
    開(kāi)封第一講書(shū)人閱讀 49,111評(píng)論 1 285
  • 那天疗隶,我揣著相機(jī)與錄音,去河邊找鬼蒋纬。 笑死坚弱,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的碾阁。 我是一名探鬼主播些楣,決...
    沈念sama閱讀 38,416評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼戈毒,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了冠桃?” 一聲冷哼從身側(cè)響起道宅,我...
    開(kāi)封第一講書(shū)人閱讀 37,053評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎樱报,沒(méi)想到半個(gè)月后迹蛤,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,558評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡嚷量,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,007評(píng)論 2 325
  • 正文 我和宋清朗相戀三年蝶溶,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了宣渗。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,117評(píng)論 1 334
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡田轧,死狀恐怖咐蝇,靈堂內(nèi)的尸體忽然破棺而出巷查,到底是詐尸還是另有隱情,我是刑警寧澤旭寿,帶...
    沈念sama閱讀 33,756評(píng)論 4 324
  • 正文 年R本政府宣布崇败,位于F島的核電站,受9級(jí)特大地震影響缩膝,放射性物質(zhì)發(fā)生泄漏岸霹。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,324評(píng)論 3 307
  • 文/蒙蒙 一予弧、第九天 我趴在偏房一處隱蔽的房頂上張望湖饱。 院中可真熱鬧,春花似錦蚓庭、人聲如沸仅仆。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,315評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)撮弧。三九已至,卻和暖如春授舟,著一層夾襖步出監(jiān)牢的瞬間贸辈,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,539評(píng)論 1 262
  • 我被黑心中介騙來(lái)泰國(guó)打工奢啥, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留桩盲,地道東北人席吴。 一個(gè)月前我還...
    沈念sama閱讀 45,578評(píng)論 2 355
  • 正文 我出身青樓孝冒,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親庄涡。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,877評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容