mpileup命令參數(shù)和結(jié)果詳解

mpileup是samtools的一個命令,用來生存bcf文件污尉,然后再用bcftools進行SNP和Indel的分析。另外蛆封,bcftools是samtools的附帶軟件。

1用法

samtools mpileup [options] in1.bam [in2.bam [...]]
Input options:
  -6, --illumina1.3+      quality is in the Illumina-1.3+ encoding
  -A, --count-orphans     do not discard anomalous read pairs
  -b, --bam-list FILE     list of input BAM filenames, one per line
  -B, --no-BAQ            disable BAQ (per-Base Alignment Quality)
  -C, --adjust-MQ INT     adjust mapping quality; recommended:50, disable:0 [0]
  -d, --max-depth INT     max per-file depth; avoids excessive memory usage [8000]
  -E, --redo-BAQ          recalculate BAQ on the fly, ignore existing BQs
  -f, --fasta-ref FILE    faidx indexed reference sequence file
  -G, --exclude-RG FILE   exclude read groups listed in FILE
  -l, --positions FILE    skip unlisted positions (chr pos) or regions (BED)
  -q, --min-MQ INT        skip alignments with mapQ smaller than INT [0]
  -Q, --min-BQ INT        skip bases with baseQ/BAQ smaller than INT [13]
  -r, --region REG        region in which pileup is generated
  -R, --ignore-RG         ignore RG tags (one BAM = one sample)
  --rf, --incl-flags STR|INT  required flags: skip reads with mask bits unset []
  --ff, --excl-flags STR|INT  filter flags: skip reads with mask bits set
                                            [UNMAP,SECONDARY,QCFAIL,DUP]
  -x, --ignore-overlaps   disable read-pair overlap detection

Output options:
  -o, --output FILE       write output to FILE [standard output]
  -O, --output-BP         output base positions on reads
  -s, --output-MQ         output mapping quality
      --output-QNAME      output read names
  -a                      output all positions (including zero depth)
  -a -a (or -aa)          output absolutely all positions, including unused ref. sequences

最常用的是

最常用的參數(shù)有兩個:
-f用samtools faidx對參考序列建index.fai文件歇盼,其他軟件也可以
-g輸出到bcf格道宅,否則生成文本格式文件萧豆。用法和最簡單的例子如下
u輸出不壓縮的bcf文件

$ samtools mpileup -f genome.fasta abc.bam > abc.txt
$ samtools mpileup -gSDf genome.fasta abc.bam > abc.bcf
$ samtools mpileup -guSDf genome.fasta abc.bam |bcftools view -cvNg - > abc.vcf

2結(jié)果解釋

2.1結(jié)果共6列

[mpileup] 1 samples in 1 input files
chr1    10105   N       8       AAAAcAAA        kuuu>6uK
chr1    10106   N       10      CCCCcCCCC^$c    uuuukAuuAK
chr1    10107   N       10      CCCCcCCCCc      upukaFfuKF
chr1    10108   N       9       CCCCcCCCC       ukup7K\uK
chr1    10109   N       10      AA$AAaAAAA$a    kpuuBKppFA
chr1    10110   N       7       AA$A$aAAA       kupkFkp
chr1    10111   N       6       CcCCCc  QuApuK
chr1    10112   N       6       CcCCCc  \uKppK
chr1    10113   N       6       C$cCCCc \uKkpK
chr1    10114   N       5       tTTTt   k7fpF

分別是

  • 參考序列名(染色體)
  • 位置
  • 參考序列的堿基
  • 比對上的read數(shù)目
  • 比對的情況
  • 比對上的堿基的質(zhì)量

2.2其中第五列相對復雜臼朗,具體解釋如下:

chr1    10056   N       7       AAAA*AA kfuufKK
chr1    2003928 N       5       CCC+6GGGCCGC+6GGGCCGC   uupu<
chr1    10106   N       10      CCCCcCCCC^$c    uuuukAuuAK
chr1    737247  N       3       Cc^5c   KKK
chr1    1197931 N       3       T-6NNNNNNT-6NNNNNNt-6nnnnnn     uuK
  • 1 *表示模糊堿基
  • 2 大寫表示在正鏈不匹配
  • 3 小寫表示在負鏈不匹配
  • 4^表示匹配的堿基是一個reads的開始邻寿,^后緊跟的ascii碼減去33代表比對質(zhì)量,修飾的是后面的堿基依溯,后面緊跟的堿基代表該read的第一個堿基
  • 5 $代表一個read的結(jié)束,該符號修飾前面的堿基
  • 6 正則表達式式+[0-9]+[ACGTNacgtn]+代表在該位點后插入的堿基瘟则。舉例中chr1的2003928A后面有個+6GGGCCG黎炉,很可能是indel
  • 7 正則表達式’-[0-9]+[ACGTNacgtn]+’代表在該位點后缺失的堿基;
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末醋拧,一起剝皮案震驚了整個濱河市慷嗜,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌丹壕,老刑警劉巖庆械,帶你破解...
    沈念sama閱讀 206,839評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異菌赖,居然都是意外死亡缭乘,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評論 2 382
  • 文/潘曉璐 我一進店門琉用,熙熙樓的掌柜王于貴愁眉苦臉地迎上來堕绩,“玉大人策幼,你說我怎么就攤上這事∨簦” “怎么了特姐?”我有些...
    開封第一講書人閱讀 153,116評論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長黍氮。 經(jīng)常有香客問我唐含,道長,這世上最難降的妖魔是什么沫浆? 我笑而不...
    開封第一講書人閱讀 55,371評論 1 279
  • 正文 為了忘掉前任捷枯,我火速辦了婚禮,結(jié)果婚禮上件缸,老公的妹妹穿的比我還像新娘铜靶。我一直安慰自己,他們只是感情好他炊,可當我...
    茶點故事閱讀 64,384評論 5 374
  • 文/花漫 我一把揭開白布争剿。 她就那樣靜靜地躺著,像睡著了一般痊末。 火紅的嫁衣襯著肌膚如雪蚕苇。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,111評論 1 285
  • 那天凿叠,我揣著相機與錄音涩笤,去河邊找鬼。 笑死盒件,一個胖子當著我的面吹牛蹬碧,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播炒刁,決...
    沈念sama閱讀 38,416評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼恩沽,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了翔始?” 一聲冷哼從身側(cè)響起罗心,我...
    開封第一講書人閱讀 37,053評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎城瞎,沒想到半個月后渤闷,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,558評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡脖镀,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,007評論 2 325
  • 正文 我和宋清朗相戀三年飒箭,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,117評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡补憾,死狀恐怖漫萄,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情盈匾,我是刑警寧澤腾务,帶...
    沈念sama閱讀 33,756評論 4 324
  • 正文 年R本政府宣布,位于F島的核電站削饵,受9級特大地震影響岩瘦,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜窿撬,卻給世界環(huán)境...
    茶點故事閱讀 39,324評論 3 307
  • 文/蒙蒙 一启昧、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧劈伴,春花似錦密末、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至追城,卻和暖如春刹碾,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背座柱。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評論 1 262
  • 我被黑心中介騙來泰國打工迷帜, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人色洞。 一個月前我還...
    沈念sama閱讀 45,578評論 2 355
  • 正文 我出身青樓戏锹,卻偏偏與公主長得像,于是被迫代替她去往敵國和親火诸。 傳聞我的和親對象是個殘疾皇子锦针,可洞房花燭夜當晚...
    茶點故事閱讀 42,877評論 2 345

推薦閱讀更多精彩內(nèi)容