Samtools工具的幾個(gè)強(qiáng)大功能_2019-05-11

Samtools常用命令的總結(jié)【samtools強(qiáng)大工具的幾個(gè)功能】

內(nèi)容來(lái)自一下網(wǎng)址玄柠,感謝原作者。不是盜版诫舅,記錄僅用于個(gè)人學(xué)習(xí)羽利,有筆記可尋!刊懈!內(nèi)容是原文作者寫(xiě)的这弧,非原創(chuàng)娃闲!非原創(chuàng)!匾浪!非原創(chuàng);拾铩!蛋辈!

原文來(lái)自:http://www.bioinfo-scrounger.com/archives/245


flags

1 0x1 這序列是PE雙端測(cè)序

2 0x2 這序列和參考序列完全匹配属拾,沒(méi)有錯(cuò)配和缺失

4 0x4 這序列沒(méi)有mapping到參考序列上

8 0x8 這序列的mate序列沒(méi)有mapping到參考序列上

16 0x10 這序列比對(duì)到參考序列的負(fù)鏈上

32 0x20 這序列的mate序列比對(duì)到參考序列的負(fù)鏈上

64 0x40 這序列是read1

128 0x80 這序列是read2

256 0x100 這序列不是主要的比對(duì),因?yàn)樾蛄锌赡鼙葘?duì)到參考序列的多個(gè)位置上

512 0x200 這序列沒(méi)有通過(guò)QC

1024 0x400 這序列是PCR重復(fù)序列

2048 0x800 這序列是補(bǔ)充比對(duì)

view

samtools view [options] in.sam|in.bam|in.cram [region...]

-f 提取 ## -f 4 提取出沒(méi)有mapping上的reads

-F 過(guò)濾 ## -F 4 過(guò)濾掉沒(méi)有mapping上的reads冷溶,也就是說(shuō)提取出mapping上的reads

-u 輸出格式為未壓縮的bam格式

-q 過(guò)濾掉MAPQ值低某個(gè)閾值 ## -q 1 過(guò)濾掉MAPQ值低于1的情況

-h 設(shè)定輸出的SAM文件帶有header

-b 輸出格式設(shè)定為BAM

-S 輸入格式為SAM

提取比對(duì)到參考序列的結(jié)果:

samtools view -bF 4 tmp.bam > tmp_F.bam

提取雙端序列都比對(duì)到參考序列(4+8)的結(jié)果:

samtools view -bF 12 tmp.bam > tmp_F.bam

提取比對(duì)到chr1的結(jié)果

samtools view -b tmp.bam chr1 > tmp_chr1.bam

注:With no options or regions specified, prints all alignments in the specified input alignment file (in SAM, BAM, or CRAM format) to standard output in SAM format (with no header)渐白,也就是說(shuō),沒(méi)有設(shè)定輸出格式的話逞频,默認(rèn)是輸出SAM格式纯衍,并且是沒(méi)有header的SAM

index

samtools index [-bc] [-m INT] aln.bam|aln.cram [out.index]

-b 創(chuàng)建一個(gè)bai索引,默認(rèn)設(shè)定這個(gè)參數(shù)(如果在命令中沒(méi)這個(gè)參數(shù))

建索引(必須是已經(jīng)使用默認(rèn)排序后的):

samtools index tmp.bam

sort

samtools sort [-l level] [-m maxMem] [-o out.bam] [-O format] [-n] [-t tag] [-T tmpprefix] [-@ threads] [in.sam|in.bam|in.cram]

-m 設(shè)置內(nèi)存使用大小苗胀,默認(rèn)是500,000,000(現(xiàn)在支持K,M,G等縮寫(xiě))

-n Sort by read names (i.e., the QNAME field) rather than by chromosomal coordinates(似乎一般也是使用默認(rèn)排序襟诸,即Sort alignments by leftmost coordinates,因?yàn)閕ndex需要默認(rèn)排序…)

-@ 設(shè)置線程數(shù)

-O 輸出的格式(sam,bam,cram)柒巫,默認(rèn)是bam

使用默認(rèn)排序:

sort -@ 5 tmp.bam >tmp.sorted.bam

merge

samtools merge [-nur1f] [-h inh.sam] [-R reg] [-b <list>] <out.bam> <in1.bam> [<in2.bam> <in3.bam> ... <inN.bam>]

-b 一個(gè)bam文件一行的一個(gè)bam list文件

-n The input alignments are sorted by read names rather than by chromosomal coordinates

-h Use the lines of FILE as `@’ headers to be copied to out.bam, replacing any header lines that would otherwise be copied from in1.bam. (FILE is actually in SAM format, though any alignment records it may contain are ignored.)

-c 當(dāng)多個(gè)輸入文件包含相同的@RG頭ID時(shí)励堡,只保留第一個(gè)到合并后輸出的文件。當(dāng)合并多個(gè)相同樣本的不同文件時(shí)堡掏,非常有用

-p 與-c參數(shù)類似,對(duì)于要合并的每一個(gè)文件中的@PG ID只保留第一個(gè)文件中的@PG

merge前必須是已經(jīng)sort的文件刨疼,如果只是單純的merge:

samtools merge tmp1.bam tmp2.bam

mpileup

samtools mpileup [-EBugp] [-C capQcoef] [-r reg] [-f in.fa] [-l list] [-Q minBaseQ] [-q minMapQ] in.bam [in2.bam [...]]

從官方說(shuō)明:Generate VCF, BCF or pileup for one or multiple BAM files可看出泉唁,可以用來(lái)和bcftools搭配Call SNPs

最常用的幾個(gè)參數(shù):

-f The faidx-indexed reference file in the FASTA format(有索引(faidx)文件的參考序列)

-l BED or position list file containing a list of regions or sites where pileup or BCF should be generated(bed格式的文件,如果需要只處理特定位點(diǎn)的bam文件的話)

-r Only generate pileup in region 搭配-l使用揩慕,比如可以指定染色體

-g Compute genotype likelihoods and output them in the binary call format (BCF).(輸出bcf格式文件)

-u Generate uncompressed VCF/BCF output(如果后面接管道符的話亭畜,必須使用這個(gè)指定不進(jìn)行壓縮)

搭配bcftools使用:

samtools mpileup -ugf <ref.fa> <sample1.bam>| bcftools call -vmO z -o <study.vcf.gz>

tview

samtools tview [-p chr:pos] [-s STR] [-d display] <in.sorted.bam> [ref.fasta]

顯示reads比對(duì)到基因組的情況,類似于基因組瀏覽器

faidx

samtools faidx <ref.fasta> [region1 [...]]

給參考序列建索引迎卤,或者從已建索引的參考序列中提取一定位置范圍內(nèi)的序列

depth

samtools depth [options] [in1.sam|in1.bam|in1.cram [in2.sam|in2.bam|in2.cram] [...]]

計(jì)算bam/sam文件每個(gè)位點(diǎn)的測(cè)序深度

flagstat

samtools flagstat in.sam|in.bam|in.cram

統(tǒng)計(jì)bam文件中reads的比對(duì)情況拴鸵,如多少reads比對(duì)上等信息

samtools官網(wǎng)手冊(cè)還介紹了其他好多的功能,具體可參見(jiàn):

http://www.htslib.org/doc/samtools.html

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末蜗搔,一起剝皮案震驚了整個(gè)濱河市劲藐,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌樟凄,老刑警劉巖聘芜,帶你破解...
    沈念sama閱讀 216,372評(píng)論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異缝龄,居然都是意外死亡汰现,警方通過(guò)查閱死者的電腦和手機(jī)挂谍,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)瞎饲,“玉大人口叙,你說(shuō)我怎么就攤上這事⌒嵴剑” “怎么了妄田?”我有些...
    開(kāi)封第一講書(shū)人閱讀 162,415評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)仗哨。 經(jīng)常有香客問(wèn)我形庭,道長(zhǎng),這世上最難降的妖魔是什么厌漂? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,157評(píng)論 1 292
  • 正文 為了忘掉前任萨醒,我火速辦了婚禮,結(jié)果婚禮上苇倡,老公的妹妹穿的比我還像新娘富纸。我一直安慰自己,他們只是感情好旨椒,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,171評(píng)論 6 388
  • 文/花漫 我一把揭開(kāi)白布晓褪。 她就那樣靜靜地躺著,像睡著了一般综慎。 火紅的嫁衣襯著肌膚如雪涣仿。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 51,125評(píng)論 1 297
  • 那天示惊,我揣著相機(jī)與錄音好港,去河邊找鬼。 笑死米罚,一個(gè)胖子當(dāng)著我的面吹牛钧汹,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播录择,決...
    沈念sama閱讀 40,028評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼拔莱,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了隘竭?” 一聲冷哼從身側(cè)響起塘秦,我...
    開(kāi)封第一講書(shū)人閱讀 38,887評(píng)論 0 274
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎货裹,沒(méi)想到半個(gè)月后嗤形,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,310評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡弧圆,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,533評(píng)論 2 332
  • 正文 我和宋清朗相戀三年赋兵,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了笔咽。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,690評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡霹期,死狀恐怖叶组,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情历造,我是刑警寧澤甩十,帶...
    沈念sama閱讀 35,411評(píng)論 5 343
  • 正文 年R本政府宣布,位于F島的核電站吭产,受9級(jí)特大地震影響侣监,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜臣淤,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,004評(píng)論 3 325
  • 文/蒙蒙 一橄霉、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧邑蒋,春花似錦姓蜂、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,659評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至卿堂,卻和暖如春束莫,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背草描。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,812評(píng)論 1 268
  • 我被黑心中介騙來(lái)泰國(guó)打工麦箍, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人陶珠。 一個(gè)月前我還...
    沈念sama閱讀 47,693評(píng)論 2 368
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像享钞,于是被迫代替她去往敵國(guó)和親揍诽。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,577評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容