sam文件格式說(shuō)明

bowtie2是當(dāng)前最流行的短序列比對(duì)軟,SAM(SequenceAlignment/Map)格式是一種通用的比對(duì)格式讼育,用來(lái)存儲(chǔ)reads到參考序列的比對(duì)信息SAM是一種序列比對(duì)格式標(biāo)準(zhǔn)帐姻, 由sanger制定,是以TAB為分割符的文本格式奶段。

主要應(yīng)用于測(cè)序序列mapping到基因組上的結(jié)果表示饥瓷,當(dāng)然也可以表示任意的多

重比對(duì)結(jié)果

SAM分為兩部分:注釋信息和對(duì)比結(jié)果

注釋信息以@開(kāi)頭

@HD:說(shuō)明符合標(biāo)準(zhǔn)的版本。對(duì)比序列的排列順序

@SQ:參考序列說(shuō)明

@RG:比對(duì)上的序列(read)說(shuō)明

@PG:使用的程序說(shuō)明

@CO:任意的說(shuō)明信息

比對(duì)結(jié)果部分

每一行代表一個(gè)片段的比對(duì)信息痹籍,包括11個(gè)必須的字段和一個(gè)可選字段呢铆,字段之間用tag分割

11個(gè)必須字段:

1:比對(duì)片段(read)的編號(hào)

2.位標(biāo)識(shí)(flag)每一種數(shù)字代表一種情況,這里的值是符合情況的數(shù)字和

3.參考序列的編號(hào)蹲缠,沒(méi)有比對(duì)上的序列棺克,這里為 *

4.比對(duì)上的位置 從1開(kāi)始計(jì)數(shù),沒(méi)有比對(duì)上此處為0

5.MAPQ:mapping的質(zhì)量

6.CIGAR:簡(jiǎn)要比對(duì)信息表達(dá)式 以參考序列為基礎(chǔ)线定,使用數(shù)字加字幕表示比對(duì)結(jié)果

比如3S6M1P1I4M娜谊,前三個(gè)堿基被剪切去除了,然后6個(gè)比對(duì)上了斤讥,

然后打開(kāi)了一個(gè)缺口纱皆,有一個(gè)堿基插入,最后是4個(gè)比對(duì)上了周偎,是按照順序的

“M”表示 match或 mismatch抹剩;

“I”表示 insert;

“D”表示 deletion蓉坎;

“N”表示 skipped(跳過(guò)這段區(qū)域)澳眷;

“S”表示 soft clipping(被剪切的序列存在于序列中);

“H”表示 hard clipping(被剪切的序列不存在于序列中)蛉艾;

“P”表示 padding钳踊;打開(kāi)缺口

“=”表示 match衷敌;

“X”表示 mismatch(錯(cuò)配,位置是一一對(duì)應(yīng)的)

7.下一個(gè)片段比對(duì)上的參考序列的標(biāo)號(hào)拓瞪,沒(méi)有另外的片段這里為 * 缴罗,同一個(gè)片段 =

8.下一個(gè)片段比對(duì)上的位置,如果不可用祭埂,此處為0

9.Template的長(zhǎng)度面氓,最左邊得為正,最右邊的為負(fù)蛆橡,中間的不用定義正負(fù)舌界,

不分區(qū)段(single-segment)的比對(duì)上,或者不可用時(shí)泰演,此處為0呻拌;

10.比對(duì)上的序列片段的序列信息,如果不存儲(chǔ)此類信息睦焕,此處為’*‘藐握,

長(zhǎng)度=簡(jiǎn)要比對(duì)信息表達(dá)式算出來(lái)的結(jié)果

11.序列的質(zhì)量信息,格式同F(xiàn)ASTQ一樣

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末垃喊,一起剝皮案震驚了整個(gè)濱河市猾普,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌本谜,老刑警劉巖抬闷,帶你破解...
    沈念sama閱讀 217,406評(píng)論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異耕突,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)评架,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,732評(píng)論 3 393
  • 文/潘曉璐 我一進(jìn)店門眷茁,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人纵诞,你說(shuō)我怎么就攤上這事上祈。” “怎么了浙芙?”我有些...
    開(kāi)封第一講書(shū)人閱讀 163,711評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵登刺,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我嗡呼,道長(zhǎng)纸俭,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,380評(píng)論 1 293
  • 正文 為了忘掉前任南窗,我火速辦了婚禮揍很,結(jié)果婚禮上郎楼,老公的妹妹穿的比我還像新娘。我一直安慰自己窒悔,他們只是感情好呜袁,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,432評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著简珠,像睡著了一般阶界。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上聋庵,一...
    開(kāi)封第一講書(shū)人閱讀 51,301評(píng)論 1 301
  • 那天膘融,我揣著相機(jī)與錄音,去河邊找鬼珍策。 笑死托启,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的攘宙。 我是一名探鬼主播屯耸,決...
    沈念sama閱讀 40,145評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼蹭劈!你這毒婦竟也來(lái)了疗绣?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 39,008評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤铺韧,失蹤者是張志新(化名)和其女友劉穎多矮,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體哈打,經(jīng)...
    沈念sama閱讀 45,443評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡塔逃,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,649評(píng)論 3 334
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了料仗。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片湾盗。...
    茶點(diǎn)故事閱讀 39,795評(píng)論 1 347
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖立轧,靈堂內(nèi)的尸體忽然破棺而出格粪,到底是詐尸還是另有隱情,我是刑警寧澤氛改,帶...
    沈念sama閱讀 35,501評(píng)論 5 345
  • 正文 年R本政府宣布帐萎,位于F島的核電站,受9級(jí)特大地震影響胜卤,放射性物質(zhì)發(fā)生泄漏疆导。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,119評(píng)論 3 328
  • 文/蒙蒙 一葛躏、第九天 我趴在偏房一處隱蔽的房頂上張望是鬼。 院中可真熱鬧肤舞,春花似錦、人聲如沸均蜜。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,731評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)囤耳。三九已至篙顺,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間充择,已是汗流浹背德玫。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,865評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留椎麦,地道東北人宰僧。 一個(gè)月前我還...
    沈念sama閱讀 47,899評(píng)論 2 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像观挎,于是被迫代替她去往敵國(guó)和親琴儿。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,724評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容