narrow,broad, gapped peak:三種格式之間的區(qū)別與聯(lián)系

歡迎關(guān)注”生信修煉手冊”!

在進(jìn)行peak calling分析時,經(jīng)常會接觸到以下3種peak格式

  1. narrow peaks format

  2. broad peaks fotmat

  3. gapped peaks format


peak被定義為基因組上一段reads富集的區(qū)域,核心信息是在染色體上的起始和終止位置,除此之外缘眶,還有軟件對于該peak區(qū)域的打分,比如常見的pvalue, qvalue, fold_enrichment等值髓废。

和基因組比對信息用BAM格式來存儲類似巷懈,為了標(biāo)準(zhǔn)化不同peak calling軟件的輸出,特意制定了以上3種數(shù)據(jù)格式慌洪。這三種格式本質(zhì)上都是bed文件顶燕,只不過列數(shù)不太類似。

1. Narrow Peaks Format

該格式又稱之為point-source peaks format, macs2默認(rèn)輸出就是這種格式冈爹,是一種BED6+4的格式涌攻,列數(shù)為10列,示意如下

前四列分別代表chrom, chromStart, chromEnd, name, 用于描述peak區(qū)間和名稱频伤,注意bed格式中起始位置從0開始計(jì)數(shù)恳谎。

第五列代表score,在macs2的輸出結(jié)果中為int(-10*log10qvalue),第六列代表strand, 在macs2的輸出結(jié)果中為.,第七列代表signalvalue, 通常使用fold_enrichment的值,第八列代表pvalue, 在macs2的輸出結(jié)果中為-log10(pvalue),第九列代表qvalue, 在macs2的輸出結(jié)果中為-log10(qvalue),第十列代表peak, 在macs2的輸出結(jié)果中為peak的中心憋肖,即summit距離peak起始位置的距離因痛。

2. Broad Peaks Format

這種格式就是在narrow peaks format的基礎(chǔ)上丟掉了最后一列的信息,為BED6+3的格式岸更, 列數(shù)為9列鸵膏。

3. Gapped Peaks Format

前兩種格式都是由于描述連續(xù)的peak區(qū)間,適用于DNA水平上的富集區(qū)域信息的存儲怎炊,比如chip_seq, ATAC_seq鑒定到的peak區(qū)間谭企,而gapped peaks format用于描述非連續(xù)的peak區(qū)間,這里的非連續(xù)通常指的是在peak的區(qū)間內(nèi)會包含多個exon區(qū)域评肆,適用于RNA水平上的富集區(qū)域信息的存儲赞咙,比如m6A_seq鑒定到的peak區(qū)間。

該格式在BED12的基礎(chǔ)上進(jìn)行延伸糟港,演變?yōu)锽ED12+3的格式攀操,列數(shù)為15列,每列的含義示意如下

前6列的含義和上述兩種peak格式完全相同秸抚,后3列的含義和broad peak完全相同速和,為了專區(qū)表示peak區(qū)間內(nèi)包含的exon信息,借鑒轉(zhuǎn)錄本的BED12格式剥汤,引入了以下6列

  1. thickStart

  2. thickEnd

  3. itemRgb

  4. blockCount

  5. blockSizes

  6. blockStarts


thickStartthickEnd有點(diǎn)類似轉(zhuǎn)錄本中CDS的起始和終止位置颠放,在存儲peak信息時,通常的做法是將這兩列的值和chromStartchromEnd的值設(shè)置成相同的吭敢,itemRgb是一個RGB顏色值碰凶,比如255,0,0, 如果沒有對應(yīng)的顏色信息,則用0來表示。

blockCount代表該peak區(qū)間包含的exon的個數(shù)欲低,blockSizes代表每個exon區(qū)間的長度辕宏,多個exon用逗號連接,blockStarts代表每個exon區(qū)間在基因組上的起始位置砾莱,多個exon用逗號連接瑞筐。

關(guān)于這三種格式的相關(guān)介紹請參考以下鏈接

https://genome.ucsc.edu/FAQ/FAQformat.html#format13

·end·

—如果喜歡,快分享給你的朋友們吧—


掃描關(guān)注微信號腊瑟,更多精彩內(nèi)容等著你聚假!

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市闰非,隨后出現(xiàn)的幾起案子膘格,更是在濱河造成了極大的恐慌,老刑警劉巖财松,帶你破解...
    沈念sama閱讀 218,682評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件瘪贱,死亡現(xiàn)場離奇詭異游岳,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)胚迫,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,277評論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來访锻,“玉大人褪尝,你說我怎么就攤上這事∑谌” “怎么了?”我有些...
    開封第一講書人閱讀 165,083評論 0 355
  • 文/不壞的土叔 我叫張陵璃谨,是天一觀的道長。 經(jīng)常有香客問我鲤妥,道長佳吞,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,763評論 1 295
  • 正文 為了忘掉前任棉安,我火速辦了婚禮,結(jié)果婚禮上贡耽,老公的妹妹穿的比我還像新娘鹊汛。我一直安慰自己阱冶,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,785評論 6 392
  • 文/花漫 我一把揭開白布熙揍。 她就那樣靜靜地躺著氏涩,像睡著了一般。 火紅的嫁衣襯著肌膚如雪是尖。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,624評論 1 305
  • 那天蛔添,我揣著相機(jī)與錄音兜辞,去河邊找鬼。 笑死逸吵,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的扫皱。 我是一名探鬼主播,決...
    沈念sama閱讀 40,358評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼氢妈,長吁一口氣:“原來是場噩夢啊……” “哼段多!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起进苍,我...
    開封第一講書人閱讀 39,261評論 0 276
  • 序言:老撾萬榮一對情侶失蹤琅捏,失蹤者是張志新(化名)和其女友劉穎生百,沒想到半個月后柄延,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體缀程,經(jīng)...
    沈念sama閱讀 45,722評論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡市俊,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,900評論 3 336
  • 正文 我和宋清朗相戀三年摆昧,在試婚紗的時候發(fā)現(xiàn)自己被綠了撩满。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片绅你。...
    茶點(diǎn)故事閱讀 40,030評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡忌锯,死狀恐怖伪嫁,靈堂內(nèi)的尸體忽然破棺而出偶垮,到底是詐尸還是另有隱情,我是刑警寧澤似舵,帶...
    沈念sama閱讀 35,737評論 5 346
  • 正文 年R本政府宣布砚哗,位于F島的核電站龙助,受9級特大地震影響频祝,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜常空,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,360評論 3 330
  • 文/蒙蒙 一漓糙、第九天 我趴在偏房一處隱蔽的房頂上張望铣缠。 院中可真熱鬧昆禽,春花似錦、人聲如沸醉鳖。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,941評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至琳拨,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間狱庇,已是汗流浹背恶耽。 一陣腳步聲響...
    開封第一講書人閱讀 33,057評論 1 270
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留驳棱,地道東北人农曲。 一個月前我還...
    沈念sama閱讀 48,237評論 3 371
  • 正文 我出身青樓,卻偏偏與公主長得像形葬,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子笙以,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,976評論 2 355

推薦閱讀更多精彩內(nèi)容