bedtools求overlap

1奖慌、概述

BEDTools是可用于genomic features的比較自赔,相關(guān)操作及進(jìn)行注釋的工具衩侥。而genomic features通常使用Browser Extensible Data (BED) 或者 General Feature Format (GFF)文件表示

2初嘹、格式說明

genome features: 功能元素(gene)碴裙, 遺傳多態(tài)性 (SNPs, INDELs, or structural variants), 已經(jīng)由測序或者其他方法得到的注釋信息仅讽,也可以是自定義的一些特征信息陶缺。

genome features的基本信息: 染色體或者scaffold的位置, 起始位置洁灵,終止位置饱岸,哪條鏈,feature的name

Overlapping / intersecting features: 兩個genome features的區(qū)域至少有一個bp的共同片段

BED和GFF文件的一個差異:BED文件中起始坐標(biāo)為0徽千,結(jié)束坐標(biāo)至少是1,苫费; GFF中起始坐標(biāo)是1而結(jié)束坐標(biāo)至少是1。

3双抽、使用方法

準(zhǔn)備兩個測試文件百框,

cpg.bed,其內(nèi)容為

chr1??? 20? 70? CPG_1

chr1??? 100 120 CPG_2

chr1??? 150 250 CPG_3

exon.bed,其內(nèi)容為

chr1??? 10? 40? exon_1

chr1??? 50? 60? exon_2

chr1??? 130 180 exon_3

chr1??? 200 280 exon_4

使用默認(rèn)參數(shù),求這個文件的overlap,運(yùn)行

bedtools intersect -a cpg.bed? -b exon.bed

結(jié)果為

chr1??? 20? 40? CPG_1

chr1??? 50? 60? CPG_1

chr1??? 150 180 CPG_3

chr1??? 200 250 CPG_3

可以看出牍汹,默認(rèn)情況下只輸出A中overlap的區(qū)域

添加-wa 參數(shù)铐维, 再次運(yùn)行

bedtools intersect -a cpg.bed? -b exon.bed -wa

結(jié)果為:

chr1??? 20? 70? CPG_1

chr1??? 20? 70? CPG_1

chr1??? 150 250 CPG_3

chr1??? 150 250 CPG_3

可以看出,加上-wa 參數(shù)后慎菲,只要A中的這段區(qū)域與B中區(qū)域有交集嫁蛇,就輸出,而且overlap幾次露该,就輸出幾次

添加-wb 參數(shù)睬棚,運(yùn)行

bedtools intersect -a cpg.bed? -b exon.bed -wb

結(jié)果為:

chr1??? 20? 40? CPG_1?? chr1??? 10? 40? exon_1

chr1??? 50? 60? CPG_1?? chr1??? 50? 60? exon_2

chr1??? 150 180 CPG_3?? chr1??? 130 180 exon_3

chr1??? 200 250 CPG_3?? chr1??? 200 280 exon_4

可以看出,加上-wb參數(shù)后解幼,除了輸出A中的overlap區(qū)域外闸拿,還會輸出B中的整個區(qū)間

加上-wa, -wb 參數(shù),再次運(yùn)行

1

bedtools intersect -a cpg.bed? -b exon.bed -wa -wb

結(jié)果為:

1

2

3

4chr1??? 20? 70? CPG_1?? chr1??? 10? 40? exon_1

chr1??? 20? 70? CPG_1?? chr1??? 50? 60? exon_2

chr1??? 150 250 CPG_3?? chr1??? 130 180 exon_3

chr1??? 150 250 CPG_3?? chr1??? 200 280 exon_4

可以看出书幕,同時添加-wa和-wb參數(shù)會將overlap 區(qū)域成對輸出

-c參數(shù)新荤,統(tǒng)計(jì)A中每個區(qū)域與Boverlap的次數(shù)

bedtools intersect -a cpg.bed? -b exon.bed -c

結(jié)果為:

chr1??? 20? 70? CPG_1?? 2

chr1??? 100 120 CPG_2?? 0

chr1??? 150 250 CPG_3?? 2

-v參數(shù):只輸出A中沒有與Boverlap的區(qū)域

bedtools intersect -a cpg.bed? -b exon.bed -v

結(jié)果為:

chr1??? 100 120 CPG_2

可以看出,只要只要與B有overlap就不輸出台汇。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末苛骨,一起剝皮案震驚了整個濱河市篱瞎,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌痒芝,老刑警劉巖俐筋,帶你破解...
    沈念sama閱讀 218,204評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異严衬,居然都是意外死亡澄者,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,091評論 3 395
  • 文/潘曉璐 我一進(jìn)店門请琳,熙熙樓的掌柜王于貴愁眉苦臉地迎上來粱挡,“玉大人,你說我怎么就攤上這事俄精⊙ぃ” “怎么了?”我有些...
    開封第一講書人閱讀 164,548評論 0 354
  • 文/不壞的土叔 我叫張陵竖慧,是天一觀的道長嫌套。 經(jīng)常有香客問我,道長圾旨,這世上最難降的妖魔是什么踱讨? 我笑而不...
    開封第一講書人閱讀 58,657評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮砍的,結(jié)果婚禮上痹筛,老公的妹妹穿的比我還像新娘。我一直安慰自己挨约,他們只是感情好味混,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,689評論 6 392
  • 文/花漫 我一把揭開白布产雹。 她就那樣靜靜地躺著诫惭,像睡著了一般。 火紅的嫁衣襯著肌膚如雪蔓挖。 梳的紋絲不亂的頭發(fā)上夕土,一...
    開封第一講書人閱讀 51,554評論 1 305
  • 那天,我揣著相機(jī)與錄音瘟判,去河邊找鬼怨绣。 笑死,一個胖子當(dāng)著我的面吹牛拷获,可吹牛的內(nèi)容都是我干的篮撑。 我是一名探鬼主播,決...
    沈念sama閱讀 40,302評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼匆瓜,長吁一口氣:“原來是場噩夢啊……” “哼赢笨!你這毒婦竟也來了未蝌?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,216評論 0 276
  • 序言:老撾萬榮一對情侶失蹤茧妒,失蹤者是張志新(化名)和其女友劉穎萧吠,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體桐筏,經(jīng)...
    沈念sama閱讀 45,661評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡纸型,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,851評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了梅忌。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片狰腌。...
    茶點(diǎn)故事閱讀 39,977評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖铸鹰,靈堂內(nèi)的尸體忽然破棺而出癌别,到底是詐尸還是另有隱情,我是刑警寧澤蹋笼,帶...
    沈念sama閱讀 35,697評論 5 347
  • 正文 年R本政府宣布展姐,位于F島的核電站,受9級特大地震影響剖毯,放射性物質(zhì)發(fā)生泄漏圾笨。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,306評論 3 330
  • 文/蒙蒙 一逊谋、第九天 我趴在偏房一處隱蔽的房頂上張望擂达。 院中可真熱鬧,春花似錦胶滋、人聲如沸板鬓。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,898評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽俭令。三九已至,卻和暖如春部宿,著一層夾襖步出監(jiān)牢的瞬間抄腔,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,019評論 1 270
  • 我被黑心中介騙來泰國打工理张, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留赫蛇,地道東北人。 一個月前我還...
    沈念sama閱讀 48,138評論 3 370
  • 正文 我出身青樓雾叭,卻偏偏與公主長得像悟耘,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子织狐,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,927評論 2 355

推薦閱讀更多精彩內(nèi)容

  • introduction Bedtools is developed in the Quinlan lab at ...
    小浣熊嘎嘣脆閱讀 629評論 0 0
  • BedTools 筆記 工具目的:探索暂幼、處理和操作基因間隔文件(e.g., BED, VCF, BAM)掘殴。 學(xué)習(xí)T...
    王詩翔閱讀 9,223評論 0 3
  • 懾于千與千尋里的一句話 吃太胖會被殺掉的 對美味敬而遠(yuǎn)之 當(dāng)倘著油滴的餅子 被放到我面前 我不管了 所有的抗拒 只...
    露出了真身可會被抱緊閱讀 176評論 0 0
  • api接口符合規(guī)則 重新寫接口返回方法支持post測試請求,支持postman json字符串請求(主要用于復(fù)雜嵌...
    慢慢來111閱讀 371評論 0 1