生物數(shù)據(jù)格式 - bed

格式

BED格式文件全稱是 Browser Extensible Data,通過規(guī)定行的內(nèi)容來展示注釋信息租谈。bed文件可以作為一個(gè)特征標(biāo)識(shí)符篮奄, 來快速查找感興趣的基因組區(qū)域,最經(jīng)典的應(yīng)用場(chǎng)景就是將peak calling的bed文件和對(duì)應(yīng)樣本的tdf文件同時(shí)導(dǎo)入IGV, 然后快速查看peak區(qū)域的測(cè)序深度分布情況割去。GFF文件格式如下:
image.png

BED格式文件有3個(gè)基本列和9個(gè)可選的附加列
基本列
第一列:chrom宦搬,染色體號(hào);
第二列:chromStart劫拗,在染色體上的起始位置,從0開始計(jì)數(shù)矾克;
第三列:ChromEnd页慷,在染色體上的終止位置。bed文件為左閉右開區(qū)間胁附,當(dāng)片段堿基為0-99時(shí)酒繁,記為“ChromStart=0,ChromEnd=100”。
附加列
第四列:name控妻,行名州袒;
第五列:score,基因組瀏覽器中顯示的灰度設(shè)定值弓候,介于0-1000之間郎哭,越大越黑;
第六列:正負(fù)鏈標(biāo)記菇存,“+”夸研、“-”、“.”(no strand)依鸥;
第七列:thickStart亥至,編碼起始位置;
第八列:thickEnd,編碼終止位置姐扮;
第九列:itemRgb-R,G,B絮供,當(dāng)itemRgb設(shè)置為“On”,行會(huì)顯示顏色茶敏;
第十列:blockCount壤靶,外顯子數(shù)量;
第十一列:BlockSizes睡榆,外顯子大小列表萍肆,逗號(hào)分隔;
第十二列:blockStarts胀屿,外顯子起始列表位置塘揣,逗號(hào)分隔,是與chromStart相對(duì)的一個(gè)位置宿崭。

處理
IGV查看

bed文件中的每一行為一個(gè)染色體區(qū)域亲铡,當(dāng)bed文件的name存在時(shí),在區(qū)域的下方會(huì)顯示對(duì)應(yīng)的ID葡兑,可以用于檢索奖蔓,示意如下
image.png
長(zhǎng)度運(yùn)算__ bedtools slop

增加兩端長(zhǎng)度

bedtools slop -i input.bed -g output.bed -b 10 # -b,增加兩端長(zhǎng)度(10bp)
bedrolls slop -i input.bed -g output.bed -b 0.1 -pct #-pct,按比例(-b)增加兩端長(zhǎng)度

增加一端長(zhǎng)度

bedtools slop -i input.bed -g output.bed -l 10 -r 20 #-l,增加開始端長(zhǎng)度讹堤;-r吆鹤,增加末端長(zhǎng)度

鏈特異性影響

bedtools slop -i demo.bed -g genome.txt -l 10 -r 3 -s #-s,區(qū)分正負(fù)鏈,對(duì)正鏈運(yùn)算無影響洲守,對(duì)負(fù)鏈運(yùn)算首位交換
與GFF關(guān)系

genomic features通常使用bed 或者gff文件表示疑务,兩者最基本的信息就是染色體或Contig的ID或編號(hào)、DNA的正負(fù)鏈信息以及在染色體上的起始和終止位置數(shù)值梗醇。兩種文件的區(qū)別在于知允,BED文件中起始坐標(biāo)為0,結(jié)束坐標(biāo)至少是1叙谨,GFF中起始坐標(biāo)是1而結(jié)束坐標(biāo)至少是1温鸽。把BED轉(zhuǎn)成對(duì)應(yīng)的GFF格式(僅保留兩者相同信息)

cat demo.bed | bioawk -c bed '{print $chrom, ".", ".", $start+1, $end, $score, $strand, ".", "." }' > demo.gff
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市手负,隨后出現(xiàn)的幾起案子涤垫,更是在濱河造成了極大的恐慌,老刑警劉巖虫溜,帶你破解...
    沈念sama閱讀 206,126評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件雹姊,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡衡楞,警方通過查閱死者的電腦和手機(jī)吱雏,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門敦姻,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人歧杏,你說我怎么就攤上這事镰惦。” “怎么了犬绒?”我有些...
    開封第一講書人閱讀 152,445評(píng)論 0 341
  • 文/不壞的土叔 我叫張陵旺入,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我凯力,道長(zhǎng)茵瘾,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,185評(píng)論 1 278
  • 正文 為了忘掉前任咐鹤,我火速辦了婚禮拗秘,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘祈惶。我一直安慰自己雕旨,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,178評(píng)論 5 371
  • 文/花漫 我一把揭開白布捧请。 她就那樣靜靜地躺著凡涩,像睡著了一般。 火紅的嫁衣襯著肌膚如雪疹蛉。 梳的紋絲不亂的頭發(fā)上活箕,一...
    開封第一講書人閱讀 48,970評(píng)論 1 284
  • 那天,我揣著相機(jī)與錄音可款,去河邊找鬼讹蘑。 笑死,一個(gè)胖子當(dāng)著我的面吹牛筑舅,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播陨舱,決...
    沈念sama閱讀 38,276評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼翠拣,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了游盲?” 一聲冷哼從身側(cè)響起误墓,我...
    開封第一講書人閱讀 36,927評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎益缎,沒想到半個(gè)月后谜慌,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,400評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡莺奔,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,883評(píng)論 2 323
  • 正文 我和宋清朗相戀三年欣范,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 37,997評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡恼琼,死狀恐怖妨蛹,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情晴竞,我是刑警寧澤蛙卤,帶...
    沈念sama閱讀 33,646評(píng)論 4 322
  • 正文 年R本政府宣布,位于F島的核電站噩死,受9級(jí)特大地震影響颤难,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜已维,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,213評(píng)論 3 307
  • 文/蒙蒙 一行嗤、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧衣摩,春花似錦昂验、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至泡嘴,卻和暖如春甫恩,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背酌予。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評(píng)論 1 260
  • 我被黑心中介騙來泰國(guó)打工磺箕, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人抛虫。 一個(gè)月前我還...
    沈念sama閱讀 45,423評(píng)論 2 352
  • 正文 我出身青樓松靡,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親建椰。 傳聞我的和親對(duì)象是個(gè)殘疾皇子雕欺,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,722評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容