S3norm -- 表觀遺傳數(shù)據(jù)標(biāo)準(zhǔn)化工具

序言:
S3norm使用單調(diào)非線性變換對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,模擬標(biāo)準(zhǔn)化數(shù)據(jù)集之間的測序深度和信號背景的數(shù)值始花,可以更好的反應(yīng)表觀遺傳數(shù)據(jù)之間的生物學(xué)差異消约。

S3norm發(fā)表的文章 https://academic.oup.com/nar/article/48/8/e43/5747479

1 下載
1.1 創(chuàng)建環(huán)境

conda create -n S3norm  python=2.7

注意,這里使用的python版本仍然是2.7

conda activate S3norm

1.2 Clone the github repository

git clone https://github.com/guanjue/S3norm.git

1.3 下載依賴

pip install numpy scipy

2 準(zhǔn)備輸入文件
2.1 將已排序的無重復(fù)的bam文件轉(zhuǎn)為bedgraph

bamCoverage --bam input.bam  -o ./out.bed -of bedgraph -bs 10 -p 8  --minMappingQuality 30  -e  150 

2.2 對得到的bed文件進(jìn)行排序

sort -k1,1 -k2,2n ./out.bed  > ./bed_sorted

2.3 對多個樣本不同區(qū)間進(jìn)行合并(該命令詳細(xì)解釋氢伟,http://www.reibang.com/p/f8bbd51b5199)

bedtools unionbedg -i 1-ATAC_0G.bed_sorted 2-ATAC_50G.bed_sorted 3-ATAC_80G.bed_sorted > ATAC_3_samples

2.4 將合并區(qū)域的文件拆分

cut -f 1,2,3,4 ATAC_3_samples > 1-ATAC_0G.input
cut -f 1,2,3,5 ATAC_3_samples > 2-ATAC_50G.input
cut -f 1,2,3,6 ATAC_3_samples > 3-ATAC_80G.input

2.5 生成標(biāo)準(zhǔn)文件(根據(jù)個人情況選擇不同的標(biāo)準(zhǔn)文件)

awk '{print $1"\t"$2"\t"$3"\t""1"}' ATAC_3_samples > control_s3norm_input

2.6 生成標(biāo)準(zhǔn)化文件的列表榜轿,本文中的列表(命名為file_list.txt)應(yīng)該如下

1-ATAC_0G.input  control_s3norm_input
2-ATAC_50G.input control_s3norm_input
3-ATAC_80G.input  control_s3norm_input

take a look input files

head *input
head 1-ATAC_0G.input
chr1    7000    7200    0
chr1    18800   19000   0
chr1    62400   62600   5.02
chr1    63800   64000   188.21
chr1    95600   95800   16.41
chr1    136000  136200  0
chr1    156000  156200  0
chr1    158800  159000  0
chr1    206400  206600  51.87
chr1    217000  217200  0

head 2-ATAC_50G.input
chr1    7000    7200    0
chr1    18800   19000   0
chr1    62400   62600   0
chr1    63800   64000   2.66
chr1    95600   95800   0
chr1    136000  136200  50.26
chr1    156000  156200  0
chr1    158800  159000  0
chr1    206400  206600  0
chr1    217000  217200  0

head 3-ATAC_80G.input
chr1    7000    7200    0
chr1    18800   19000   0
chr1    62400   62600   0
chr1    63800   64000   0
chr1    95600   95800   0
chr1    136000  136200  0
chr1    156000  156200  0
chr1    158800  159000  0
chr1    206400  206600  0
chr1    217000  217200  0

head control_s3norm_input
chr1    7000    7200    1
chr1    18800   19000   1
chr1    62400   62600   1
chr1    63800   64000   1
chr1    95600   95800   1
chr1    136000  136200  1
chr1    156000  156200  1
chr1    158800  159000  1
chr1    206400  206600  1
chr1    217000  217200  1
  1. 運行S3norm
    3.1 在輸入文件所在路徑下寫入運行腳本
### S3norm code所在路徑
script_directory='/where_user_clone_the_S3norm_GitHub/S3norm/'
### 輸入文件所在路徑
working_directory='./example_file/'
### 執(zhí)行 S3norm
time python $script_directory'/src/s3norm_pipeline.py' -s $script_directory'/src/' -t ./file_list.txt

3.2 查看輸出文件
三種類型的 S3norm 輸出文件

(1) S3norm標(biāo)準(zhǔn)化后的read counts (normalized read counts). (存儲于 'S3norm_rc_bedgraph/')
(2) 基于負(fù)二項分布 -log10 p-value 標(biāo)準(zhǔn)化后的read counts. (存儲于 'NBP_bedgraph/')
原文: The negative log10 p-value of S3norm normalized read counts based on a negative binomial background model.
(3) 基于負(fù)二項分布對 -log10 p-value 進(jìn)行標(biāo)準(zhǔn)化. (Saved in 'S3norm_NBP_bedgraph/')
原文: The S3norm normalized negative log10 p-value based on a negative binomial background model.

  1. 對標(biāo)準(zhǔn)化后的read counts進(jìn)行可視化處理

4.1 對S3norm_rc_bedgraph/下的文件進(jìn)行排序

sort -k1,1 -k2,2n 1-ATAC_0G.bedgraph.s3norm.bedgraph > 1-ATAC_0G.bedgraph.s3norm.bedgraph_sorted

4.2 bed文件轉(zhuǎn)為bigwig文件
需要提前下載bedGraphToBigWig軟件以及基因組大小文件

~/tools/bedgraphtobigwig/bin/bedGraphToBigWig  1-ATAC_0G.bedgraph.s3norm.bedgraph_sorted ~/genome/tair.sizes.genome 1-ATAC_0G.bigwig 

后續(xù)
S3norm的輸出文件還有多種用途,這里只是針對標(biāo)準(zhǔn)化后的可視化進(jìn)行了展示.
歡迎大家交流指正.

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末朵锣,一起剝皮案震驚了整個濱河市谬盐,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌诚些,老刑警劉巖飞傀,帶你破解...
    沈念sama閱讀 206,968評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異诬烹,居然都是意外死亡砸烦,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,601評論 2 382
  • 文/潘曉璐 我一進(jìn)店門绞吁,熙熙樓的掌柜王于貴愁眉苦臉地迎上來幢痘,“玉大人,你說我怎么就攤上這事家破⊙账担” “怎么了?”我有些...
    開封第一講書人閱讀 153,220評論 0 344
  • 文/不壞的土叔 我叫張陵员舵,是天一觀的道長脑沿。 經(jīng)常有香客問我,道長马僻,這世上最難降的妖魔是什么庄拇? 我笑而不...
    開封第一講書人閱讀 55,416評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮韭邓,結(jié)果婚禮上措近,老公的妹妹穿的比我還像新娘。我一直安慰自己女淑,他們只是感情好瞭郑,可當(dāng)我...
    茶點故事閱讀 64,425評論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著鸭你,像睡著了一般屈张。 火紅的嫁衣襯著肌膚如雪擒权。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,144評論 1 285
  • 那天阁谆,我揣著相機與錄音碳抄,去河邊找鬼。 笑死场绿,一個胖子當(dāng)著我的面吹牛剖效,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播焰盗,決...
    沈念sama閱讀 38,432評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼璧尸,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了熬拒?” 一聲冷哼從身側(cè)響起爷光,我...
    開封第一講書人閱讀 37,088評論 0 261
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎梦湘,沒想到半個月后瞎颗,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,586評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡捌议,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,028評論 2 325
  • 正文 我和宋清朗相戀三年哼拔,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片瓣颅。...
    茶點故事閱讀 38,137評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡倦逐,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出宫补,到底是詐尸還是另有隱情檬姥,我是刑警寧澤,帶...
    沈念sama閱讀 33,783評論 4 324
  • 正文 年R本政府宣布粉怕,位于F島的核電站健民,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏贫贝。R本人自食惡果不足惜秉犹,卻給世界環(huán)境...
    茶點故事閱讀 39,343評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望稚晚。 院中可真熱鬧崇堵,春花似錦、人聲如沸客燕。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,333評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽也搓。三九已至赏廓,卻和暖如春涵紊,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背幔摸。 一陣腳步聲響...
    開封第一講書人閱讀 31,559評論 1 262
  • 我被黑心中介騙來泰國打工栖袋, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人抚太。 一個月前我還...
    沈念sama閱讀 45,595評論 2 355
  • 正文 我出身青樓,卻偏偏與公主長得像昔案,于是被迫代替她去往敵國和親尿贫。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,901評論 2 345

推薦閱讀更多精彩內(nèi)容