我的ChIP-Seq(4):MAnorm差異分析

哈哈,搜了一圈沒發(fā)現(xiàn)網(wǎng)上有關(guān)于MAnorm的中文教程或者是說明鞋邑,本文將是第一篇~撒花??ヽ(°▽°)ノ?那就要用心寫了巡球,感到鴨梨.jpg==

首先睁搭,MAnorm是什么扳抽,可以做什么呢吹零?
簡(jiǎn)單地說席函,這是一款尋找兩個(gè)ChIP-Seq樣本之間差異peak的軟件炮姨。一般ChIP的流程中窗价,若是單一處理的細(xì)胞系如庭,那么callpeak之后可能會(huì)做binding motif的分析或是peak相關(guān)gene的功能分析等;但若是兩種處理的細(xì)胞系(比如饑餓組和對(duì)照組)撼港,我們肯定想要知道兩種處理下坪它,組蛋白修飾的差異,類似于RNA-Seq中差異表達(dá)基因的分析帝牡,所以這時(shí)就需要進(jìn)行差異分析往毡。MAnorm就可以實(shí)現(xiàn)這樣的分析需要。

一般來說靶溜,上述差異分析不一定要在peaks水平進(jìn)行开瞭,完全可以在reads水平,這個(gè)就叫做“一步法”罩息;而通過先分別callpeak再比較peaks的density或者depth等嗤详,就是所謂的“兩步法”。不同方法有不同類型的軟件可供選擇瓷炮,這就是ChIP分析成熟的地方葱色,不過技術(shù)流大可根據(jù)自己的目的寫腳本進(jìn)行個(gè)性化處理,這個(gè)暫且不表娘香。

那么差異分析軟件如何選擇呢冬筒?根據(jù)組蛋白修飾類型、樣品是否有重復(fù)茅主、是否需要callpeak(即predefined region set)舞痰,下圖一目了然:


Steinhauser et al.2016

我的樣品有寬峰窄峰兩種修飾、無重復(fù)诀姚,項(xiàng)目時(shí)間緊張盡量想用一個(gè)軟件實(shí)現(xiàn)响牛,所以選擇了MAnorm。

MAnorm的原理

話不多說赫段,直接看圖:

Shao et al. Genome Biology 2012

概括的說呀打,通過比較兩個(gè)樣品的common peak的density差異,標(biāo)準(zhǔn)化unique peaks糯笙,也就是說贬丛,既然兩個(gè)樣本間common peak強(qiáng)度一致,那么peak內(nèi)的reads差異倍數(shù)就是測(cè)序深度/密度的差異给涕,能夠作為normalization的標(biāo)準(zhǔn)豺憔。直接比較標(biāo)準(zhǔn)化后的peaks额获,避免了不同樣品信噪比不同的問題。
這個(gè)算法基于這樣的假設(shè):兩個(gè)樣本間都有的 peak 或是 banding 位點(diǎn)恭应,相關(guān)蛋白的結(jié)合機(jī)制相同抄邀,故應(yīng)有相同的 binding intensity。

MAnorm的使用

1.安裝

1.1.4版本
conda/PyPi
需要注意的是昼榛,此版本只支持bed格式且不支持paired-end模式境肾,會(huì)把所有reads當(dāng)成single-end處理。若reads文件想用支持更多的格式(sam/bam/bedpe等)胆屿,請(qǐng)用v1.2.0奥喻。
1.2.0版本
暫時(shí)只能從Github復(fù)制源碼進(jìn)行安裝。方法:

git clone https://github.com/shao-lab/MAnorm.git
unzip MAnorm-1.2.0.zip
cd MAnorm
pip install .     ###注意.不要漏掉非迹!
manorm --version ##檢查一下是否安裝成功衫嵌,成功后將程序軟鏈接至我的bin或添加至環(huán)境變量
2.數(shù)據(jù)準(zhǔn)備

建議首先閱讀使用說明,最好從linux中manorm --help彻秆,或者在Github中找到相應(yīng)版本的附帶說明楔绞,這一點(diǎn)很重要,因?yàn)橛袝r(shí)網(wǎng)上搜到的說明和你實(shí)際用的版本不一致唇兑,會(huì)走彎路酒朵,不要問我咋知道的。
所以要準(zhǔn)備的文件有4個(gè):

sample1_peaks.bed/sample2_peaks.bed:
默認(rèn)bed扎附,支持MACS2出來的結(jié)果peaks.xls蔫耽,軟件自動(dòng)識(shí)別無需調(diào)整。
sample1_reads.bed/sample2_reads.bed:
默認(rèn)bed留夜,v1.2.0開始支持其他格式(sam/bam)匙铡,需使用參數(shù) -rf

將如上文件移動(dòng)至新文件夾下待用。***tips:這里不再需要對(duì)照組In的文件了

3.運(yùn)行

基本命令(--p1 --p2 --r1 --r2 -o是5個(gè)必需參數(shù)碍粥,注意是兩個(gè)-):

manorm
--p1 sample1_peaks.xls 
--p2 sample2_peaks.xls 
--pf macs  #指定peaks form
--r1 sample1_reads.sam 
--r2 sample2_reads.sam 
--rf sam #指定reads form
--pe  #paired-end模式
-o output_dir #指定輸出文件路徑

建議試運(yùn)行一組數(shù)據(jù)先鳖眼,根據(jù)報(bào)錯(cuò)文件調(diào)整格式。軟件還不太成熟嚼摩,需要多調(diào)整格式钦讳。

4.結(jié)果

運(yùn)行約10min,產(chǎn)生4個(gè)結(jié)果文件:
sample1peaks_vs_sample2peaks_all_MAvalues.xls:這個(gè)是主要的結(jié)果文件枕面,Excel格式愿卒,里面的peak_group有標(biāo)注是common/1unique/2unique的。
output_figures 文件夾:4個(gè)圖潮秘,計(jì)算的Mvalue Avalue(MA)及校正之后的MA琼开,大概就是這個(gè)意思,還需要讀文獻(xiàn)琢磨
output_filters 文件夾:3個(gè)peaks.bed文件枕荞,可能就是條件嚴(yán)格了點(diǎn)之后的結(jié)果柜候,兩個(gè)biased包括的peaks很少搞动,一個(gè)unbiased包括的peaks很多跟all那個(gè)文件差不了多少。
output_tracks 文件夾:3個(gè)wig文件改橘,是M A values的,UCSC可視的文件類型玉控。

綜上飞主,決定用main output file即第一個(gè)結(jié)果,進(jìn)行后面的分析高诺。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末碌识,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子虱而,更是在濱河造成了極大的恐慌筏餐,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,324評(píng)論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件牡拇,死亡現(xiàn)場(chǎng)離奇詭異魁瞪,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)惠呼,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,356評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門导俘,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人剔蹋,你說我怎么就攤上這事旅薄。” “怎么了泣崩?”我有些...
    開封第一講書人閱讀 162,328評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵少梁,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我矫付,道長(zhǎng)凯沪,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,147評(píng)論 1 292
  • 正文 為了忘掉前任买优,我火速辦了婚禮著洼,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘而叼。我一直安慰自己身笤,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,160評(píng)論 6 388
  • 文/花漫 我一把揭開白布葵陵。 她就那樣靜靜地躺著液荸,像睡著了一般。 火紅的嫁衣襯著肌膚如雪脱篙。 梳的紋絲不亂的頭發(fā)上娇钱,一...
    開封第一講書人閱讀 51,115評(píng)論 1 296
  • 那天伤柄,我揣著相機(jī)與錄音,去河邊找鬼文搂。 笑死适刀,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的煤蹭。 我是一名探鬼主播笔喉,決...
    沈念sama閱讀 40,025評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼硝皂!你這毒婦竟也來了常挚?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,867評(píng)論 0 274
  • 序言:老撾萬榮一對(duì)情侶失蹤稽物,失蹤者是張志新(化名)和其女友劉穎奄毡,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體贝或,經(jīng)...
    沈念sama閱讀 45,307評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡吼过,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,528評(píng)論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了咪奖。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片那先。...
    茶點(diǎn)故事閱讀 39,688評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖赡艰,靈堂內(nèi)的尸體忽然破棺而出售淡,到底是詐尸還是另有隱情,我是刑警寧澤慷垮,帶...
    沈念sama閱讀 35,409評(píng)論 5 343
  • 正文 年R本政府宣布揖闸,位于F島的核電站,受9級(jí)特大地震影響料身,放射性物質(zhì)發(fā)生泄漏汤纸。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,001評(píng)論 3 325
  • 文/蒙蒙 一芹血、第九天 我趴在偏房一處隱蔽的房頂上張望贮泞。 院中可真熱鬧,春花似錦幔烛、人聲如沸啃擦。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,657評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽令蛉。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間珠叔,已是汗流浹背蝎宇。 一陣腳步聲響...
    開封第一講書人閱讀 32,811評(píng)論 1 268
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留祷安,地道東北人姥芥。 一個(gè)月前我還...
    沈念sama閱讀 47,685評(píng)論 2 368
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像汇鞭,于是被迫代替她去往敵國(guó)和親凉唐。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,573評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容

  • 在實(shí)戰(zhàn)之前锚国,首先對(duì)CHIP-seq分析做一些了解腕巡,以下是從各個(gè)地方copy過來綜合起來的,有些散亂血筑,是我認(rèn)為重要以...
    生信start_site閱讀 10,849評(píng)論 0 59
  • 理解ChIP-Seq 到了目前這個(gè)水平绘沉,我學(xué)習(xí)新的高通量數(shù)據(jù)分析流程時(shí)已經(jīng)不再考慮代碼應(yīng)該如何寫的問題了。我更多要...
    xuzhougeng閱讀 66,570評(píng)論 11 153
  • 1. 學(xué)習(xí)目標(biāo) 討論ChIP-seq數(shù)據(jù)質(zhì)量評(píng)估的其他方法 用ChIPQC產(chǎn)生質(zhì)量統(tǒng)計(jì)報(bào)告 鑒定低質(zhì)量數(shù)據(jù)的來源概...
    六六_ryx閱讀 15,604評(píng)論 0 17
  • 感恩日記(251) 《傷疤》 樹欲挺拔豺总, 剪枝去椏车伞, 每個(gè)傷痛之處, 長(zhǎng)出堅(jiān)硬節(jié)花喻喳。 月季剔杈另玖, 重綻鮮花。 果樹...
    hao黑土閱讀 79評(píng)論 0 1
  • 對(duì)不起表伦、謝謝你谦去、請(qǐng)?jiān)彙⑽覑勰惚暮摺G謇眦蕖⑶謇怼⒉粩嗟那謇怼?由于昨天沒有寫回向纲熏,承諾接下來的三天都要寫下自己的感恩和...
    抒礫閱讀 269評(píng)論 0 0