ChIP-seq數(shù)據(jù)分析學(xué)習(xí)資源總結(jié)

首先這個(gè)名字要寫對:ChIP-seq假抄,有很多論文沒注意大小寫愚战,其實(shí)沒理解每個(gè)字母所代表的含義。
ChIP-seq大致原理看一看:

image.png

Figure 1: Workflow of a ChIP-seq analysis: Chromatin in the nucleus (1) is cross-linked and sheared (2), followed by
enrichment of complexes containing the target protein using immunoprecipitation (3). Short reads obtained from
massively parallel sequencing (4) are mapped to a reference genome (5) yielding in a distribution of tags on the
genome (adapted from http://en.wikipedia.org/wiki/File:Chip_sequencing2.png 2008 - 02-29)
一句話說完,其實(shí)就是探索你要研究的蛋白在全基因組范圍內(nèi)的結(jié)合位點(diǎn)羹与。
先用甲醛把細(xì)胞內(nèi)蛋白和DNA結(jié)合的生理狀態(tài)固定,類似照相機(jī)拍攝畫面庶灿。之后就是打斷這些DNA纵搁,再用你研究的蛋白抗體富集你研究的蛋白和DNA結(jié)合的這些碎片。獲得這些碎片后再把蛋白和DNA解開交聯(lián)往踢。之后就是測序建庫測序腾誉。

要看的論文很多【唬看過的先記錄一下:
1利职,Practical Guidelines for the Comprehensive Analysis of
ChIP-seq Data
文章從數(shù)據(jù)質(zhì)控,比對瘦癌,peak calling,peak注釋猪贪,motif分析都給出了注意點(diǎn),值得一讀
論文從數(shù)據(jù)的質(zhì)控到最后的peak注釋都給了很多說明讯私。

2哮伟,碩士論文
基于ChIP-seq全基因組識(shí)別毛竹筍尖與鞭筍尖組蛋白修飾位點(diǎn)
文章使用了組蛋白修飾做了chip-seq,從實(shí)驗(yàn)流程到數(shù)據(jù)分析妄帘,詳細(xì)楞黄。值得一看。特別是MACS的使用方法

3抡驼,視頻教程
B站的https://www.bilibili.com/video/BV1Yx411x7kE

4鬼廓,網(wǎng)上別人的實(shí)踐
擬南芥的數(shù)據(jù),準(zhǔn)備實(shí)踐一下
http://www.reibang.com/p/78571f87bef9

MACS2 callpeak原理
https://www.plob.org/article/7227.html
https://hbctraining.github.io/Intro-to-ChIPseq/lessons/05_peak_calling_macs.html

記錄一下筆記:
富集倍數(shù):
實(shí)驗(yàn)樣本的富集倍數(shù)要比對照組要大于2倍到50倍之間致盟,太大倍數(shù)會(huì)被認(rèn)為是建庫時(shí)的PCR重復(fù)


image.png

兩個(gè)圖的含義


image.png
image.png

下面這張圖是形象化地解釋了上面這個(gè)圖碎税。視頻亮點(diǎn)之一,其他跑流程的教程沒有把圖說明白馏锡。

左邊曲線圖是在整個(gè)基因組范圍內(nèi)雷蹂,求出每段區(qū)間覆蓋的reads數(shù)目的平均值,然后以X軸為為基因區(qū)間杯道,Y軸為覆蓋在某個(gè)區(qū)段的reads數(shù)匪煌,連成曲線圖繪制。

右邊熱圖是把基因組所有基因,每個(gè)基因內(nèi)的TSS上下游區(qū)間內(nèi)的所有reads數(shù)目加和萎庭,然后按照大小排序霜医,再把每個(gè)區(qū)間內(nèi)的reads按照示意圖的表示給畫出來。

實(shí)際兩張圖表示的一個(gè)意思驳规,都是在全基因組范圍內(nèi)查看TSS上下游區(qū)間內(nèi)的reads分布肴敛,也就是這個(gè)蛋白的富集區(qū)間就是在大部分基因的TSS周圍。

(下次再忘記可以翻翻視頻吗购,43:28處開始講這兩個(gè)圖含義)

一般來說医男,基因結(jié)合基因TSS位置,可能是結(jié)合很多基因捻勉,也就是廣譜調(diào)控昨登。

接下來視頻是講實(shí)際操作:


image.png

1,下載數(shù)據(jù)
1)下載數(shù)據(jù)的腳本
最好把下載的數(shù)據(jù)鏈接寫在一個(gè)腳本里面。然后記錄好數(shù)據(jù)的各種信息贯底,方便日后查看丰辣。
2)文件改名的腳本,也可以寫在一起禽捆,放進(jìn)一個(gè)腳本


image.png

命名的規(guī)范:
命名之前的文件名字是啥笙什。重新命名后的文件名字是啥。

要在過段時(shí)間后胚想,還能知道這個(gè)文件當(dāng)初是用來干嘛的琐凭。
舉例:


image.png

293是細(xì)胞系
chip-seq是數(shù)據(jù)類型
control是對照
rep1是重復(fù)1
R1是PE測序的read1文件
fasq是文件類型
gz是壓縮文件

2,質(zhì)控
fastqc
可以把建立文件夾浊服,質(zhì)控等步驟的命令寫在一個(gè)bash文件內(nèi)统屈,一起執(zhí)行

3,比對
重點(diǎn)學(xué)習(xí)這部分牙躺,批處理腳本


image.png

比對結(jié)果


image.png

for循環(huán)嵌套:

外層循環(huán)每做一次愁憔,內(nèi)層便全部做一次。

ps grep cut xargs -i kill -9
組合使用殺掉多個(gè)進(jìn)程
4孽拷,過濾掉map質(zhì)量分?jǐn)?shù)低的reads

比對完后做mapQ>20的過濾吨掌,sam轉(zhuǎn)為bam
異步操作就可以

samtools view -q 20 -h -b -o bam_file -@ 10sam_file &
-q 僅僅保存質(zhì)量分?jǐn)?shù)大于多少的reads
-h保留頭文件
-b輸出bam
-o輸出文件
bam文件名字
-@ 核心數(shù)
sam文件名字

5,sort bam
6 peak calling
使用MACS2

90:50左右開始說MACS

完結(jié)-

視頻有些是口誤脓恕,自己鑒別膜宋。學(xué)到不少東西。下面自己要把循環(huán)腳本和代碼規(guī)范練習(xí)一下炼幔。只記錄了自己認(rèn)為重要的東西秋茫。如果想學(xué)習(xí),最好還是要看視頻乃秀。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末肛著,一起剝皮案震驚了整個(gè)濱河市圆兵,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌策泣,老刑警劉巖衙傀,帶你破解...
    沈念sama閱讀 218,941評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件抬吟,死亡現(xiàn)場離奇詭異萨咕,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)火本,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,397評論 3 395
  • 文/潘曉璐 我一進(jìn)店門危队,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人钙畔,你說我怎么就攤上這事茫陆。” “怎么了擎析?”我有些...
    開封第一講書人閱讀 165,345評論 0 356
  • 文/不壞的土叔 我叫張陵簿盅,是天一觀的道長。 經(jīng)常有香客問我揍魂,道長桨醋,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,851評論 1 295
  • 正文 為了忘掉前任现斋,我火速辦了婚禮喜最,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘庄蹋。我一直安慰自己瞬内,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,868評論 6 392
  • 文/花漫 我一把揭開白布限书。 她就那樣靜靜地躺著虫蝶,像睡著了一般。 火紅的嫁衣襯著肌膚如雪倦西。 梳的紋絲不亂的頭發(fā)上秉扑,一...
    開封第一講書人閱讀 51,688評論 1 305
  • 那天,我揣著相機(jī)與錄音调限,去河邊找鬼舟陆。 笑死,一個(gè)胖子當(dāng)著我的面吹牛耻矮,可吹牛的內(nèi)容都是我干的秦躯。 我是一名探鬼主播,決...
    沈念sama閱讀 40,414評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼裆装,長吁一口氣:“原來是場噩夢啊……” “哼踱承!你這毒婦竟也來了倡缠?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,319評論 0 276
  • 序言:老撾萬榮一對情侶失蹤茎活,失蹤者是張志新(化名)和其女友劉穎昙沦,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體载荔,經(jīng)...
    沈念sama閱讀 45,775評論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡盾饮,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,945評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了懒熙。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片丘损。...
    茶點(diǎn)故事閱讀 40,096評論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖工扎,靈堂內(nèi)的尸體忽然破棺而出徘钥,到底是詐尸還是另有隱情,我是刑警寧澤肢娘,帶...
    沈念sama閱讀 35,789評論 5 346
  • 正文 年R本政府宣布呈础,位于F島的核電站,受9級特大地震影響橱健,放射性物質(zhì)發(fā)生泄漏而钞。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,437評論 3 331
  • 文/蒙蒙 一畴博、第九天 我趴在偏房一處隱蔽的房頂上張望笨忌。 院中可真熱鬧,春花似錦俱病、人聲如沸官疲。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,993評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽途凫。三九已至,卻和暖如春溢吻,著一層夾襖步出監(jiān)牢的瞬間维费,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,107評論 1 271
  • 我被黑心中介騙來泰國打工促王, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留犀盟,地道東北人耳璧。 一個(gè)月前我還...
    沈念sama閱讀 48,308評論 3 372
  • 正文 我出身青樓壁拉,卻偏偏與公主長得像奸绷,于是被迫代替她去往敵國和親躏筏。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,037評論 2 355

推薦閱讀更多精彩內(nèi)容