《生物信息學(xué)生R入門教程》讀書筆記 Chapter 4

這一章主要講的是Chip-seq的基本分析方法

Chip-seq

(引用原文)

ChIP-seq是使用染色質(zhì)免疫共沉淀技術(shù)將蛋白質(zhì)結(jié)合的DNA樣本測(cè)序后分析全基因組蛋白質(zhì)結(jié)合位點(diǎn)的分析方法叔收。研究對(duì)象包括轉(zhuǎn)錄因子剑鞍,組蛋白修飾分析
ChIP-seq實(shí)驗(yàn)主要分為如下幾步:
1.Sample fragmentation, 將基因組打斷
2.Immunoprecipitation, 免疫共沉淀
3.DNA purification, DNA提純
4.sequence, 測(cè)序

通常打斷的基因組有150-300bp長(zhǎng)统捶,那么我們測(cè)的是蛋白或者TF結(jié)合的那個(gè)片段修然,當(dāng)這些reads被mapping回到基因組上時(shí),就會(huì)形成一個(gè)peak萍桌,那么peak的位置即為結(jié)合的部分

常用的軟件有:
1.mapping: bowtie1/2, Rsubread
2.peak calling:CCAT, SICER, MACS, ZINBA, BayesPeak, chipseq, ChIPseqR, CSAR, csaw, GenoGAM, iSeq, PICS
3.Peak annotation and analysis: ChIPpeakAnno
4.Gene network building: GeneNetworkBuilder, ChIPXpress
5.Motif enrichment analysis: The MEME Suite, Homer

質(zhì)控

當(dāng)我們完成上游分析柠掂,我們可以在R里面進(jìn)行QC

library(ChIPQC)
experiment <- ChIPQC(samples)
ChIPQCreport(experiment)

峰注釋

我們call完peak以后熊杨,我們也許知道peak的位置沐兵,但是卻不知道是哪些位置的(TSS)或者功能等别垮,不過我們要下載好注釋好的包

library(TxDb.Hsapiens.UCSC.hg19.knownGene)
annoData <- toGRanges(TxDb.Hsapiens.UCSC.hg19.knownGene, feature="gene")

#導(dǎo)入peak文件
library(ChIPpeakAnno)
packagePath <- system.file("extdata", package = "ChIPpeakAnno")
dir(packagePath, "gff|bed|narrowPeak|broadPeak|gz")
#導(dǎo)入峰的GFF文件
toGRanges(file.path(packagePath, "GFF_peaks.gff"), format = "GFF")
#導(dǎo)入bed文件
toGRanges(file.path(packagePath, "WS220.bed"), format = "BED")
#導(dǎo)入narrowpeak
toGRanges(file.path(packagePath, "peaks.narrowPeak"), format = "narrowPeak")
#導(dǎo)入broadpeak
toGRanges(file.path(packagePath, "TAF.broadPeak"), format = "broadPeak")

上述介紹了如何導(dǎo)入我們需要的文件
接下來就可以進(jìn)行注釋了

#以narrowpeak為例
packagePath <- system.file("extdata", "macs", package = "ChIPseqStepByStep")
macs2.files <- dir(packagePath, pattern="*.q1_peaks.narrowPeak$")
peaks <- sapply(macs2.files, function(.ele) 
    toGRanges(file.path(packagePath, .ele), format="narrowPeak"))

# 尋找最近的TSS
anno <- annotatePeakInBatch(gr1, 
                            AnnotationData=annoData)
head(anno, n=2)

差異peak分析

類似于RNA-seq的差異分析一樣,我們可以尋找差異binding site
DiffBind
文件是根據(jù)實(shí)驗(yàn)設(shè)計(jì)和數(shù)據(jù)存儲(chǔ)地址等信息創(chuàng)建的一個(gè)csv格式文件扎谎,包含的表頭信息有"SampleID"碳想、 "Tissue"、 "Factor"胧奔、 "Condition" 、"Treatment"老充、"Replicate" 、"bamReads" 啡浊、"ControlID"、 "bamControl" "Peaks"巷嚣、 "PeakCaller"(bam,peak文件分別在比對(duì)和call peak的步驟產(chǎn)生)
http://www.reibang.com/p/f849bd55ac27

library(DiffBind)
## 準(zhǔn)備好樣品文件
samples <- read.csv(file.path(system.file("extra", package="DiffBind"), 
                              "tamoxifen.csv"))
samples[1:2, ]
pf <- system.file("extra", package="DiffBind")
samples$bamReads <- file.path(pf, samples$bamReads)
samples$bamControl <- file.path(pf, samples$bamControl)
samples$Peaks <- file.path(pf, samples$Peaks)
tmpfile <- tempfile()
write.csv(samples, tmpfile)

##讀取文件
tamoxifen <- dba(sampleSheet=tmpfile)

##查看樣品間的關(guān)系
plot(tamoxifen)
##計(jì)數(shù)
tamoxifen <- dba.count(tamoxifen, summits=250) ##只對(duì)峰上下游250bp(總計(jì)500bp)進(jìn)行計(jì)數(shù)
##差異分析
tamoxifen <- dba.contrast(tamoxifen, categories=DBA_CONDITION) ##比對(duì)的條件為samples中的Condition列
##因?yàn)闆]有bam文件,所以這個(gè)例子其實(shí)并不能跑起來
tamoxifen <- dba.analyze(tamoxifen)
##提取結(jié)果
tamoxifen.DB <- dba.report(tamoxifen)

這個(gè)包的詳細(xì)教程:http://www.bioconductor.org/packages/release/bioc/vignettes/DiffBind/inst/doc/DiffBind.pdf
其中輸入文件為:

csaw

library(csaw)
## 1. Loading in data from BAM files.
library(csaw)
param <- readParam(minq=50)
data <- windowCounts(bam.files, ext=110, width=10, param=param)
## 2. Filtering out uninteresting regions.
library(edgeR)
keep <- aveLogCPM(asDGEList(data)) >= -1
data <- data[keep,]
## 3. Calculating normalization factors.
binned <- windowCounts(bam.files, bin=TRUE, width=10000, param=param)
data <- normOffsets(binned, se.out=data)
## 4. Identifying DB windows.
y <- asDGEList(data)
y <- estimateDisp(y, design)
fit <- glmQLFit(y, design, robust=TRUE)
results <- glmQLFTest(fit)
## 5. Correcting for multiple testing.
merged <- mergeWindows(rowRanges(data), tol=1000L)
tabcom <- combineTests(merged$id, results$table)
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末廷粒,一起剝皮案震驚了整個(gè)濱河市窘拯,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌坝茎,老刑警劉巖涤姊,帶你破解...
    沈念sama閱讀 218,451評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異嗤放,居然都是意外死亡思喊,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,172評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門次酌,熙熙樓的掌柜王于貴愁眉苦臉地迎上來恨课,“玉大人,你說我怎么就攤上這事岳服〖凉” “怎么了?”我有些...
    開封第一講書人閱讀 164,782評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵吊宋,是天一觀的道長(zhǎng)纲辽。 經(jīng)常有香客問我,道長(zhǎng)璃搜,這世上最難降的妖魔是什么文兑? 我笑而不...
    開封第一講書人閱讀 58,709評(píng)論 1 294
  • 正文 為了忘掉前任,我火速辦了婚禮腺劣,結(jié)果婚禮上绿贞,老公的妹妹穿的比我還像新娘。我一直安慰自己橘原,他們只是感情好籍铁,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,733評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著趾断,像睡著了一般拒名。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上芋酌,一...
    開封第一講書人閱讀 51,578評(píng)論 1 305
  • 那天增显,我揣著相機(jī)與錄音,去河邊找鬼脐帝。 笑死同云,一個(gè)胖子當(dāng)著我的面吹牛糖权,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播炸站,決...
    沈念sama閱讀 40,320評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼星澳,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了旱易?” 一聲冷哼從身側(cè)響起禁偎,我...
    開封第一講書人閱讀 39,241評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎阀坏,沒想到半個(gè)月后如暖,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,686評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡忌堂,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,878評(píng)論 3 336
  • 正文 我和宋清朗相戀三年盒至,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片浸船。...
    茶點(diǎn)故事閱讀 39,992評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡李命,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出黔州,到底是詐尸還是另有隱情,我是刑警寧澤流妻,帶...
    沈念sama閱讀 35,715評(píng)論 5 346
  • 正文 年R本政府宣布绅这,位于F島的核電站在辆,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏匆篓。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,336評(píng)論 3 330
  • 文/蒙蒙 一箩张、第九天 我趴在偏房一處隱蔽的房頂上張望先慷。 院中可真熱鬧,春花似錦熟掂、人聲如沸扎拣。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,912評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽刊愚。三九已至,卻和暖如春鸥诽,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背拳昌。 一陣腳步聲響...
    開封第一講書人閱讀 33,040評(píng)論 1 270
  • 我被黑心中介騙來泰國(guó)打工炬藤, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人沈矿。 一個(gè)月前我還...
    沈念sama閱讀 48,173評(píng)論 3 370
  • 正文 我出身青樓羹膳,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親陵像。 傳聞我的和親對(duì)象是個(gè)殘疾皇子犀填,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,947評(píng)論 2 355