《生物信息學(xué)生R入門教程》讀書筆記 Chapter 4

這一章主要講的是Chip-seq的基本分析方法

Chip-seq

（引用原文）

ChIP-seq是使用染色質(zhì)免疫共沉淀技術(shù)將蛋白質(zhì)結(jié)合的DNA樣本測(cè)序后分析全基因組蛋白質(zhì)結(jié)合位點(diǎn)的分析方法叔收。研究對(duì)象包括轉(zhuǎn)錄因子剑鞍，組蛋白修飾分析
ChIP-seq實(shí)驗(yàn)主要分為如下幾步：
1.Sample fragmentation, 將基因組打斷
2.Immunoprecipitation, 免疫共沉淀
3.DNA purification, DNA提純
4.sequence, 測(cè)序

通常打斷的基因組有150-300bp長(zhǎng)统捶，那么我們測(cè)的是蛋白或者TF結(jié)合的那個(gè)片段修然，當(dāng)這些reads被mapping回到基因組上時(shí)，就會(huì)形成一個(gè)peak萍桌，那么peak的位置即為結(jié)合的部分

常用的軟件有：
1.mapping： bowtie1/2, Rsubread
2.peak calling：CCAT, SICER, MACS, ZINBA, BayesPeak, chipseq, ChIPseqR, CSAR, csaw, GenoGAM, iSeq, PICS
3.Peak annotation and analysis: ChIPpeakAnno
4.Gene network building: GeneNetworkBuilder, ChIPXpress
5.Motif enrichment analysis: The MEME Suite, Homer

質(zhì)控

當(dāng)我們完成上游分析柠掂，我們可以在R里面進(jìn)行QC

library(ChIPQC)
experiment <- ChIPQC(samples)
ChIPQCreport(experiment)

峰注釋

我們call完peak以后熊杨，我們也許知道peak的位置沐兵，但是卻不知道是哪些位置的（TSS）或者功能等别垮，不過我們要下載好注釋好的包

library(TxDb.Hsapiens.UCSC.hg19.knownGene)
annoData <- toGRanges(TxDb.Hsapiens.UCSC.hg19.knownGene, feature="gene")

#導(dǎo)入peak文件
library(ChIPpeakAnno)
packagePath <- system.file("extdata", package = "ChIPpeakAnno")
dir(packagePath, "gff|bed|narrowPeak|broadPeak|gz")
#導(dǎo)入峰的GFF文件
toGRanges(file.path(packagePath, "GFF_peaks.gff"), format = "GFF")
#導(dǎo)入bed文件
toGRanges(file.path(packagePath, "WS220.bed"), format = "BED")
#導(dǎo)入narrowpeak
toGRanges(file.path(packagePath, "peaks.narrowPeak"), format = "narrowPeak")
#導(dǎo)入broadpeak
toGRanges(file.path(packagePath, "TAF.broadPeak"), format = "broadPeak")

上述介紹了如何導(dǎo)入我們需要的文件
接下來就可以進(jìn)行注釋了

#以narrowpeak為例
packagePath <- system.file("extdata", "macs", package = "ChIPseqStepByStep")
macs2.files <- dir(packagePath, pattern="*.q1_peaks.narrowPeak$")
peaks <- sapply(macs2.files, function(.ele) 
    toGRanges(file.path(packagePath, .ele), format="narrowPeak"))

# 尋找最近的TSS
anno <- annotatePeakInBatch(gr1, 
                            AnnotationData=annoData)
head(anno, n=2)

差異peak分析

類似于RNA-seq的差異分析一樣，我們可以尋找差異binding site
DiffBind
文件是根據(jù)實(shí)驗(yàn)設(shè)計(jì)和數(shù)據(jù)存儲(chǔ)地址等信息創(chuàng)建的一個(gè)csv格式文件扎谎，包含的表頭信息有"SampleID"碳想、 "Tissue"、 "Factor"胧奔、 "Condition" 、"Treatment"老充、"Replicate" 、"bamReads" 啡浊、"ControlID"、 "bamControl" "Peaks"巷嚣、 "PeakCaller"（bam,peak文件分別在比對(duì)和call peak的步驟產(chǎn)生）
http://www.reibang.com/p/f849bd55ac27

library(DiffBind)
## 準(zhǔn)備好樣品文件
samples <- read.csv(file.path(system.file("extra", package="DiffBind"), 
                              "tamoxifen.csv"))
samples[1:2, ]
pf <- system.file("extra", package="DiffBind")
samples$bamReads <- file.path(pf, samples$bamReads)
samples$bamControl <- file.path(pf, samples$bamControl)
samples$Peaks <- file.path(pf, samples$Peaks)
tmpfile <- tempfile()
write.csv(samples, tmpfile)

##讀取文件
tamoxifen <- dba(sampleSheet=tmpfile)

##查看樣品間的關(guān)系
plot(tamoxifen)
##計(jì)數(shù)
tamoxifen <- dba.count(tamoxifen, summits=250) ##只對(duì)峰上下游250bp(總計(jì)500bp)進(jìn)行計(jì)數(shù)
##差異分析
tamoxifen <- dba.contrast(tamoxifen, categories=DBA_CONDITION) ##比對(duì)的條件為samples中的Condition列
##因?yàn)闆]有bam文件，所以這個(gè)例子其實(shí)并不能跑起來
tamoxifen <- dba.analyze(tamoxifen)
##提取結(jié)果
tamoxifen.DB <- dba.report(tamoxifen)

這個(gè)包的詳細(xì)教程：http://www.bioconductor.org/packages/release/bioc/vignettes/DiffBind/inst/doc/DiffBind.pdf
其中輸入文件為：

csaw

library(csaw)
## 1. Loading in data from BAM files.
library(csaw)
param <- readParam(minq=50)
data <- windowCounts(bam.files, ext=110, width=10, param=param)
## 2. Filtering out uninteresting regions.
library(edgeR)
keep <- aveLogCPM(asDGEList(data)) >= -1
data <- data[keep,]
## 3. Calculating normalization factors.
binned <- windowCounts(bam.files, bin=TRUE, width=10000, param=param)
data <- normOffsets(binned, se.out=data)
## 4. Identifying DB windows.
y <- asDGEList(data)
y <- estimateDisp(y, design)
fit <- glmQLFit(y, design, robust=TRUE)
results <- glmQLFTest(fit)
## 5. Correcting for multiple testing.
merged <- mergeWindows(rowRanges(data), tol=1000L)
tabcom <- combineTests(merged$id, results$table)

最后編輯于：2020.02.26 10:58:13

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末廷粒，一起剝皮案震驚了整個(gè)濱河市窘拯，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌坝茎，老刑警劉巖涤姊，帶你破解...
沈念sama閱讀 218,451評(píng)論 6贊 506
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異嗤放，居然都是意外死亡思喊，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,172評(píng)論 3贊 394
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門次酌，熙熙樓的掌柜王于貴愁眉苦臉地迎上來恨课，“玉大人，你說我怎么就攤上這事岳服〖凉” “怎么了？”我有些...
開封第一講書人閱讀 164,782評(píng)論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵吊宋，是天一觀的道長(zhǎng)纲辽。經(jīng)常有香客問我，道長(zhǎng)璃搜，這世上最難降的妖魔是什么文兑？我笑而不...
開封第一講書人閱讀 58,709評(píng)論 1贊 294
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮腺劣，結(jié)果婚禮上绿贞，老公的妹妹穿的比我還像新娘。我一直安慰自己橘原，他們只是感情好籍铁，可當(dāng)我...
茶點(diǎn)故事閱讀 67,733評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著趾断，像睡著了一般拒名。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上芋酌，一...
開封第一講書人閱讀 51,578評(píng)論 1贊 305
城市分裂傳說
那天增显，我揣著相機(jī)與錄音，去河邊找鬼脐帝。笑死同云，一個(gè)胖子當(dāng)著我的面吹牛糖权，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播炸站，決...
沈念sama閱讀 40,320評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼星澳，長(zhǎng)吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來了旱易？” 一聲冷哼從身側(cè)響起禁偎，我...
開封第一講書人閱讀 39,241評(píng)論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎阀坏，沒想到半個(gè)月后如暖，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,686評(píng)論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡忌堂，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,878評(píng)論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年盒至，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片浸船。...
茶點(diǎn)故事閱讀 39,992評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡李命，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出黔州，到底是詐尸還是另有隱情，我是刑警寧澤流妻，帶...
沈念sama閱讀 35,715評(píng)論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布绅这，位于F島的核電站在辆，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏匆篓。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,336評(píng)論 3贊 330
男人毒藥：我在死后第九天來索命
文/蒙蒙一箩张、第九天我趴在偏房一處隱蔽的房頂上張望先慷。院中可真熱鬧，春花似錦熟掂、人聲如沸扎拣。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,912評(píng)論 0贊 22
一樁弒父案誉券，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽刊愚。三九已至，卻和暖如春鸥诽，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背拳昌。一陣腳步聲響...
開封第一講書人閱讀 33,040評(píng)論 1贊 270
情欲美人皮
我被黑心中介騙來泰國(guó)打工炬藤，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人沈矿。一個(gè)月前我還...
沈念sama閱讀 48,173評(píng)論 3贊 370
代替公主和親
正文我出身青樓羹膳，卻偏偏與公主長(zhǎng)得像，于是被迫代替她去往敵國(guó)和親陵像。傳聞我的和親對(duì)象是個(gè)殘疾皇子犀填，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,947評(píng)論 2贊 355