差異分析的套路都是差不多的庙睡,大部分設(shè)計(jì)思想都是繼承l(wèi)imma這個(gè)包吼旧,DESeq2也不例外郎嫁。
DESeq2是DESeq包的更新版本捡硅,看樣子應(yīng)該不會(huì)有DESeq3了哮内,哈哈,它的設(shè)計(jì)思想就是針對(duì)count類(lèi)型的數(shù)據(jù)壮韭。
可以是任意features的count數(shù)據(jù)北发,比如對(duì)各個(gè)基因的count,或者外顯子喷屋,或者CHIP-seq的一些feature琳拨,都可以用來(lái)做差異分析。
使用這個(gè)包也是需要三個(gè)數(shù)據(jù):
- 表達(dá)矩陣
- 分組矩陣
- 差異比較矩陣
總結(jié)起來(lái)三個(gè)步驟屯曹,我下面會(huì)一一講解
- 重點(diǎn)就是構(gòu)造一個(gè)dds的對(duì)象狱庇,
- 然后直接用DESeq函數(shù)進(jìn)行normalization處理即可,
- 處理之后用results函數(shù)來(lái)提取差異比較結(jié)果恶耽。
讀取自己的數(shù)據(jù)
一般我們會(huì)自己讀取表達(dá)矩陣和分組信息密任,下面是一個(gè)例子:
1. options(warn=-1)
2. suppressMessages(library(DESeq2))
3. suppressMessages(library(limma))
4. suppressMessages(library(pasilla))
5. data(pasillaGenes)
6. exprSet=counts(pasillaGenes)
7. head(exprSet) ##表達(dá)矩陣如下
8. ## treated1fb treated2fb treated3fb untreated1fb untreated2fb
9. ## FBgn0000003 0 0 1 0 0
10. ## FBgn0000008 78 46 43 47 89
11. ## FBgn0000014 2 0 0 0 0
12. ## FBgn0000015 1 0 1 0 1
13. ## FBgn0000017 3187 1672 1859 2445 4615
14. ## FBgn0000018 369 150 176 288 383
15. ## untreated3fb untreated4fb
16. ## FBgn0000003 0 0
17. ## FBgn0000008 53 27
18. ## FBgn0000014 1 0
19. ## FBgn0000015 1 2
20. ## FBgn0000017 2063 1711
21. ## FBgn0000018 135 174
22. (group_list=pasillaGenes$condition)
23. ## [1] treated treated treated untreated untreated untreated untreated
24. ## Levels: treated untreated
25. ##這是分組信息,7個(gè)樣本驳棱,3個(gè)處理的批什,4個(gè)未處理的對(duì)照!
第一步:構(gòu)建dds對(duì)象
那么根據(jù)這兩個(gè)數(shù)據(jù)就可以構(gòu)造dds的對(duì)象了
1. colData <- data.frame(row.names=colnames(exprSet),
2. group_list=group_list
3. )
4. ## 這是一個(gè)復(fù)雜的方法構(gòu)造這個(gè)對(duì)象社搅!
5. dds <- DESeqDataSetFromMatrix(countData = exprSet,
6. colData = colData,
7. design = ~ group_list)
9. ## design 其實(shí)也是一個(gè)對(duì)象驻债,還可以通過(guò)design(dds)來(lái)繼續(xù)修改分組信息乳规,但是一般沒(méi)有必要。
10. dds
11. ## class: DESeqDataSet
12. ## dim: 14470 7
13. ## exptData(0):
14. ## assays(1): counts
15. ## rownames(14470): FBgn0000003 FBgn0000008 ... FBgn0261574
16. ## FBgn0261575
17. ## rowData metadata column names(0):
18. ## colnames(7): treated1fb treated2fb ... untreated3fb untreated4fb
19. ## colData names(1): group_list
可以看到我們構(gòu)造的dds對(duì)象有7個(gè)樣本合呐,共14470features
從基因名可以看出暮的,是果蠅的測(cè)序數(shù)據(jù)
我們也可以直接從expressionSet這個(gè)對(duì)象構(gòu)建dds對(duì)象!
1. library(airway)
2. data(airway)
3. suppressMessages(library(DESeq2))
4. dds <- DESeqDataSet(airway, design = ~ cell+ dex)
5. design(dds) <- ~ dex
6. ## 構(gòu)造好的對(duì)象還可以更改分組信息
第二步:做normalization
1. suppressMessages(dds2 <- DESeq(dds))
2. ##直接用DESeq函數(shù)即可
3. ## 下面的代碼如果你不感興趣不需要運(yùn)行淌实,免得誤導(dǎo)你
4. ## 就是看看normalization前面的數(shù)據(jù)分布差異
5. rld <- rlogTransformation(dds2) ## 得到經(jīng)過(guò)DESeq2軟件normlization的表達(dá)矩陣冻辩!
6. exprSet_new=assay(rld)
7. par(cex = 0.7)
8. n.sample=ncol(exprSet)
9. if(n.sample>40) par(cex = 0.5)
10. cols <- rainbow(n.sample*1.2)
11. par(mfrow=c(2,2))
12. boxplot(exprSet, col = cols,main="expression value",las=2)
13. boxplot(exprSet_new, col = cols,main="expression value",las=2)
14. hist(exprSet)
15. hist(exprSet_new)
第三步:提取差異分析結(jié)果
1. resultsNames(dds2)
2. ## [1] "Intercept" "group_listtreated" "group_listuntreated"
3. ## 其實(shí)如果只分成了兩組,并沒(méi)有必要指定這個(gè)比較矩陣拆祈!
4. res <- results(dds2, contrast=c("group_list","treated","untreated"))
6. ## 提取你想要的差異分析結(jié)果恨闪,我們這里是trt組對(duì)untrt組進(jìn)行比較
7. resOrdered <- res[order(res$padj),]
8. resOrdered=as.data.frame(resOrdered)
9. head(resOrdered)
10. ## baseMean log2FoldChange lfcSE stat pvalue
11. ## FBgn0039155 453.2753 -4.281830 0.1919977 -22.30146 3.576174e-110
12. ## FBgn0029167 2165.0445 -2.182745 0.1080670 -20.19807 1.017931e-90
13. ## FBgn0035085 366.8279 -2.436860 0.1505280 -16.18875 6.054219e-59
14. ## FBgn0029896 257.9027 -2.511257 0.1823764 -13.76964 3.881667e-43
15. ## FBgn0034736 118.4074 -3.166392 0.2375506 -13.32933 1.562878e-40
16. ## FBgn0040091 610.6035 -1.526400 0.1278555 -11.93848 7.457520e-33
17. ## padj
18. ## FBgn0039155 2.764025e-106
19. ## FBgn0029167 3.933795e-87
20. ## FBgn0035085 1.559769e-55
21. ## FBgn0029896 7.500351e-40
22. ## FBgn0034736 2.415897e-37
23. ## FBgn0040091 9.606528e-30
差異分析結(jié)果很容易看懂啦!
原文來(lái)自:https://www.plob.org/article/9971.html