用DESeq2包來(lái)對(duì)RNA-seq數(shù)據(jù)進(jìn)行差異分析

差異分析的套路都是差不多的庙睡,大部分設(shè)計(jì)思想都是繼承l(wèi)imma這個(gè)包吼旧,DESeq2也不例外郎嫁。

DESeq2是DESeq包的更新版本捡硅,看樣子應(yīng)該不會(huì)有DESeq3了哮内,哈哈,它的設(shè)計(jì)思想就是針對(duì)count類(lèi)型的數(shù)據(jù)壮韭。

可以是任意features的count數(shù)據(jù)北发,比如對(duì)各個(gè)基因的count,或者外顯子喷屋,或者CHIP-seq的一些feature琳拨,都可以用來(lái)做差異分析。

使用這個(gè)包也是需要三個(gè)數(shù)據(jù):

  • 表達(dá)矩陣
  • 分組矩陣
  • 差異比較矩陣

總結(jié)起來(lái)三個(gè)步驟屯曹,我下面會(huì)一一講解

  • 重點(diǎn)就是構(gòu)造一個(gè)dds的對(duì)象狱庇,
  • 然后直接用DESeq函數(shù)進(jìn)行normalization處理即可,
  • 處理之后用results函數(shù)來(lái)提取差異比較結(jié)果恶耽。

讀取自己的數(shù)據(jù)

一般我們會(huì)自己讀取表達(dá)矩陣和分組信息密任,下面是一個(gè)例子:

1.  options(warn=-1)
2.  suppressMessages(library(DESeq2))
3.  suppressMessages(library(limma))
4.  suppressMessages(library(pasilla))
5.  data(pasillaGenes)
6.  exprSet=counts(pasillaGenes)
7.  head(exprSet)  ##表達(dá)矩陣如下
8.  ##             treated1fb treated2fb treated3fb untreated1fb untreated2fb
9.  ## FBgn0000003          0          0          1            0            0
10.  ## FBgn0000008         78         46         43           47           89
11.  ## FBgn0000014          2          0          0            0            0
12.  ## FBgn0000015          1          0          1            0            1
13.  ## FBgn0000017       3187       1672       1859         2445         4615
14.  ## FBgn0000018        369        150        176          288          383
15.  ##             untreated3fb untreated4fb
16.  ## FBgn0000003            0            0
17.  ## FBgn0000008           53           27
18.  ## FBgn0000014            1            0
19.  ## FBgn0000015            1            2
20.  ## FBgn0000017         2063         1711
21.  ## FBgn0000018          135          174
22.  (group_list=pasillaGenes$condition)
23.  ## [1] treated   treated   treated   untreated untreated untreated untreated
24.  ## Levels: treated untreated
25.  ##這是分組信息,7個(gè)樣本驳棱,3個(gè)處理的批什,4個(gè)未處理的對(duì)照!

第一步:構(gòu)建dds對(duì)象

那么根據(jù)這兩個(gè)數(shù)據(jù)就可以構(gòu)造dds的對(duì)象了

1.  colData <- data.frame(row.names=colnames(exprSet),  
2.  group_list=group_list
3.  )
4.  ## 這是一個(gè)復(fù)雜的方法構(gòu)造這個(gè)對(duì)象社搅!
5.  dds <-  DESeqDataSetFromMatrix(countData = exprSet,
6.  colData = colData,
7.  design =  ~ group_list)

9.  ## design 其實(shí)也是一個(gè)對(duì)象驻债,還可以通過(guò)design(dds)來(lái)繼續(xù)修改分組信息乳规,但是一般沒(méi)有必要。
10.  dds
11.  ## class: DESeqDataSet 
12.  ## dim: 14470 7 
13.  ## exptData(0):
14.  ## assays(1): counts
15.  ## rownames(14470): FBgn0000003 FBgn0000008 ... FBgn0261574
16.  ##   FBgn0261575
17.  ## rowData metadata column names(0):
18.  ## colnames(7): treated1fb treated2fb ... untreated3fb untreated4fb
19.  ## colData names(1): group_list

可以看到我們構(gòu)造的dds對(duì)象有7個(gè)樣本合呐,共14470features

從基因名可以看出暮的,是果蠅的測(cè)序數(shù)據(jù)

我們也可以直接從expressionSet這個(gè)對(duì)象構(gòu)建dds對(duì)象!

1.  library(airway)
2.  data(airway)
3.  suppressMessages(library(DESeq2))
4.  dds <-  DESeqDataSet(airway, design =  ~ cell+ dex)
5.  design(dds)  <-  ~ dex 
6.  ## 構(gòu)造好的對(duì)象還可以更改分組信息

第二步:做normalization

1.  suppressMessages(dds2 <-  DESeq(dds))  
2.  ##直接用DESeq函數(shù)即可
3.  ## 下面的代碼如果你不感興趣不需要運(yùn)行淌实,免得誤導(dǎo)你
4.  ## 就是看看normalization前面的數(shù)據(jù)分布差異
5.  rld <- rlogTransformation(dds2)  ## 得到經(jīng)過(guò)DESeq2軟件normlization的表達(dá)矩陣冻辩!
6.  exprSet_new=assay(rld)
7.  par(cex =  0.7)
8.  n.sample=ncol(exprSet)
9.  if(n.sample>40) par(cex =  0.5)
10.  cols <- rainbow(n.sample*1.2)
11.  par(mfrow=c(2,2))
12.  boxplot(exprSet, col = cols,main="expression value",las=2)
13.  boxplot(exprSet_new, col = cols,main="expression value",las=2)
14.  hist(exprSet)
15.  hist(exprSet_new)
image.png

第三步:提取差異分析結(jié)果


1.  resultsNames(dds2)
2.  ## [1] "Intercept"           "group_listtreated"   "group_listuntreated"
3.  ## 其實(shí)如果只分成了兩組,并沒(méi)有必要指定這個(gè)比較矩陣拆祈!
4.  res <- results(dds2, contrast=c("group_list","treated","untreated"))  

6.  ## 提取你想要的差異分析結(jié)果恨闪,我們這里是trt組對(duì)untrt組進(jìn)行比較
7.  resOrdered <- res[order(res$padj),]
8.  resOrdered=as.data.frame(resOrdered)
9.  head(resOrdered)
10.  ##              baseMean log2FoldChange     lfcSE      stat        pvalue
11.  ## FBgn0039155  453.2753      -4.281830 0.1919977 -22.30146 3.576174e-110
12.  ## FBgn0029167 2165.0445      -2.182745 0.1080670 -20.19807  1.017931e-90
13.  ## FBgn0035085  366.8279      -2.436860 0.1505280 -16.18875  6.054219e-59
14.  ## FBgn0029896  257.9027      -2.511257 0.1823764 -13.76964  3.881667e-43
15.  ## FBgn0034736  118.4074      -3.166392 0.2375506 -13.32933  1.562878e-40
16.  ## FBgn0040091  610.6035      -1.526400 0.1278555 -11.93848  7.457520e-33
17.  ##                      padj
18.  ## FBgn0039155 2.764025e-106
19.  ## FBgn0029167  3.933795e-87
20.  ## FBgn0035085  1.559769e-55
21.  ## FBgn0029896  7.500351e-40
22.  ## FBgn0034736  2.415897e-37
23.  ## FBgn0040091  9.606528e-30

差異分析結(jié)果很容易看懂啦!

原文來(lái)自:https://www.plob.org/article/9971.html

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末放坏,一起剝皮案震驚了整個(gè)濱河市咙咽,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌淤年,老刑警劉巖钧敞,帶你破解...
    沈念sama閱讀 206,126評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異麸粮,居然都是意外死亡溉苛,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門(mén)弄诲,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)愚战,“玉大人,你說(shuō)我怎么就攤上這事威根》锞蓿” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 152,445評(píng)論 0 341
  • 文/不壞的土叔 我叫張陵洛搀,是天一觀的道長(zhǎng)敢茁。 經(jīng)常有香客問(wèn)我,道長(zhǎng)留美,這世上最難降的妖魔是什么彰檬? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 55,185評(píng)論 1 278
  • 正文 為了忘掉前任,我火速辦了婚禮谎砾,結(jié)果婚禮上逢倍,老公的妹妹穿的比我還像新娘。我一直安慰自己景图,他們只是感情好较雕,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,178評(píng)論 5 371
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著,像睡著了一般亮蒋。 火紅的嫁衣襯著肌膚如雪扣典。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 48,970評(píng)論 1 284
  • 那天慎玖,我揣著相機(jī)與錄音贮尖,去河邊找鬼。 笑死趁怔,一個(gè)胖子當(dāng)著我的面吹牛湿硝,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播润努,決...
    沈念sama閱讀 38,276評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼关斜,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了铺浇?” 一聲冷哼從身側(cè)響起蚤吹,我...
    開(kāi)封第一講書(shū)人閱讀 36,927評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎随抠,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體繁涂,經(jīng)...
    沈念sama閱讀 43,400評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡拱她,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,883評(píng)論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了扔罪。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片秉沼。...
    茶點(diǎn)故事閱讀 37,997評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖矿酵,靈堂內(nèi)的尸體忽然破棺而出唬复,到底是詐尸還是另有隱情,我是刑警寧澤全肮,帶...
    沈念sama閱讀 33,646評(píng)論 4 322
  • 正文 年R本政府宣布敞咧,位于F島的核電站,受9級(jí)特大地震影響辜腺,放射性物質(zhì)發(fā)生泄漏休建。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,213評(píng)論 3 307
  • 文/蒙蒙 一评疗、第九天 我趴在偏房一處隱蔽的房頂上張望测砂。 院中可真熱鬧,春花似錦百匆、人聲如沸砌些。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,204評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)存璃。三九已至仑荐,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間有巧,已是汗流浹背释漆。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,423評(píng)論 1 260
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留篮迎,地道東北人男图。 一個(gè)月前我還...
    沈念sama閱讀 45,423評(píng)論 2 352
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像甜橱,于是被迫代替她去往敵國(guó)和親逊笆。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,722評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容