Analyzing RNA-seq data with DESeq2(三)

假期結(jié)束啦U饩础:蕉帷!4尥俊Q羝!冷蚂!

在將數(shù)據(jù)導(dǎo)入并完成構(gòu)建DESeqDataSet 后缭保,我們需要先對數(shù)據(jù)進行初步過濾和整理,之后才可以根據(jù)我們的目的來進行數(shù)據(jù)挖掘(這個詞聽起來好高大上啊蝙茶,哈哈哈)艺骂。

Analyzing RNA-seq data with DESeq2(一)
Analyzing RNA-seq data with DESeq2(二)
Analyzing RNA-seq data with DESeq2(三)
Analyzing RNA-seq data with DESeq2(四)
Analyzing RNA-seq data with DESeq2(五)

Pre-filtering

(過濾低count的gene)

首先我們將以是每個gene最低對應(yīng)10個reads數(shù)(這里作為舉例)作為最低值對數(shù)據(jù)進行過濾。

Here we perform a minimal pre-filtering to keep only rows that have at least 10 reads total. Note that more strict filtering to increase power is automatically applied via independent filtering on the mean of normalized counts within the results function.

keep <- rowSums(counts(dds)) >= 10
dds <- dds[keep,]
##過濾掉小于10個reads數(shù)的gene

看看初步過濾后變成了什么樣子:

> dds
class: DESeqDataSet 
dim: 9921 7 
metadata(1): version
assays(1): counts
rownames(9921): FBgn0000008 FBgn0000014 ... FBgn0261574 FBgn0261575
rowData names(1): gene
colnames(7): treated1 treated2 ... untreated3 untreated4
colData names(2): condition type

可以看到行數(shù)(gene數(shù))由原來的14599個降到9921個

這里需要說明的是:

盡管在使用DESeq2函數(shù)前過濾低count的gene并不是必須的隆夯,但預(yù)過濾數(shù)據(jù)的好處是钳恕,去除那些只有很少reads的行以后,可以減少dds的存儲蹄衷,從而極高程序運行速度忧额。

Note on factor levels

(關(guān)于因子水平的說明)

默認情況下,R會根據(jù)字母順序為factor選擇參考水平愧口,如果沒有事前定義DESeq2函數(shù)按照什么順序進行比較的話(例如誰是對照組睦番、誰是實驗組),那將會默認按照字母順序進行排序耍属。
為了避免這種問題發(fā)生我們可以這么做:

##方法一:factor levels:寫在前面的level作為參照
dds$condition <- factor(dds$condition, levels = c("untreated","treated"))

##方法二:使用relevel函數(shù)
dds$condition <- relevel(dds$condition, ref = "untreated")
> dds$condition
[1] treated   treated   treated   untreated untreated untreated untreated
Levels: untreated treated

另外如果數(shù)據(jù)中有一組level是沒有樣品對應(yīng)的托嚣,可以使用droplevels函數(shù)去除。
拓展:根據(jù)這個功能我們也可以使用該函數(shù)來進行子集的選擇處理**

dds$condition <- droplevels(dds$condition)

Collapsing(合并) technical replicates

DESeq2提供了一個collapseReplicates函數(shù)來把技術(shù)重復(fù)的樣本數(shù)據(jù)合并到表達矩陣的一個列中厚骗。

The term technical replicate implies multiple sequencing runs of the same library.

注意:

對于生物學(xué)重復(fù)不能使用該方法去除

后面開始真正的大活咯W⒁妗!溯捆!

下次見咯( ^ . ^ )

大家一起學(xué)習(xí)討論鴨丑搔!

來一杯!
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
禁止轉(zhuǎn)載提揍,如需轉(zhuǎn)載請通過簡信或評論聯(lián)系作者啤月。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市劳跃,隨后出現(xiàn)的幾起案子谎仲,更是在濱河造成了極大的恐慌,老刑警劉巖刨仑,帶你破解...
    沈念sama閱讀 219,427評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件郑诺,死亡現(xiàn)場離奇詭異夹姥,居然都是意外死亡,警方通過查閱死者的電腦和手機辙诞,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,551評論 3 395
  • 文/潘曉璐 我一進店門辙售,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人飞涂,你說我怎么就攤上這事旦部。” “怎么了较店?”我有些...
    開封第一講書人閱讀 165,747評論 0 356
  • 文/不壞的土叔 我叫張陵士八,是天一觀的道長。 經(jīng)常有香客問我梁呈,道長婚度,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,939評論 1 295
  • 正文 為了忘掉前任官卡,我火速辦了婚禮陕见,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘味抖。我一直安慰自己评甜,他們只是感情好,可當我...
    茶點故事閱讀 67,955評論 6 392
  • 文/花漫 我一把揭開白布仔涩。 她就那樣靜靜地躺著忍坷,像睡著了一般。 火紅的嫁衣襯著肌膚如雪熔脂。 梳的紋絲不亂的頭發(fā)上佩研,一...
    開封第一講書人閱讀 51,737評論 1 305
  • 那天,我揣著相機與錄音霞揉,去河邊找鬼旬薯。 笑死,一個胖子當著我的面吹牛适秩,可吹牛的內(nèi)容都是我干的绊序。 我是一名探鬼主播,決...
    沈念sama閱讀 40,448評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼秽荞,長吁一口氣:“原來是場噩夢啊……” “哼骤公!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起扬跋,我...
    開封第一講書人閱讀 39,352評論 0 276
  • 序言:老撾萬榮一對情侶失蹤阶捆,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體洒试,經(jīng)...
    沈念sama閱讀 45,834評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡倍奢,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,992評論 3 338
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了垒棋。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片卒煞。...
    茶點故事閱讀 40,133評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖捕犬,靈堂內(nèi)的尸體忽然破棺而出跷坝,到底是詐尸還是另有隱情酵镜,我是刑警寧澤碉碉,帶...
    沈念sama閱讀 35,815評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站淮韭,受9級特大地震影響垢粮,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜靠粪,卻給世界環(huán)境...
    茶點故事閱讀 41,477評論 3 331
  • 文/蒙蒙 一蜡吧、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧占键,春花似錦昔善、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,022評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至牲距,卻和暖如春返咱,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背牍鞠。 一陣腳步聲響...
    開封第一講書人閱讀 33,147評論 1 272
  • 我被黑心中介騙來泰國打工咖摹, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人难述。 一個月前我還...
    沈念sama閱讀 48,398評論 3 373
  • 正文 我出身青樓萤晴,卻偏偏與公主長得像,于是被迫代替她去往敵國和親胁后。 傳聞我的和親對象是個殘疾皇子硫眯,可洞房花燭夜當晚...
    茶點故事閱讀 45,077評論 2 355