12高通量測(cè)序-DESeq2文庫(kù)標(biāo)準(zhǔn)化

DESeq2文庫(kù)標(biāo)準(zhǔn)化

問題1:調(diào)整文庫(kù)大小的差異

樣本1的read是樣本2的一半,樣本2中每個(gè)基因的read是樣本1的兩倍焕毫。這種差異不是生物學(xué)造成的禽翼,而是測(cè)序深度造成的扣墩。RPKM,F(xiàn)PKM鞍爱,TPM和CPM都處理這個(gè)問題。

image-20210105152717127.png

問題2:調(diào)整文庫(kù)組成的差異

RNA-seq(和其他高通量測(cè)序)經(jīng)常被用來比較一種組織類型和另一種組織類型专酗。例如睹逃,肝臟vs脾臟。這可能是因?yàn)楦闻K中轉(zhuǎn)錄有很多肝臟特異性基因,而脾臟中卻沒有沉填。這是一個(gè)不同的文庫(kù)組成(library composition)的例子,你也可以想象疗隶,如果你敲除一個(gè)轉(zhuǎn)錄因子,在同一種組織類型中翼闹,你會(huì)發(fā)現(xiàn)不同的文庫(kù)組成斑鼻。

在這個(gè)例子中,兩個(gè)文庫(kù)有相同的大小(read)猎荠,現(xiàn)在坚弱,假設(shè)所有基因的表達(dá)都是一樣的,只有一個(gè)例外关摇。假設(shè)只有樣本1轉(zhuǎn)錄A2M, 這意味著樣本1中A2M消耗掉的563個(gè)reads,這563reads將會(huì)分布到樣本2中的其他基因上荒叶。在樣本2中,除了A2M之外输虱,所有的reads都非常高些楣。然而,唯一的差異表達(dá)基因是A2M宪睹。

image-20210105153817941.png

上傳失敗...(image-dfdecb-1610511799293)

編寫DESeq2(和edgeR)的人意識(shí)到他們的工具將用于各種類型的數(shù)據(jù)集戈毒,所以他們希望他們的標(biāo)準(zhǔn)化去處理:

  • 問題1:調(diào)整文庫(kù)大小的差異

  • 問題2:調(diào)整文庫(kù)組成的差異

我們將從一個(gè)小數(shù)據(jù)集開始,說明DESeq2如何縮放(scale)不同的樣本横堡。目標(biāo)是為每個(gè)樣本計(jì)算一個(gè)標(biāo)準(zhǔn)化因子(scaling factor)埋市。標(biāo)準(zhǔn)化因子必須考慮到read depth和library composition。

第一步:對(duì)全部值取log

  • DESeq2使用了log(“以e為底的log”)

  • DESeq2可以使用log2或log10命贴,但在R中l(wèi)oge默認(rèn)值道宅。

  • 注意log(0) =-∞,這是因?yàn)镽定義log(0)等于-∞胸蛛。

第二步:每行取平均值

  • 任何時(shí)候你把一個(gè)數(shù)字加到無窮(或-無窮)你會(huì)得到無窮(或-無窮)污茵,這就是為什么這是負(fù)無窮。因?yàn)镚ene1是負(fù)無窮葬项,所以平均值也是負(fù)無窮泞当。

  • 對(duì)數(shù)值的平均值有一件很酷的事情,那就是這個(gè)平均值不容易被異常值所影響民珍。同理襟士,我們可以看Gene3,存在異常值嚷量,取對(duì)數(shù)后陋桂,影響減小。

image-20210105155548099.png

第三步:過濾掉值為負(fù)無窮的基因

  • 一般來說蝶溶,這一步在一個(gè)或多個(gè)樣本中過濾掉read為零的基因嗜历。

  • 如果你在比較肝臟和脾臟,這將去除所有只在肝臟(或脾臟)轉(zhuǎn)錄的基因。

  • 理論上梨州,這有助于將標(biāo)準(zhǔn)化因子集中在管家基因上——無論組織類型如何痕囱,基因轉(zhuǎn)錄水平都是相似的。

第四步:從log(counts)中減去平均對(duì)數(shù)值

  • 我們要檢查的是每個(gè)樣本讀取數(shù)與所有樣本均值的比暴匠。
image-20210105160529142.png

image-20210105160310632.png

第五步:計(jì)算每個(gè)樣本比的中位數(shù)(median)

  • 注意:使用中位數(shù)是另一種避免極端基因在一個(gè)方向上過度影響的方法

  • 表達(dá)差異較大的基因?qū)χ形粩?shù)的影響并不比表達(dá)差異較小的基因大咐蝇,因?yàn)榫哂芯薮蟛町惖幕驑O有可能是罕見的,因此巷查,這種效應(yīng)會(huì)給差異較小的和“管家”基因帶來更大的影響有序。

第六步:將中位數(shù)轉(zhuǎn)換為“正態(tài)數(shù)”,得到每個(gè)樣本的最終的標(biāo)準(zhǔn)化因子

  • 這些是對(duì)數(shù)值岛请,所以它們是指數(shù)(這里是e的指數(shù))

  • 太棒了! !我們有三個(gè)樣本的標(biāo)準(zhǔn)化因子旭寿,現(xiàn)在我們要做的就是把原始的reads除以它們。

image-20210105161816057.png

第七步:將原始reads除以標(biāo)準(zhǔn)化因子

image-20210105162034553.png
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末崇败,一起剝皮案震驚了整個(gè)濱河市盅称,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌后室,老刑警劉巖缩膝,帶你破解...
    沈念sama閱讀 222,729評(píng)論 6 517
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異岸霹,居然都是意外死亡疾层,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,226評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門贡避,熙熙樓的掌柜王于貴愁眉苦臉地迎上來痛黎,“玉大人,你說我怎么就攤上這事刮吧『ィ” “怎么了?”我有些...
    開封第一講書人閱讀 169,461評(píng)論 0 362
  • 文/不壞的土叔 我叫張陵杀捻,是天一觀的道長(zhǎng)井厌。 經(jīng)常有香客問我,道長(zhǎng)致讥,這世上最難降的妖魔是什么仅仆? 我笑而不...
    開封第一講書人閱讀 60,135評(píng)論 1 300
  • 正文 為了忘掉前任,我火速辦了婚禮拄踪,結(jié)果婚禮上蝇恶,老公的妹妹穿的比我還像新娘。我一直安慰自己惶桐,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 69,130評(píng)論 6 398
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著姚糊,像睡著了一般贿衍。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上救恨,一...
    開封第一講書人閱讀 52,736評(píng)論 1 312
  • 那天贸辈,我揣著相機(jī)與錄音,去河邊找鬼肠槽。 笑死擎淤,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的秸仙。 我是一名探鬼主播嘴拢,決...
    沈念sama閱讀 41,179評(píng)論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼寂纪!你這毒婦竟也來了席吴?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 40,124評(píng)論 0 277
  • 序言:老撾萬榮一對(duì)情侶失蹤捞蛋,失蹤者是張志新(化名)和其女友劉穎孝冒,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體拟杉,經(jīng)...
    沈念sama閱讀 46,657評(píng)論 1 320
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡庄涡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,723評(píng)論 3 342
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了搬设。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片啼染。...
    茶點(diǎn)故事閱讀 40,872評(píng)論 1 353
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖焕梅,靈堂內(nèi)的尸體忽然破棺而出迹鹅,到底是詐尸還是另有隱情,我是刑警寧澤贞言,帶...
    沈念sama閱讀 36,533評(píng)論 5 351
  • 正文 年R本政府宣布斜棚,位于F島的核電站,受9級(jí)特大地震影響该窗,放射性物質(zhì)發(fā)生泄漏弟蚀。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,213評(píng)論 3 336
  • 文/蒙蒙 一酗失、第九天 我趴在偏房一處隱蔽的房頂上張望义钉。 院中可真熱鬧,春花似錦规肴、人聲如沸捶闸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,700評(píng)論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)删壮。三九已至贪绘,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間央碟,已是汗流浹背税灌。 一陣腳步聲響...
    開封第一講書人閱讀 33,819評(píng)論 1 274
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留亿虽,地道東北人菱涤。 一個(gè)月前我還...
    沈念sama閱讀 49,304評(píng)論 3 379
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像洛勉,于是被迫代替她去往敵國(guó)和親粘秆。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,876評(píng)論 2 361

推薦閱讀更多精彩內(nèi)容