差異表達(dá)1|edgeR和DeSeq2

edgeR/DESeq2

1. 標(biāo)準(zhǔn)化:library size/composition

edgeR

1. 過濾低表達(dá)的基因

僅保留在兩個樣品或更多樣本中CPM>1的基因

CPM=Reads/(total reads in the sample/1,000,000)

問題:會受到測序深度的影響

2. 選擇一個the most average sample作為reference sample

????1. 對于每一個sample

????????1. 除以size做normalization

????????2. 選擇top25%的基因表達(dá)值(75%的基因表達(dá)<=這個值)

????2. 對上述取平均值统台,最接近這個平均值的sample就是reference sample贱勃。

????3. 對于非reference sample,分別計算scale factor

????????1. 選擇gene list

????????????1. biased genes:log fold change 仇穗,過濾掉top/down 30%

????????????2. highly/lowly transcribed in both samples:geometric mean仪缸,過濾掉top/down 5%

????????????3. 取交集

????????2. 對log2計算加權(quán)平均

????????????1. scale factor = 2 ^ (weighted average of log2 ratios)

? ? ?4. 對于所有sample的scale factors恰画,center后得到最后的scale factor

DESeq2:

1. 去掉不表達(dá)或者只在一個sample表達(dá)的基因

? ? ? ? DESeq2查看某個基因所有樣本均一化read的平均值

2. Log e (defalut:e為底)

3. 為每一個基因

????1. 計算平均值

????2. 每一個值減去平均值

4. 為每一個sample計算median

5. 將median還原成normal number,得到最終的scale factor

2. 根據(jù)模型求p-value

一般而言片林,樣本間的變異系數(shù)(coefficient of variance端盆,CV)是由兩部分組成的,一是技術(shù)差異(Technical CV)弓摘,另一個是生物學(xué)差異(Biological coefficient of variance韧献,BCV)锤窑。前者是會隨著測序通量的提升而消失的渊啰,而后者則是樣本間真實(shí)存在的差異虽抄。所以,對于一個基因g而言,它的BCV在樣本間足夠大的話车酣,就可以認(rèn)為基因g是一個差異表達(dá)基因湖员。

擬合負(fù)二項(xiàng)廣義對數(shù)線性模型娘摔,如果某個基因的表達(dá)值偏離分布模型,那么該基因?yàn)椴町惐磉_(dá)基因鸭津。

為什么使用負(fù)二項(xiàng)分布而不是泊松分布肠缨?

overdispersion: 真實(shí)數(shù)據(jù)的分布偏離泊松分布(方差=均值)晒奕,方差明顯比均值大

edgeR和后期的DeSeq2使用負(fù)二項(xiàng)式廣義模型中的NB2模型

早期的DeSeq2:the variance is determined by the smoothed function f of the mean

3. p-value矯正

BH等

參考資料:

1. [Gene expression units explained: RPM, RPKM, FPKM, TPM, DESeq, TMM, SCnorm, GeTMM, and ComBat-Seq](https://www.reneshbedre.com/blog/expression_units.html)

2. statquest: DeSeq2/edgeR共三個視頻

3. [廣義典型相關(guān)分析_廣義線性模型(GLM)概述及負(fù)二項(xiàng)回歸應(yīng)用舉例和R計算_weixin_39629467的博客-CSDN博客](https://blog.csdn.net/weixin_39629467/article/details/111341514)

4. [17. 負(fù)二項(xiàng)式模型 — 張振虎的博客 張振虎 文檔](https://zhangzhenhu.github.io/blog/glm/source/%E8%B4%9F%E4%BA%8C%E9%A1%B9%E6%A8%A1%E5%9E%8B/content.html)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市杆融,隨后出現(xiàn)的幾起案子脾歇,更是在濱河造成了極大的恐慌,老刑警劉巖焦除,帶你破解...
    沈念sama閱讀 207,113評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件乌逐,死亡現(xiàn)場離奇詭異创葡,居然都是意外死亡灿渴,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,644評論 2 381
  • 文/潘曉璐 我一進(jìn)店門缚窿,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人扫茅,你說我怎么就攤上這事畜份”ⅲ” “怎么了钙态?”我有些...
    開封第一講書人閱讀 153,340評論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經(jīng)常有香客問我驻子,道長崇呵,這世上最難降的妖魔是什么域慷? 我笑而不...
    開封第一講書人閱讀 55,449評論 1 279
  • 正文 為了忘掉前任犹褒,我火速辦了婚禮,結(jié)果婚禮上李皇,老公的妹妹穿的比我還像新娘疙赠。我一直安慰自己圃阳,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,445評論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著锣夹,像睡著了一般银萍。 火紅的嫁衣襯著肌膚如雪贴唇。 梳的紋絲不亂的頭發(fā)上戳气,一...
    開封第一講書人閱讀 49,166評論 1 284
  • 那天,我揣著相機(jī)與錄音呀袱,去河邊找鬼郑叠。 笑死锻拘,一個胖子當(dāng)著我的面吹牛署拟,可吹牛的內(nèi)容都是我干的推穷。 我是一名探鬼主播馒铃,決...
    沈念sama閱讀 38,442評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼娃殖,長吁一口氣:“原來是場噩夢啊……” “哼炉爆!你這毒婦竟也來了堕虹?” 一聲冷哼從身側(cè)響起赴捞,我...
    開封第一講書人閱讀 37,105評論 0 261
  • 序言:老撾萬榮一對情侶失蹤赦政,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后封寞,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,601評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,066評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了磅废。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,161評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖岔帽,靈堂內(nèi)的尸體忽然破棺而出犀勒,到底是詐尸還是另有隱情,我是刑警寧澤钦购,帶...
    沈念sama閱讀 33,792評論 4 323
  • 正文 年R本政府宣布,位于F島的核電站怨规,受9級特大地震影響锡足,放射性物質(zhì)發(fā)生泄漏舶得。R本人自食惡果不足惜爽蝴,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,351評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望发框。 院中可真熱鬧,春花似錦、人聲如沸铣减。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,352評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽酿秸。三九已至,卻和暖如春肝箱,著一層夾襖步出監(jiān)牢的瞬間煌张,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,584評論 1 261
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留怀泊,地道東北人误趴。 一個月前我還...
    沈念sama閱讀 45,618評論 2 355
  • 正文 我出身青樓枣申,卻偏偏與公主長得像看杭,于是被迫代替她去往敵國和親楼雹。 傳聞我的和親對象是個殘疾皇子烘豹,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,916評論 2 344

推薦閱讀更多精彩內(nèi)容