unwanted sources of variation:
1.線粒體基因的干擾
2.細(xì)胞周期基因的干擾
seurat 包里有clear out cell cycle genes effect 的影響:
https://satijalab.org/seurat/v3.0/cell_cycle_vignette.html
細(xì)胞周期階段的異質(zhì)性葵袭,特別是有絲分裂細(xì)胞在S期和G2/M期之間的過渡讥巡,驅(qū)動(dòng)大量的轉(zhuǎn)錄組變異盯捌,從而掩蓋生物信號(hào)。
為了減輕這種影響,我們使用了兩步方法:
1)使用已知階段特異性marker gene的監(jiān)督分析量化每個(gè)細(xì)胞的細(xì)胞周期階段;
2)用與上述相同的負(fù)二項(xiàng)回歸回歸細(xì)胞周期階段的影響诫龙。
第一步伤极,我們使用先前發(fā)表的細(xì)胞周期相關(guān)基因列表(43S期基因,54 G2/M期基因)進(jìn)行富集分析蜕便,類似于文獻(xiàn)11中提出的方法劫恒。
對(duì)于每個(gè)細(xì)胞,我們將相特異性基因表達(dá)的總和(log10轉(zhuǎn)化UMIs)與100個(gè)隨機(jī)背景基因集的分布進(jìn)行比較轿腺,其中背景基因的數(shù)量與相基因集相同两嘴,背景基因從相同的表達(dá)箱中提取。表達(dá)式箱由50個(gè)相同范圍的非重疊窗口基于log10(平均UMI)定義族壳。相特異性富集分?jǐn)?shù)是相對(duì)于背景基因集的均值和標(biāo)準(zhǔn)差的表達(dá)z分?jǐn)?shù)憔辫。我們最終的“細(xì)胞周期評(píng)分”(擴(kuò)展數(shù)據(jù)圖1)是s期評(píng)分與G2/ m期評(píng)分的差異。
對(duì)于最終剔除細(xì)胞周期效應(yīng)的歸一化數(shù)據(jù)集仿荆,我們以技術(shù)因素和細(xì)胞周期評(píng)分作為預(yù)測(cè)因子贰您,進(jìn)行負(fù)二項(xiàng)回歸。雖然細(xì)胞周期活動(dòng)是從下游分析的數(shù)據(jù)中回歸出來的拢操,但我們?cè)诨貧w之前存儲(chǔ)了計(jì)算出的細(xì)胞周期得分锦亦,使我們能夠記住每個(gè)細(xì)胞的有絲分裂階段。值得注意的是令境,我們的回歸策略是為了減輕有絲分裂細(xì)胞在不同階段的轉(zhuǎn)錄異質(zhì)性的影響杠园,并且不應(yīng)該影響有絲分裂細(xì)胞和非有絲分裂細(xì)胞之間可能具有生物學(xué)意義的整體差異。
我真是被自己蠢哭
現(xiàn)找了一種方法舔庶,先做一遍抛蚁,明天再和組里討論玲昧。
轉(zhuǎn)自:https://mp.weixin.qq.com/s/NcjHO0tVS583gvyW3xnhwA
還有 Jimmy 的
http://www.reibang.com/p/aa867c3c12de