單細(xì)胞36計之14借尸還魂---細(xì)胞周期評分和回歸

第十四計 借尸還魂
迷信人認(rèn)為人死后靈魂可附著于別人的尸體而復(fù)活厢岂。后用以比喻已經(jīng)消滅或沒落的事物绳瘟,又假托別的名義或以另一種形式重新出現(xiàn)易茬。此言兵法,是說兵家要善于抓住一切機(jī)會萧吠,甚至是看去無什用處的東西左冬,努力爭取主動,壯大自己纸型,即時利用而轉(zhuǎn)不利為有利拇砰,乃至轉(zhuǎn)敗為勝。

我們演示了如何通過基于規(guī)范性標(biāo)記計算細(xì)胞周期階段評分并在預(yù)處理過程中將其從數(shù)據(jù)中回歸來減輕scRNA-seq數(shù)據(jù)中細(xì)胞周期異質(zhì)性的影響狰腌。我們在鼠類造血祖細(xì)胞的數(shù)據(jù)集上進(jìn)行了證明(Nestorowa等人除破,Blood 2016)。您可以在此處下載運(yùn)行此小插圖所需的文件癌别。

library(Seurat)

# Read in the expression matrix The first row is a header row, the first column is rownames
exp.mat <- read.table(file = "../data/nestorawa_forcellcycle_expressionMatrix.txt", header = TRUE, 
    as.is = TRUE, row.names = 1)

# A list of cell cycle markers, from Tirosh et al, 2015, is loaded with Seurat.  We can
# segregate this list into markers of G2/M phase and markers of S phase
s.genes <- cc.genes$s.genes
g2m.genes <- cc.genes$g2m.genes

# Create our Seurat object and complete the initalization steps
marrow <- CreateSeuratObject(counts = exp.mat)
marrow <- NormalizeData(marrow)
marrow <- FindVariableFeatures(marrow, selection.method = "vst")
marrow <- ScaleData(marrow, features = rownames(marrow))

如果我們使用FindVariableFeatures()`上面發(fā)現(xiàn)的可變基因在我們的對象上運(yùn)行PCA 皂岔,我們會看到,雖然大多數(shù)差異可以通過譜系來解釋展姐,但PC8和PC10會在包括TOP2AMKI67的細(xì)胞周期基因上分裂。我們將嘗試從數(shù)據(jù)中回歸該信號剖毯,以使細(xì)胞周期異質(zhì)性不會有助于PCA或下游分析圾笨。

marrow <- RunPCA(marrow, features = VariableFeatures(marrow), ndims.print = 6:10, nfeatures.print = 10)
## PC_ 6 
## Positive:  SELL, ARL6IP1, CCL9, CD34, ADGRL4, BPIFC, NUSAP1, FAM64A, CD244, C030034L19RIK 
## Negative:  LY6C2, AA467197, CYBB, MGST2, ITGB2, PF4, CD74, ATP1B1, GP1BB, TREM3 
## PC_ 7 
## Positive:  HDC, CPA3, PGLYRP1, MS4A3, NKG7, UBE2C, CCNB1, NUSAP1, PLK1, FUT8 
## Negative:  F13A1, LY86, CFP, IRF8, CSF1R, TIFAB, IFI209, CCR2, TNS4, MS4A6C 
## PC_ 8 
## Positive:  NUSAP1, UBE2C, KIF23, PLK1, CENPF, FAM64A, CCNB1, H2AFX, ID2, CDC20 
## Negative:  WFDC17, SLC35D3, ADGRL4, VLDLR, CD33, H2AFY, P2RY14, IFI206, CCL9, CD34 
## PC_ 9 
## Positive:  IGKC, JCHAIN, LY6D, MZB1, CD74, IGLC2, FCRLA, IGKV4-50, IGHM, IGHV9-1 
## Negative:  SLC2A6, HBA-A1, HBA-A2, IGHV8-7, FCER1G, F13A1, HBB-BS, PLD4, HBB-BT, IGFBP4 
## PC_ 10 
## Positive:  CTSW, XKRX, PRR5L, RORA, MBOAT4, A630014C17RIK, ZFP105, COL9A3, CLEC2I, TRAT1 
## Negative:  H2AFX, FAM64A, ZFP383, NUSAP1, CDC25B, CENPF, GBP10, TOP2A, GBP6, GFRA1
DimHeatmap(marrow, dims = c(8, 10))
image

分配細(xì)胞周期分?jǐn)?shù)

首先,我們根據(jù)每個細(xì)胞的G2 / M和S期標(biāo)志物的表達(dá)為其分配分?jǐn)?shù)逊谋。這些標(biāo)記物組在表達(dá)水平上應(yīng)該是反相關(guān)的擂达,并且不表達(dá)它們的細(xì)胞可能不會循環(huán)并處于G1期。

我們在CellCycleScoring()函數(shù)中分配分?jǐn)?shù)胶滋,該函數(shù)將S和G2 / M分?jǐn)?shù)存儲在對象元數(shù)據(jù)中板鬓,以及G2M,S或G1階段中每個單元格的預(yù)測分類究恤。CellCycleScoring()也可以通過傳遞將Seurat對象的標(biāo)識設(shè)置為細(xì)胞周期階段set.ident = TRUE(原始標(biāo)識存儲為old.ident)俭令。請注意,Seurat在下游細(xì)胞周期回歸中不使用離散分類(G2M / G1 / S)部宿。相反抄腔,它使用G2M和S期的定量評分。但是理张,如果有興趣赫蛇,我們會提供預(yù)測的分類。

marrow <- CellCycleScoring(marrow, s.features = s.genes, g2m.features = g2m.genes, set.ident = TRUE)

# view cell cycle scores and phase assignments
head(marrow[[]])
##          orig.ident nCount_RNA nFeature_RNA     S.Score  G2M.Score Phase
## Prog_013       Prog    2563089        10211 -0.14248691 -0.4680395    G1
## Prog_019       Prog    3030620         9991 -0.16915786  0.5851766   G2M
## Prog_031       Prog    1293487        10192 -0.34627038 -0.3971879    G1
## Prog_037       Prog    1357987         9599 -0.44270212  0.6820229   G2M
## Prog_008       Prog    4079891        10540  0.55854051  0.1284359     S
## Prog_014       Prog    2569783        10788  0.07116218  0.3166073   G2M
##          old.ident
## Prog_013      Prog
## Prog_019      Prog
## Prog_031      Prog
## Prog_037      Prog
## Prog_008      Prog
## Prog_014      Prog
# Visualize the distribution of cell cycle markers across
RidgePlot(marrow, features = c("PCNA", "TOP2A", "MCM6", "MKI67"), ncol = 2)
image
# Running a PCA on cell cycle genes reveals, unsurprisingly, that cells separate entirely by
# phase
marrow <- RunPCA(marrow, features = c(s.genes, g2m.genes))
DimPlot(marrow)
image

我們根據(jù)Tirosh等人描述的評分策略對單個細(xì)胞評分雾叭。2016悟耘。有關(guān)`?AddModuleScore()更多信息,請參見Seurat织狐。此功能可用于計算任何基因列表的監(jiān)督模塊評分暂幼。

在數(shù)據(jù)縮放期間回歸出細(xì)胞周期得分

現(xiàn)在掘殴,我們嘗試從數(shù)據(jù)中減去(“回歸”)這種異質(zhì)性來源。對于Seurat v1.4的用戶粟誓,此功能已在中實現(xiàn)RegressOut奏寨。但是,由于此過程的結(jié)果存儲在縮放后的數(shù)據(jù)槽中(因此將覆蓋的輸出ScaleData())鹰服,因此我們現(xiàn)在將此功能合并到ScaleData()`函數(shù)本身中病瞳。

對于每個基因,Seurat建谋幔基因表達(dá)與S和G2M細(xì)胞周期得分之間的關(guān)系套菜。該模型的比例殘差表示“校正”的表達(dá)矩陣,可將其用于下游以進(jìn)行尺寸縮減设易。

marrow <- ScaleData(marrow, vars.to.regress = c("S.Score", "G2M.Score"), features = rownames(marrow))
# Now, a PCA on the variable genes no longer returns components associated with cell cycle
marrow <- RunPCA(marrow, features = VariableFeatures(marrow), nfeatures.print = 10)
## PC_ 1 
## Positive:  BLVRB, CAR2, KLF1, AQP1, CES2G, ERMAP, CAR1, FAM132A, RHD, SPHK1 
## Negative:  TMSB4X, H2AFY, CORO1A, PLAC8, EMB, MPO, PRTN3, CD34, LCP1, BC035044 
## PC_ 2 
## Positive:  ANGPT1, ADGRG1, MEIS1, ITGA2B, MPL, DAPP1, APOE, RAB37, GATA2, F2R 
## Negative:  LY6C2, ELANE, HP, IGSF6, ANXA3, CTSG, CLEC12A, TIFAB, SLPI, ALAS1 
## PC_ 3 
## Positive:  APOE, GATA2, NKG7, MUC13, MS4A3, RAB44, HDC, CPA3, FCGR3, TUBA8 
## Negative:  FLT3, DNTT, LSP1, WFDC17, MYL10, GIMAP6, LAX1, GPR171, TBXA2R, SATB1 
## PC_ 4 
## Positive:  CSRP3, ST8SIA6, DNTT, MPEG1, SCIN, LGALS1, CMAH, RGL1, APOE, MFSD2B 
## Negative:  PROCR, MPL, HLF, MMRN1, SERPINA3G, ESAM, GSTM1, D630039A03RIK, MYL10, LY6A 
## PC_ 5 
## Positive:  CPA3, LMO4, IKZF2, IFITM1, FUT8, MS4A2, SIGLECF, CSRP3, HDC, RAB44 
## Negative:  PF4, GP1BB, SDPR, F2RL2, RAB27B, SLC14A1, TREML1, PBX1, F2R, TUBA8
# When running a PCA on only cell cycle genes, cells no longer separate by cell-cycle phase
marrow <- RunPCA(marrow, features = c(s.genes, g2m.genes))
DimPlot(marrow)
image.png

由于最佳的細(xì)胞周期標(biāo)記在組織和物種之間極為保守逗柴,因此我們發(fā)現(xiàn)此程序可在各種數(shù)據(jù)集上穩(wěn)定可靠地工作。

備用工作流程

上面的過程將刪除與細(xì)胞周期相關(guān)的所有信號顿肺。在某些情況下戏溺,我們發(fā)現(xiàn)這會對下游分析產(chǎn)生負(fù)面影響,尤其是在分化過程中(如鼠類造血)屠尊,在此過程中干細(xì)胞處于靜止?fàn)顟B(tài)旷祸,分化的細(xì)胞正在增殖(反之亦然)。在這種情況下讼昆,將所有細(xì)胞周期效應(yīng)消退托享,也會使干細(xì)胞和祖細(xì)胞之間的區(qū)別變得模糊。

作為替代方案浸赫,我們建議逐步淘汰G2M和S期評分之間的差異闰围。這意味著將保持分離非循環(huán)細(xì)胞和循環(huán)細(xì)胞的信號,但是增殖細(xì)胞之間的細(xì)胞周期相位差異(通常是無趣的)將被從數(shù)據(jù)中剔除既峡。

marrow$CC.Difference <- marrow$S.Score - marrow$G2M.Score
marrow <- ScaleData(marrow, vars.to.regress = "CC.Difference", features = rownames(marrow))
# cell cycle effects strongly mitigated in PCA
marrow <- RunPCA(marrow, features = VariableFeatures(marrow), nfeatures.print = 10)
## PC_ 1 
## Positive:  BLVRB, KLF1, ERMAP, FAM132A, CAR2, RHD, CES2G, SPHK1, AQP1, SLC38A5 
## Negative:  TMSB4X, CORO1A, PLAC8, H2AFY, LAPTM5, CD34, LCP1, TMEM176B, IGFBP4, EMB 
## PC_ 2 
## Positive:  APOE, GATA2, RAB37, ANGPT1, ADGRG1, MEIS1, MPL, F2R, PDZK1IP1, DAPP1 
## Negative:  CTSG, ELANE, LY6C2, HP, CLEC12A, ANXA3, IGSF6, TIFAB, SLPI, MPO 
## PC_ 3 
## Positive:  APOE, GATA2, NKG7, MUC13, ITGA2B, TUBA8, CPA3, RAB44, SLC18A2, CD9 
## Negative:  DNTT, FLT3, WFDC17, LSP1, MYL10, LAX1, GIMAP6, IGHM, CD24A, MN1 
## PC_ 4 
## Positive:  CSRP3, ST8SIA6, SCIN, LGALS1, APOE, ITGB7, MFSD2B, RGL1, DNTT, IGHV1-23 
## Negative:  MPL, MMRN1, PROCR, HLF, SERPINA3G, ESAM, PTGS1, D630039A03RIK, NDN, PPIC 
## PC_ 5 
## Positive:  HDC, LMO4, CSRP3, IFITM1, FCGR3, HLF, CPA3, PROCR, PGLYRP1, IKZF2 
## Negative:  GP1BB, PF4, SDPR, F2RL2, TREML1, RAB27B, SLC14A1, PBX1, PLEK, TUBA8
# when running a PCA on cell cycle genes, actively proliferating cells remain distinct from G1
# cells however, within actively proliferating cells, G2M and S phase cells group together
marrow <- RunPCA(marrow, features = c(s.genes, g2m.genes))
DimPlot(marrow)
image.png
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末羡榴,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子涧狮,更是在濱河造成了極大的恐慌炕矮,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,126評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件者冤,死亡現(xiàn)場離奇詭異肤视,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)涉枫,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評論 2 382
  • 文/潘曉璐 我一進(jìn)店門邢滑,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事困后±种剑” “怎么了?”我有些...
    開封第一講書人閱讀 152,445評論 0 341
  • 文/不壞的土叔 我叫張陵摇予,是天一觀的道長汽绢。 經(jīng)常有香客問我,道長侧戴,這世上最難降的妖魔是什么宁昭? 我笑而不...
    開封第一講書人閱讀 55,185評論 1 278
  • 正文 為了忘掉前任,我火速辦了婚禮酗宋,結(jié)果婚禮上积仗,老公的妹妹穿的比我還像新娘。我一直安慰自己蜕猫,他們只是感情好寂曹,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,178評論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著回右,像睡著了一般隆圆。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上楣黍,一...
    開封第一講書人閱讀 48,970評論 1 284
  • 那天匾灶,我揣著相機(jī)與錄音,去河邊找鬼租漂。 笑死,一個胖子當(dāng)著我的面吹牛颊糜,可吹牛的內(nèi)容都是我干的哩治。 我是一名探鬼主播,決...
    沈念sama閱讀 38,276評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼衬鱼,長吁一口氣:“原來是場噩夢啊……” “哼业筏!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起鸟赫,我...
    開封第一講書人閱讀 36,927評論 0 259
  • 序言:老撾萬榮一對情侶失蹤蒜胖,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后抛蚤,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體台谢,經(jīng)...
    沈念sama閱讀 43,400評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,883評論 2 323
  • 正文 我和宋清朗相戀三年岁经,在試婚紗的時候發(fā)現(xiàn)自己被綠了朋沮。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 37,997評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡缀壤,死狀恐怖樊拓,靈堂內(nèi)的尸體忽然破棺而出纠亚,到底是詐尸還是另有隱情,我是刑警寧澤筋夏,帶...
    沈念sama閱讀 33,646評論 4 322
  • 正文 年R本政府宣布蒂胞,位于F島的核電站,受9級特大地震影響条篷,放射性物質(zhì)發(fā)生泄漏骗随。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,213評論 3 307
  • 文/蒙蒙 一拥娄、第九天 我趴在偏房一處隱蔽的房頂上張望蚊锹。 院中可真熱鬧,春花似錦稚瘾、人聲如沸牡昆。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽丢烘。三九已至,卻和暖如春些椒,著一層夾襖步出監(jiān)牢的瞬間播瞳,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評論 1 260
  • 我被黑心中介騙來泰國打工免糕, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留赢乓,地道東北人。 一個月前我還...
    沈念sama閱讀 45,423評論 2 352
  • 正文 我出身青樓石窑,卻偏偏與公主長得像牌芋,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子松逊,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,722評論 2 345

推薦閱讀更多精彩內(nèi)容