引言
在生物信息學(xué)分析中,相信目前估計(jì)樣本免疫細(xì)胞浸潤(rùn)是必不可少的歉嗓。目前,在R中有多種方法可以實(shí)現(xiàn)上述目的背蟆,例如ESTIMATE鉴分、CIBERSORT、xCell带膀、MCPcounter志珍、TIMER和ssGSEA等算法,以下是對(duì)這些算法的簡(jiǎn)單介紹垛叨。
ESTIMATE(Estimation of STromal and Immune cells in MAlignant Tumor tissues using Expression data)是一種基于基因表達(dá)數(shù)據(jù)估計(jì)腫瘤組織中免疫和間質(zhì)細(xì)胞浸潤(rùn)水平的方法伦糯。其原理為利用腫瘤組織中基因表達(dá)的信號(hào),通過估計(jì)免疫和間質(zhì)組分的相對(duì)含量,來反映免疫細(xì)胞浸潤(rùn)的程度敛纲。
CIBERSORT(Cell-type Identification By Estimating Relative Subsets Of RNA Transcripts)是一種用于定量估計(jì)復(fù)雜混合組織樣本中免疫細(xì)胞亞群的方法喂击。其原理是基于基因表達(dá)數(shù)據(jù),通過使用已知免疫細(xì)胞類型的基因表達(dá)簽名载慈,推斷樣本中免疫細(xì)胞亞群的相對(duì)比例惭等。
xCell是一種基于基因表達(dá)數(shù)據(jù)的計(jì)算工具珍手,用于預(yù)測(cè)免疫細(xì)胞類型的相對(duì)豐度办铡。其原理是通過使用已知免疫細(xì)胞類型的基因表達(dá)特征,結(jié)合機(jī)器學(xué)習(xí)算法琳要,預(yù)測(cè)樣本中免疫細(xì)胞類型的相對(duì)含量寡具。
MCPcounter(Microenvironment Cell Populations counter)通過基因表達(dá)數(shù)據(jù)對(duì)腫瘤組織中的免疫和非免疫細(xì)胞進(jìn)行定量估計(jì)。其原理是基于免疫和非免疫細(xì)胞類型的基因表達(dá)特征稚补,通過線性回歸模型童叠,估計(jì)腫瘤組織中不同細(xì)胞類型的含量。
TIMER(Tumor IMmune Estimation Resource)是一個(gè)在線工具课幕,用于估計(jì)腫瘤組織中免疫細(xì)胞浸潤(rùn)水平厦坛,并提供相應(yīng)的R軟件包。其原理是基于基因表達(dá)數(shù)據(jù)乍惊,通過統(tǒng)計(jì)方法和基于免疫細(xì)胞標(biāo)記基因的算法杜秸,估計(jì)腫瘤組織中免疫細(xì)胞的含量。
ssGSEA(single-sample gene set enrichment analysis)是一種基于基因集富集分析的方法润绎,用于評(píng)估單個(gè)樣本中的免疫細(xì)胞浸潤(rùn)程度撬碟。其原理為通過將樣本的基因表達(dá)數(shù)據(jù)與預(yù)定義的免疫細(xì)胞相關(guān)基因集進(jìn)行比較,計(jì)算樣本中各免疫細(xì)胞類型的富集得分莉撇。
當(dāng)然呢蛤,以上算法的使用對(duì)象主要基于人,那如何實(shí)現(xiàn)小鼠樣本的免疫細(xì)胞浸潤(rùn)估計(jì)呢棍郎?今天我們向大家介紹一個(gè)R包—mMCP-counter其障,可以通過小鼠的基因表達(dá)矩陣來估計(jì)樣本中組織浸潤(rùn)免疫細(xì)胞和基質(zhì)細(xì)胞的豐度。其實(shí)這項(xiàng)工作已于2020年發(fā)表于Genome Medicine涂佃。
我們只需要提供自己測(cè)序樣本的表達(dá)矩陣励翼,進(jìn)行簡(jiǎn)單的標(biāo)準(zhǔn)化之后就可以估計(jì)每個(gè)樣本中免疫細(xì)胞和基質(zhì)細(xì)胞的浸潤(rùn)情況,運(yùn)行速度很快巡李,輸出結(jié)果為數(shù)據(jù)框抚笔,可以供我們進(jìn)一步可視化。
我們主要看看mMCP-counter的工作原理以及實(shí)際操作侨拦。
背景
對(duì)于許多疾病殊橙,如炎癥性疾病或癌癥,準(zhǔn)確確定疾病發(fā)展過程中組織中的細(xì)胞組成(免疫和間質(zhì)細(xì)胞種群)通常至關(guān)重要。有多種方法可從人體樣本中獲取這些數(shù)據(jù)膨蛮,包括IHC或FCM叠纹,或通過轉(zhuǎn)錄組學(xué)數(shù)據(jù)進(jìn)行估計(jì)。
對(duì)于腫瘤研究敞葛,分析組織中的免疫和間質(zhì)組成尤為重要誉察。事實(shí)上,腫瘤是高度異質(zhì)的組織惹谐,有各種免疫和間質(zhì)細(xì)胞浸潤(rùn)持偏。研究表明,免疫細(xì)胞浸潤(rùn)密度通常與疾病預(yù)后有關(guān)氨肌。例如鸿秆,在大多數(shù)癌癥中,CD8+ T細(xì)胞浸潤(rùn)密度與患者的生存期延長(zhǎng)相關(guān)怎囚,而極化為M2表型的巨噬細(xì)胞通常與不良預(yù)后相關(guān)卿叽。
組織樣本的轉(zhuǎn)錄組測(cè)序可以得到樣本中所有細(xì)胞的基因的平均表達(dá)情況。由于一些基因在特定細(xì)胞亞群中獨(dú)特表達(dá)恳守,因此可以利用它們的表達(dá)量來確定潛在細(xì)胞亞群的豐度考婴。基于這一特點(diǎn)催烘,作者既往開發(fā)了MCP-counter算法沥阱,用于定量人體組織中的免疫浸潤(rùn),并且該算法具有良好的表現(xiàn)性能颗圣。
雖然小鼠模型被廣泛用于解析各種疾苍印(包括炎癥性疾病和癌癥)的病理生理機(jī)制,但與人體樣本相比在岂,目前用于測(cè)量小鼠組織免疫和間質(zhì)細(xì)胞組成的計(jì)算方法非常有限奔则,如DCQ(Digital Cell Quantification)和基于CIBERSORT算法改進(jìn)的ImmuCC算法等。
因此蔽午,作者基于MCP-counter方法開發(fā)了適用于小鼠免疫和基質(zhì)細(xì)胞組成估計(jì)的算法—小鼠微環(huán)境細(xì)胞種群計(jì)數(shù)器(mMCP-counter)易茬。mMCP-counter可以作為R軟件包使用(https://github.com/cit-bioinfo/mMCP-counter)。它的輸入文件為基因表達(dá)矩陣及老,輸出文件為樣本中16種細(xì)胞的RNA豐度抽莱。其工作原理如下圖。
主要結(jié)果
mMCP-counter可以鑒定哪些細(xì)胞類型
基于mMCP-counter可以鑒定16中細(xì)胞亞群骄恶,其中12種為免疫細(xì)胞成分(T cells, CD8+ T cells, NK cells, B-derived cells, memory B cells, monocytes/macrophages, monocytes, granulocytes, mast cells, eosinophils, neutrophils, 和basophils)食铐,4種為基質(zhì)細(xì)胞成分(vessels, lymphatics, endothelial cells, 和fibroblasts),每種細(xì)胞的marker如下僧鲁。
流式細(xì)胞驗(yàn)證
那么mMCP-counter的表現(xiàn)能力如何呢虐呻?其結(jié)果是否可靠象泵?作者同其他已發(fā)表的方法做了比較。此外斟叼,作者也通過小鼠組織進(jìn)行了驗(yàn)證偶惠。作者使用流式細(xì)胞術(shù)和RNA-Seq分析了14個(gè)樣本,包括脾臟(n=4)朗涩,外周血(n=4)忽孽,腹腔(n=4)和TC1腫瘤(n=2),并使用FCM估計(jì)的每種細(xì)胞類型的比例作為參考谢床。不考慮組織來源兄一,作者將所有樣本合并,使用mMCP-counter算法基于RNA-Seq數(shù)據(jù)估計(jì)了免疫細(xì)胞組成萤悴,并計(jì)算了流式細(xì)胞術(shù)估計(jì)值與mMCP-counter評(píng)分之間的相關(guān)性瘾腰。作者發(fā)現(xiàn)大多數(shù)細(xì)胞亞群的mMCP-counter的評(píng)分與流式細(xì)胞術(shù)得到的比例之間存在良好的一致性,相關(guān)性介于0.629(嗜酸性粒細(xì)胞)和0.975(CD8+ T細(xì)胞)之間覆履。
mMCP-counter區(qū)分腫瘤類型和對(duì)免疫檢查點(diǎn)阻斷的應(yīng)答
基于小鼠的臨床前研究模型在藥物臨床試驗(yàn)中發(fā)揮著至關(guān)重要的作用。免疫治療在多種腫瘤中顯示出良好的抗腫瘤有效性费薄,并且改變了多種腫瘤的治療格局硝全,那么mMCP-counter能否預(yù)測(cè)免疫治療的應(yīng)答呢。因此楞抡,作者將mMCP-counter應(yīng)用于接受了CTLA-4和PD-L1聯(lián)合阻斷治療的腎癌和間皮瘤小鼠模型伟众,以研究mMCP-counter是否能夠檢測(cè)到在免疫檢查點(diǎn)阻斷中與治療應(yīng)答與否相關(guān)的腫瘤微環(huán)境組成的差異。結(jié)果表明mMCP-counter可以很好的區(qū)分不同腫瘤類型以及對(duì)免疫治療應(yīng)答與否的患者召廷。通過mMCP-counter發(fā)現(xiàn)在兩種腫瘤模型中對(duì)治療應(yīng)答的腫瘤具有更高水平的T細(xì)胞凳厢、CD8+ T細(xì)胞和單核細(xì)胞/巨噬細(xì)胞浸潤(rùn)。然而竞慢,對(duì)于不同的腫瘤類型先紫,對(duì)治療應(yīng)答的腫瘤與非應(yīng)答的腫瘤具有不同的微環(huán)境組成。
mMCP-counter識(shí)別早期阿爾茨海默病發(fā)病的免疫和基質(zhì)相關(guān)因素
最后筹煮,作者在AD動(dòng)物模型中驗(yàn)證了mMCP-counter的表現(xiàn)性能遮精。首先作者從CK-p25小鼠的海馬體中獲取了RNA-seq數(shù)據(jù),隨后將其標(biāo)記為AD小鼠败潦,并在神經(jīng)退行性發(fā)生的2或6周時(shí)獲取了相似的對(duì)照CK小鼠的數(shù)據(jù)本冲。使用mMCP-counter,作者觀察到樣本的免疫和基質(zhì)組成可以很好地將AD小鼠與CK小鼠區(qū)分開劫扒,表明AD影響了海馬體的免疫浸潤(rùn)和血管生成檬洞。
mMCP-counter的實(shí)際應(yīng)用
我們基于RNAseq數(shù)據(jù)看下mMCP-counter的具體使用方法。
首先我們安裝mMCP-counter包并加載相關(guān)包
library(devtools)
install_github("cit-bioinfo/mMCP-counter")
library(mMCPcounter)
library(tidyverse)
讀入數(shù)據(jù)并做預(yù)處理
#讀入數(shù)據(jù)
expressionData <-read.table("Expression.csv",header = T,sep = ",",row.names =NULL)
#去除重復(fù)基因名
expressionData<-expressionData[!duplicated(expressionData$Name),]
#第一列轉(zhuǎn)換為行名
rownames(expressionData) <- expressionData[,1]
expressionData <- expressionData[,-1]
#標(biāo)準(zhǔn)化+log2轉(zhuǎn)化
#去除在所有樣本里表達(dá)量都為零的基因
expressionData<-expressionData[rowSums(expressionData)>0,]
expressionData <- log(expressionData+1)
接下來是重點(diǎn)沟饥,估計(jì)免疫細(xì)胞浸潤(rùn)
Immune<- mMCPcounter.estimate(expressionData, features =c("Gene.Symbol","ENSEMBL.ID","Probes")[1])
通過以上步驟我們就得到了每個(gè)樣本16種細(xì)胞的浸潤(rùn)水平添怔。
然后我們就可以進(jìn)行相關(guān)的可視化了环戈,這里我選擇用熱圖可視化。
#繪制免疫細(xì)胞浸潤(rùn)熱圖
library(pheatmap)
#列注釋
annol_col<-data.frame(Group=factor(rep(c("A","B"),each=3)))
row.names(annol_col)=colnames(Immune)
annol_color<-list(Group=c(A='#66C2A5',B="#FC8D62"))
pheatmap(Immune,
scale = "row",
cluster_cols = F,
cluster_rows = F,
show_colnames = F,
annotation_col = annol_col,
annotation_colors = annol_color,
gaps_col = 3,
border_color = "black",
fontsize =10,
cellwidth =20,
cellheight = 15,
color = colorRampPalette(colors = c("#66C2A5","white","#FC8D62"))(100))