上次的干貨分享我們給大家介紹的是如何利用TIDE預測腫瘤免疫逃逸(推文鏈接)婉弹,本期推文更加重磅绑嘹,我們將給大家詳細講解生信文章免疫分析必做的——腫瘤浸潤免疫細胞。
在學習腫瘤浸潤免疫細胞之前尺借,我們需要先了解一下腫瘤微環(huán)境(tumor microenvironment, TME)顶岸。腫瘤微環(huán)境,顧名思義就是腫瘤細胞周圍的環(huán)境芍阎,與腫瘤的發(fā)生發(fā)展密切相關世曾,包括非細胞組分如生長因子、趨化因子等谴咸,還有細胞組分度硝,主要由腫瘤細胞、免疫細胞寿冕、基質(zhì)細胞組成蕊程。腫瘤微環(huán)境中的免疫細胞我們就稱為腫瘤浸潤免疫細胞。然而驼唱,并不是所有的免疫細胞都具有抗腫瘤的作用藻茂,比如據(jù)文獻報道Treg細胞和M2型巨噬細胞就主要與腫瘤患者的不良預后有關。因此玫恳,分析腫瘤浸潤免疫細胞對腫瘤研究具有重要意義辨赐。
進行腫瘤浸潤免疫細胞分析的算法有很多,比如TIMER京办、CIBERSORT等掀序,今天我們給大家介紹的是操作性更強并且也能用與其他分析的方法——ssGSEA。
進行ssGSEA惭婿,我們需要的輸入數(shù)據(jù)有基因表達矩陣和腫瘤浸潤免疫細胞基因集不恭。
1.導入基因表達矩陣
load("基因表達矩陣.rdata")
View(data)
2.導入腫瘤浸潤免疫細胞基因集
文獻中比較常見的用來做腫瘤浸潤免疫細胞分析的基因集主要用兩個:一個是來源于文獻Classification of triple-negative breast cancers based on Immunogenomic profiling见擦,其中不僅總結了16種腫瘤浸潤免疫細胞的基因集练链,還有13種免疫功能的基因集级历;另一個就是TISIDB數(shù)據(jù)庫總結的28種腫瘤浸潤淋巴細胞的基因集淌喻。上述這三個基因集以及第一步的基因表達矩陣大碗已經(jīng)給大家全部整理好了褥伴,移步gong zhong號后臺回復“ssGSEA數(shù)據(jù)包”即可獲取蟹地。接下來挫剑,我們以從文獻中獲得的16種腫瘤浸潤免疫細胞的基因集為例進行ssGSEA分析贯莺。
load("腫瘤浸潤免疫細胞基因集.rdata")
View(geneset_cell)
3.進行ssGSEA分析
library(GSVA)
ssGSEA_matrix <- gsva(expr = data,
??????????????????????gset.idx.list = geneset_cell,
??????????????????????method = 'ssgsea',
??????????????????????kcdf = "Poisson",
??????????????????????abs.ranking = TRUE)
要注意一下①method參數(shù)默認為“gsva”风喇,我們這里進行的是ssGSEA,因此設置為“ssgsea”缕探。②“kdcf”參數(shù)默認為 "Gaussian"响驴,適用與經(jīng)過對數(shù)轉(zhuǎn)換的芯片數(shù)據(jù)和測序數(shù)據(jù)的log-CPMs, log-RPKMs 或者 log-TPMs,"Poisson"適用于測序數(shù)據(jù)的count格式撕蔼。
分析的結果如圖3豁鲤,列為樣本,行為16種腫瘤浸潤免疫細胞鲸沮,中間的數(shù)值為每種細胞在每個樣本中的浸潤分數(shù)琳骡。
4.可視化
示例基因表達矩陣包括的是50例腫瘤樣本與50例正常樣本,接下來我們就通過繪制箱線圖來比較16種腫瘤浸潤免疫細胞在腫瘤組與正常組之間的差異讼溺。
①加載包
library(tibble)
library(magrittr)
library(reshape2)
library(ggplot2)
②準備數(shù)據(jù):將ssGSEA的結果處理成圖4的格式
tmp1 <- ssGSEA_matrix%>%t()%>%as.data.frame() %>%
rownames_to_column("Sample")
tmp1$Group <- c(rep("tumor",50),rep("normal",50))
tmp1 <- melt(tmp1)
colnames(tmp1) <- c("Sample","Group","Celltype","Score")??
③繪制如圖5的箱線圖,展示16種腫瘤浸潤免疫細胞在正常組與腫瘤組的浸潤的差異怒坯。
pdf("16免疫細胞_箱線圖.pdf",width = 12,height = 8)
ggplot(tmp1,aes(Celltype,Score)) +
geom_boxplot(aes(fill = Group),outlier.shape = 21)+
theme_bw() +
labs(x = NULL, y = "Score") +
scale_fill_manual(values = c("blue", "red"))+
stat_compare_means(aes(group = Group,label = after_stat(p.signif)),
method = "wilcox.test",
hide.ns = T)+
theme(plot.margin=unit(c(1,1,1,1),'cm'),
plot.title = element_text(size = 12,color="black",hjust = 0.5),
axis.title = element_text(size = 12,color ="black"),
axis.text = element_text(size= 12,color = "black"),
panel.grid.minor.y = element_blank(),
panel.grid.minor.x = element_blank(),
axis.text.x = element_text(angle = 45, hjust = 1 ),
panel.grid=element_blank(),
legend.position = "top",
legend.text = element_text(size= 12),
legend.title= element_text(size= 12))
dev.off()
到這里炫狱,使用ssGSEA分析腫瘤浸潤免疫細胞及其可視化就結束了。除了箱線圖剔猿,其實也可以用熱圖來展示各種腫瘤浸潤免疫細胞在所有樣本中的浸潤情況视译。關于熱圖的繪制,我們“R語言——使用pheatmap包繪制熱圖”這篇推文已經(jīng)詳細講解過归敬。
還有酷含,既然13種免疫功能的基因集也給到大家了,那為什么不再順便給文章加個免疫功能的分析呢汪茧?快去試一試吧椅亚!