首先對(duì)該文中第一幅圖進(jìn)行分析,該圖描述的是:通過(guò)單因素生存分析發(fā)現(xiàn)牵现,在TCGA-GC患者樣本中铐懊,Stromal scores與患者預(yù)后明顯相關(guān)(P=0.012)。
168ee8ec78849af9a91ef6027d331c59.png
數(shù)據(jù)下載
獲取腫瘤相關(guān)Scores值
Stromal scores, immune scores 和 estimate scores 是反映腫瘤細(xì)胞純度施籍、免疫浸潤(rùn)程度的一個(gè)指標(biāo)居扒,可從MD Anderson (https://bioinformatics.mdand erson.org/estimate/)下載獲取,幾乎包括了TCGA所有腫瘤樣本的ESTIMATE score丑慎。
08e0e86bb2c377982fca5b915d89ef64.png
文章中研究的是GBM,即多形性膠質(zhì)母細(xì)胞瘤瓤摧,這個(gè)是下載的score數(shù)據(jù)
ID Stromal_score Immune_score ESTIMATE_score
TCGA-02-0001-01 491.67 2852.31 3343.98
TCGA-02-0003-01 1248.81 3210.47 4459.27
TCGA-02-0004-01 2016.62 1566.65 3583.27
TCGA數(shù)據(jù)分析簡(jiǎn)述
此外竿裂,還需要下載獲取對(duì)應(yīng)的隨訪數(shù)據(jù),TCGA數(shù)據(jù)的下載使用cgdsr包
對(duì)數(shù)據(jù)進(jìn)行處理
#讀入MD Anderson下載的數(shù)據(jù)
> estimation<-read.table("gbm_RNAseqV2.txt",
+ header = T,stringsAsFactors = F)
下載獲取臨床數(shù)據(jù)
library("cgdsr")
library("tidyverse")
**獲取GBM的臨床數(shù)據(jù)**
mycgds <- CGDS("http://www.cbioportal.org/")
mycancerstudy <- "gbm_tcga"
mycaselist <- getCaseLists(mycgds,mycancerstudy)[1,1]
myclinicaldata <- getClinicalData(mycgds,mycaselist) #共有54列信息
choose_columns <- c("AGE",'SEX','OS_STATUS','OS_MONTHS',
"DFS_MONTHS","DFS_STATUS")
choose_clinicaldata <- myclinicaldata[,choose_columns] #只選擇其中的6列用于后續(xù)分析
#合并
> estimation$ID=gsub("-",".",estimation$ID)
> dat$ID = rownames(dat)
> dat_estimation=merge(dat, estimation,by= "ID")
分組
分組
按照文中給到的cutoff值照弥,進(jìn)行分組:2/3為higer組腻异,1/3為lower 組。
5aac19cc5a01f60aaf16b7c67da64d2e.png
分組
> dat_estimation$Stromal_group=ifelse(
+ dat_estimation$Stromal_score>
+ quantile(dat_estimation$Stromal_score,0.33),
+ "High","Low")
> head(dat_estimation, 3)
ID AGE SEX OS_STATUS OS_MONTHS DFS_MONTHS DFS_STATUS
1 TCGA.02.0001.01 44 Female 1:DECEASED 11.76 4.50 1:Recurred/Progressed
2 TCGA.02.0003.01 50 Male 1:DECEASED 4.73 1.31 1:Recurred/Progressed
3 TCGA.02.0004.01 59 Male 1:DECEASED 11.33 10.32 1:Recurred/Progressed
Stromal_score Immune_score ESTIMATE_score Stromal_group
1 491.67 2852.31 3343.98 High
2 1248.81 3210.47 4459.27 High
3 2016.62 1566.65 3583.27 High
進(jìn)行生存分析
> install.packages("survival")
# 加載R包l
library(survival)
# 擬合生存曲線
> my.surv <- Surv(dat_estimation$OS_MONTHS,dat_estimation$OS_STATUS=='1:DECEASED'
> kmfit2 <- survfit(my.surv~dat_estimation$Stromal_group)
> ggsurvplot(kmfit2,data = dat_estimation, pval=T)
image.png
其他兩組生存分析也是如此進(jìn)行繪制这揣。生存分析的結(jié)果與文章發(fā)表結(jié)果基本一致悔常,Low scores組患者的生存狀態(tài)要優(yōu)于High scores組影斑。