腫瘤純度:是指腫瘤組織中腫瘤細(xì)胞所占的比例囤萤。
腫瘤組織中除了腫瘤細(xì)胞之外還有免疫細(xì)胞掂恕、基質(zhì)細(xì)胞生棍、間質(zhì)細(xì)胞等非腫瘤細(xì)胞怖现,共同影響腫瘤發(fā)生發(fā)展毕贼。
研究顯示腫瘤純度與腫瘤患者的臨床特征齐媒、基因組表達(dá)和生物學(xué)特性均顯著相關(guān)栋猖,忽視腫瘤純度的影響可導(dǎo)致腫瘤基因分型叨咖、復(fù)發(fā)風(fēng)險及療效預(yù)測等過程產(chǎn)生系統(tǒng)性偏倚害碾。
計算腫瘤純度用estmate包矢劲。
以下是具體教程。
##estimate估計腫瘤的TNM分期慌随,也就是腫瘤的純度芬沉。
##安裝estimate包
library(utils)
rforge <- "http://r-forge.r-project.org"
install.packages("estimate", repos=rforge, dependencies=TRUE)
library(estimate)
setwd("E:/8資料/2.干細(xì)胞/5.TNM分期")
#dat <- read.table("RNAmatrix_symble.txt", header=TRUE, row.names = 1)
#Error in read.table("RNAmatrix_symble.txt", header = TRUE, row.names = 1) :
# 'row.names'里不能有重復(fù)的名字
dat <- read.table("RNAmatrix_symble.txt", header=TRUE)
rows <- rownames(unique(dat['GeneSymbol']))
dat <- dat[rows,]
rownames(dat) <- dat[,1]
dat <- dat[,-1]
dat[1:4,1:4]
write.table(dat, file="RNAmatrix_symble_noDuplicate.txt", quote=FALSE, sep = "\t")
##打開RNAmatrix_symble_noDuplicate.txt后,將第一列的名字改成GeneSymbol阁猜。
filterCommonGenes(input.f= "RNAmatrix_symble_noDuplicate.txt" , output.f="LH_genes.gct",
id="GeneSymbol")
estimateScore(input.ds ="LH_genes.gct",output.ds="LH_estimate_score.gct",
platform="affymetrix")#platform默認(rèn)是affymetrix丸逸。
#默認(rèn)就是對所有樣本繪制圖形
#圖形將保存至estimated_purity_plots目錄下。
plotPurity(scores="LH_estimate_score.gct",samples="TCGA.A2L6", platform="affymetrix")##只對其中一個樣品繪圖剃袍。
plotPurity(scores="LH_estimate_score.gct", platform="affymetrix")##對所有樣品繪圖黄刚。
#當(dāng)然我們可以直接對我們最后的結(jié)果進(jìn)行讀出并提取我們想要的數(shù)據(jù):
scores <- read.table("LH_estimate_score.gct",skip= 2,header = T)
head(scores)