連續(xù)變量取cutoff值:基于KM曲線
歡迎大家關(guān)注我的公眾號(hào):一只勤奮的科研喵
文章來(lái)源:R語(yǔ)言| 連續(xù)變量取cutoff值:基于KM曲線
相關(guān)鏈接 ↓↓↓↓↓
1. R語(yǔ)言| 連續(xù)變量取最佳cutoff值: 基于ROC曲線
8.png
2.R語(yǔ)言| 連續(xù)變量取最佳cutoff值: 基于限制性立方樣條(RCS)
0.png
library(survival)
library(survminer)
#清理運(yùn)行環(huán)境
rm(list = ls())
#數(shù)據(jù)來(lái)自survminer包自帶數(shù)據(jù)集:myeloma椿疗。
#讀入該數(shù)據(jù)集
data(myeloma)
#查看該數(shù)據(jù)變量及性質(zhì)
str(myeloma)
一、確定基因表達(dá)量的最佳cutoff值
cutoff<-surv_cutpoint(myeloma, #數(shù)據(jù)集
time="time",#“ ”里寫數(shù)據(jù)集時(shí)間變量
event="event",##“ ”里數(shù)據(jù)集結(jié)局變量名稱
variables=c("DEPDC1","WHSC1", #6個(gè)基因表達(dá)量
"CRIM1","IRF4",
"TP53","WHSC1")
);summary(cutoff) #輸出結(jié)果
二袖外、可視化某基因表達(dá)水平的cutoff值
plot(cutoff,
"DEPDC1",
palette = "lancet") #使用柳葉刀配色
微信圖片_20210327090556.png
三奏甫、將連續(xù)變量按照上述截?cái)嘀捣纸M
groups<-surv_categorize(cutoff)
str(groups)
head(groups)
此時(shí)扶供,基因表達(dá)量已轉(zhuǎn)為分類變量
四囤耳、繪制KM曲線
注意,要用轉(zhuǎn)為分類變量的數(shù)據(jù)面褐,data=groups
fit <- survfit(Surv(time, event)~DEPDC1, data=groups)#生存分析函數(shù)
ggsurvplot(fit,
data = groups, #使用轉(zhuǎn)為分類的數(shù)據(jù)集
pval=TRUE, #顯示p值
pval.method=TRUE, #顯示p值的評(píng)估方法
palette = "lancet",#使用柳葉刀配色
risk.table = TRUE, #顯示風(fēng)險(xiǎn)表
conf.int = TRUE) #顯示CI
2.png