歡迎大家關(guān)注全網(wǎng)生信學(xué)習(xí)者系列:
- WX公zhong號:生信學(xué)習(xí)者
- Xiao hong書:生信學(xué)習(xí)者
- 知hu:生信學(xué)習(xí)者
- CDSN:生信學(xué)習(xí)者2
介紹
ggsurvfit
是一個(gè)基于 R 語言的包晾蜘,它擴(kuò)展了 survival
包的功能祟剔,允許用戶使用 ggplot2
的語法來創(chuàng)建美觀的生存曲線圖。KM曲線,即Kaplan-Meier曲線,是一種非參數(shù)統(tǒng)計(jì)方法龙致,用于估計(jì)生存函數(shù),即在給定時(shí)間點(diǎn)生存下來的概率。
ggsurvfit
包
-
美觀性:
ggplot2
提供了一種強(qiáng)大的圖形語法冯乘,可以創(chuàng)建高度定制化和美觀的圖形。 -
易用性:
ggsurvfit
允許用戶利用熟悉的ggplot2
語法來繪制生存曲線晒夹,使得圖形的創(chuàng)建過程更加直觀和簡單裆馒。 -
擴(kuò)展性:
ggsurvfit
可以與ggplot2
的其他擴(kuò)展包一起使用,例如ggpubr
或ggthemes
丐怯,以進(jìn)一步增強(qiáng)圖形的表現(xiàn)力喷好。
KM曲線的意義
- 生存分析:KM曲線提供了一種直觀的方式來展示生存數(shù)據(jù)隨時(shí)間的變化,常用于醫(yī)學(xué)研究中評估患者的生存率读跷。
- 比較生存率:通過比較不同組別的 KM 曲線梗搅,可以觀察到不同治療或條件對生存率的影響。
- 非參數(shù)方法:KM 方法不需要對生存時(shí)間的分布做出任何假設(shè)效览,這使得它適用于各種類型的數(shù)據(jù)无切。
如何閱讀KM曲線
- 水平軸:通常表示時(shí)間,可以是天丐枉、月哆键、年等。
- 垂直軸:表示生存概率瘦锹,即在特定時(shí)間點(diǎn)生存下來的概率籍嘹。
- 曲線下降:曲線的下降表示隨著時(shí)間的推移,生存概率的減少沼本。
- 曲線的階梯狀:每個(gè)臺階代表一個(gè)事件發(fā)生(例如死亡)噩峦,曲線在事件發(fā)生時(shí)下降。
- 比較曲線:如果有多條曲線抽兆,可以比較它們以了解不同組別或條件下的生存差異识补。
加載R包
加載所需要的R包
knitr::opts_chunk$set(message = FALSE, warning = FALSE)
library(ggsurvfit)
library(tidyverse)
library(survival)
library(survminer)
library(gtsummary)
# rm(list = ls())
options(stringsAsFactors = F)
options(future.globals.maxSize = 10000 * 1024^2)
導(dǎo)入數(shù)據(jù)
使用示例數(shù)據(jù)
data("df_lung")
head(df_lung)
inst<dbl> | time<dbl> | status<dbl> | age<dbl> | sex<fctr> | ph.ecog<fctr> |
---|---|---|---|---|---|
3 | 10.053388 | 2 | 74 | Male | Symptomatic and ambulatory |
3 | 14.948665 | 2 | 68 | Male | Asymptomatic |
3 | 33.182752 | 1 | 56 | Male | Asymptomatic |
5 | 6.899384 | 2 | 57 | Male | Symptomatic and ambulatory |
1 | 29.010267 | 2 | 60 | Male | Asymptomatic |
12 | 33.577002 | 1 | 74 | Male | Symptomatic and ambulatory |
數(shù)據(jù)預(yù)處理
數(shù)據(jù)預(yù)處理包含以下部分:代碼見R可視化:科研繪圖之生存KM曲線圖
- 因子化分組
- 生存分析提取畫圖數(shù)據(jù)(生存概率和風(fēng)險(xiǎn)表)
- 計(jì)算風(fēng)險(xiǎn)系數(shù)HR和p值
- 計(jì)算中位數(shù)生存率對應(yīng)的生存時(shí)間
- 匯總生存分析的結(jié)果
head(sur_all)
Characteristic<chr> | sex_Male<chr> | sex_Female<chr> | ||
---|---|---|---|---|
1 | No. of patients | sex_Male (n=138) | sex_Female (n=90) | |
2 | Events (% of patients) | 26 (0.19) | 37 (0.41) | |
3 | Median OS, months | 8.9 | 14 | |
4 | P value | 0.001 | 0.001 | |
5 | Hazard ratio | Reference | 0.588 |
畫圖
生存分析的KM圖,代碼見R可視化:科研繪圖之生存KM曲線圖
pl
結(jié)果:這張KM圖比較了兩組數(shù)據(jù):男性(8.9個(gè)月)和女性(14個(gè)月)的生存情況辫红。
- 生存曲線:圖中的曲線代表了隨時(shí)間變化的生存概率凭涂。曲線的下降表示在特定時(shí)間點(diǎn)有個(gè)體死亡或失去生存狀態(tài)。
- 風(fēng)險(xiǎn)組:圖中顯示了兩組風(fēng)險(xiǎn)組贴妻,男性和女性切油,分別用不同的曲線表示。
- 風(fēng)險(xiǎn)比(Hazard ratio, HR):圖中給出的風(fēng)險(xiǎn)比是0.59名惩,這表示在相同的時(shí)間點(diǎn)澎胡,女性的死亡風(fēng)險(xiǎn)是男性的59%。95%置信區(qū)間(0.26-0.92)表示這個(gè)估計(jì)的不確定性范圍,如果置信區(qū)間不包含1攻谁,通常認(rèn)為HR有統(tǒng)計(jì)學(xué)意義稚伍。
- P值:P = 0.001,這是一個(gè)非常小的P值戚宦,通常小于0.05就認(rèn)為統(tǒng)計(jì)結(jié)果有顯著性个曙,表示男性和女性的生存曲線差異是顯著的。
- 風(fēng)險(xiǎn)數(shù)量(No. at risk):圖中的表格顯示了每個(gè)時(shí)間點(diǎn)每個(gè)風(fēng)險(xiǎn)組中剩余的風(fēng)險(xiǎn)個(gè)體數(shù)量受楼,隨著時(shí)間的增加垦搬,風(fēng)險(xiǎn)數(shù)量逐漸減少,因?yàn)閭€(gè)體可能死亡或失去生存狀態(tài)艳汽。