生存分析KM法與Cox法異同
KM 方法即Kaplan-Meier survival estimate是一種無(wú)參數(shù)方法(non-parametric)來(lái)從觀察的生存時(shí)間來(lái)估計(jì)生存概率的方法。KM生存分析模型榄檬,是單變量分析(univariable analysis),在做單變量分析時(shí)海雪,模型只描述了該單變量和生存之間的關(guān)系而忽略其他變量的影響舱殿。同時(shí),Kaplan-Meier方法只能針對(duì)分類(lèi)變量(治療A vs 治療B湾宙,男 vs 女)冈绊,不能分析連續(xù)變量對(duì)生存造成的影響。為了解決上述兩種問(wèn)題死宣,Cox比例風(fēng)險(xiǎn)回歸模型(Cox proportional hazards regression model)就被提了出來(lái)毅该。因此,Cox比例風(fēng)險(xiǎn)回歸模型鹃骂,可以分析連續(xù)變量對(duì)生存造成的影響,也可以多變量分析對(duì)生存的影響静盅。Cox回歸分為單因素cox回歸和多因素cox回歸寝殴,
單因素Cox回歸
Cox回歸分為單因素cox回歸和多因素cox回歸,今天主要介紹單因素cox回歸的使用市咽。在TCGA+biomarker這類(lèi)研究中單因素cox回歸用的是比較多的抵蚊,大部分情況下是用來(lái)篩選變量溯革。當(dāng)有多個(gè)自變量時(shí)谷醉,比如差異分析得到了60個(gè)差異miRNA,這時(shí)候可以通過(guò)對(duì)這60個(gè)miRNA批量做單因素Cox回歸抖单,篩選結(jié)果顯著的miRNA(用于下一步的多因素cox回歸)遇八。
單因素Cox回歸案例展示
下圖展示了多個(gè)變量與無(wú)病生存間的單因素cox回歸分析結(jié)果,獨(dú)立在三個(gè)數(shù)據(jù)集中分別計(jì)算货矮,繪制出如下表格揽碘。大家可以注意到,針對(duì)每個(gè)變量雳刺,都經(jīng)過(guò)數(shù)據(jù)整理成為二分類(lèi)變量裸违,每個(gè)自變量只有一行數(shù)值供汛,說(shuō)明都是將這些二分類(lèi)變量進(jìn)行了數(shù)值化去做的單因素cox回歸。
但自變量并不一定都需要整理成分類(lèi)變量雀久,因?yàn)閏ox回歸本來(lái)就可以針對(duì)二分類(lèi)趁舀、多分類(lèi)和連續(xù)變量進(jìn)行分析,比如下圖:針對(duì)KIF20A這個(gè)基因做個(gè)兩種單因素cox回歸矮烹,一種是針對(duì)KIF20A表達(dá)值的連續(xù)性變量(因此只有一行數(shù)值)奉狈;一種是提前將KIF20A的表達(dá)值分為兩部分,成為二分變量(自變量因子化仁期,分層展示)竭恬。
很多時(shí)候痊硕,為了單因素和多因素COX回歸結(jié)果看起來(lái)更連貫悦析,經(jīng)常也會(huì)把兩種cox回歸結(jié)果整理在一起進(jìn)行展示,如下圖:分別在兩組獨(dú)立數(shù)據(jù)集中做單因素和多因素Cox回顧分析亭螟。以TESTING數(shù)據(jù)集結(jié)果為例骑歹,單因素cox分析了10個(gè)變量與生存之間的關(guān)系,發(fā)現(xiàn)有5個(gè)變量結(jié)果顯著道媚。接下來(lái)對(duì)這5個(gè)變量進(jìn)行多因素分析最域,發(fā)現(xiàn)有兩個(gè)變量顯著,可作為獨(dú)立因子镀脂!
總結(jié):cox回歸結(jié)果的展示薄翅,主要涉及三個(gè)參數(shù):Miedian(中位數(shù))、HR值(****概念風(fēng)險(xiǎn)比****)翘魄、P值(統(tǒng)計(jì)學(xué)指標(biāo))
單因素Cox結(jié)果解釋
單因素cox回歸結(jié)果(參考網(wǎng)絡(luò)暑竟,覺(jué)得說(shuō)的還是挺清楚的)
1、coef是公式中的回歸系數(shù)b(有時(shí)也叫做beta值)绩鸣,因此exp(coef)則是Cox模型中最主要的概念風(fēng)險(xiǎn)比(HR-hazard ratio):
- HR = 1: No effect
- HR < 1: Reduction in the hazard(有助于)
- HR > 1: Increase in Hazard(不利于)
2纱兑、Z值代表Wald統(tǒng)計(jì)量,其值等于回歸系數(shù)coef除以其標(biāo)準(zhǔn)誤se(coef)捡多,即z = coef/se(coef);有統(tǒng)計(jì)量必有其對(duì)應(yīng)的假設(shè)檢驗(yàn)的顯著性P值垒手,其說(shuō)明bata值是否與0有統(tǒng)計(jì)學(xué)意義上的顯著差別
3科贬、exp(coef)就是 HR,等于0.59榜掌,即風(fēng)險(xiǎn)比例等于0.59。在數(shù)據(jù)中男性(male=1),女性(female=2)套硼,HR=0.59胞皱,說(shuō)明性別為有助于事件結(jié)局(生:1,死:2)雾鬼,女性(male=2)比男性減少了0.41倍風(fēng)險(xiǎn)宴树,女性與良好預(yù)后相關(guān)。
4森渐、ower .95 upper .95則是exp(coef)的95%置信區(qū)間同衣,可信區(qū)間越窄壶运,可信度越高,你的實(shí)驗(yàn)越精確蒋情,越是真理棵癣。
5、Likelihood ratio test狈谊,Wald test沟沙,Score (logrank) test則是三種檢驗(yàn)方法的p值壁榕,p值小于0.05, 說(shuō)明回歸方程是有統(tǒng)計(jì)學(xué)意義的。這三者是asymptotically equivalent牌里;當(dāng)樣本數(shù)目足夠大時(shí),這三者的值是相似的喳篇;當(dāng)樣本數(shù)目較少時(shí)催享,這三者是有差別的,但是Likelihood ratio test會(huì)比其他兩種在小樣本中表現(xiàn)的更優(yōu)痰憎。
案例圖表解釋?zhuān)▍⒖季W(wǎng)絡(luò)解釋?zhuān)苤庇^)
解釋?zhuān)?/strong>HR就是相對(duì)風(fēng)險(xiǎn)度攀涵,HR值大于1是危險(xiǎn)因素,小于1是保護(hù)因素(相對(duì)于生存這樣個(gè)結(jié)局事件來(lái)說(shuō)N舷浮)怒详。圖中的數(shù)字4為1(即每個(gè)分類(lèi)變量中的對(duì)照),3簡(jiǎn)單來(lái)解釋就是這個(gè)情況下它是上面那個(gè)的產(chǎn)生影響最終統(tǒng)計(jì)連續(xù)變量的幾倍的事情吊骤。連貫起來(lái)解釋就是針對(duì)癌胚抗原CEA這個(gè)自變量静尼,第一行是正常CEA的人共114個(gè),而異常CEA的人是31個(gè)鸭巴,異常CEA的患者是正常CEA患者死亡風(fēng)險(xiǎn)的1.953倍拦盹,他的上下可信區(qū)間是1.068~3.569,并且經(jīng)過(guò)統(tǒng)計(jì)是P=0.03有意義掌敬!圖中1處可以發(fā)現(xiàn)在這里把TNM分期分為了兩類(lèi),其實(shí)分幾類(lèi)都可以楷兽,原理都一樣。分兩類(lèi)比較簡(jiǎn)單罷了端考,并且好解釋揭厚。
單因素cox回歸分析如何做?
- 適用于數(shù)值型變量裂明,這類(lèi)變量的cox結(jié)果只有一行太援。(自變量可以是連續(xù)性變量,也可以是數(shù)值化后的分類(lèi)變量)
rm(list = ls())
library("survival")
library("survminer")
#載入并查看數(shù)據(jù)集
data("lung")
head(lung)
str(lung)#該數(shù)據(jù)將所有變量都轉(zhuǎn)換為數(shù)值型仙蛉,包括性別(1,2表示)碱蒙,分期(1,2,3,4表示)等。若是字符型的話哀墓,結(jié)果會(huì)有所不同喷兼!
#cox 回歸分析
res.cox <- coxph(Surv(time, status) ~ ph.ecog, data = lung) #ph.ecog為數(shù)值型變量
res.cox
summary(res.cox)
- 適用于分類(lèi)變量,同時(shí)展示所有協(xié)變量的結(jié)果
rm(list = ls())
library("survival")
library("survminer")
#載入并查看數(shù)據(jù)集
data("lung")
head(lung)
str(lung)#該數(shù)據(jù)都為數(shù)值型,如性別(1,2表示)喷面。要分類(lèi)展示cox回歸需要將分類(lèi)變量因子化
#將分類(lèi)變量從數(shù)值型改為因子
lung <- within(lung, {
sex <- factor(sex, labels = c('female', 'male'))}) # female為對(duì)照
#cox回歸分析(sex)
res.cox <- coxph(Surv(time, status) ~ sex, data = lung)
res.cox
summary(res.cox)
##是否分開(kāi)展示看結(jié)果惧辈?結(jié)合自身結(jié)果,看整體展示和分開(kāi)展示哪個(gè)好說(shuō)明好解釋用哪個(gè):谐荨困食!
往期回顧
TCGA+biomarker——常見(jiàn)結(jié)果展示
TCGA+biomarker——Sample基線表
更多內(nèi)容可關(guān)注公共號(hào)“YJY技能修煉”~~~