由英國統(tǒng)計學(xué)家Cox提出,全稱為比例風(fēng)險回歸模型(proportional hazards model),用于研究某些因素對生存期的影響。
基本概念
1 生存函數(shù)
- 變量
- S(t,X) 表示觀察對象的生存時間T大于某時刻t的概率享幽,稱為生存函數(shù),又稱為累積生存率拾弃。
- 意義:某時刻的存活人數(shù)除以隊列的總?cè)藬?shù)值桩。
2 死亡函數(shù)
- 意義:當(dāng)觀察隨訪到t時刻的累積死亡率,即累積死亡人數(shù)除以隊列總?cè)藬?shù)豪椿。
3 死亡密度函數(shù)
- 某時刻t的瞬時死亡率奔坟,稱為死亡密度函數(shù)。
- 意義:某時刻t的瞬時死亡速率(短時間內(nèi)的死亡人數(shù)除以時間)除以隊列總?cè)藬?shù)搭盾。
4 危險率(風(fēng)險)函數(shù)
- 在時刻t存活的觀察對象咳秉,在時刻t的瞬時死亡率,稱為危險率函數(shù)鸯隅。
- 意義:某時刻t的瞬時死亡速率除以t時刻的存活人數(shù)(實際上是一個條件瞬間死亡率)澜建。
基本原理
模型建立
生存分析的主要目的在于研究變量X對生存事件觀察結(jié)果的影響,觀察結(jié)果一般用生存函數(shù)來表示滋迈。
-
不能直接以S(t,X)為因變量霎奢,以X為自變量進(jìn)行線性回歸的原因:
- 生存分析研究中的數(shù)據(jù)包含刪失數(shù)據(jù)。
- 時間變量t通常不滿足正態(tài)分布和方差齊性饼灿。
(回顧線性回歸的基本假設(shè):不完全共線性,方差齊性帝美,無序列相關(guān)性碍彭,正態(tài)性,外生性)
- Cox比例風(fēng)險回歸模型:以風(fēng)險率函數(shù)h(t,X)為因變量,建立指數(shù)形式的回歸方程:
? β稱為自變量的偏回歸系數(shù)庇忌,h0(t)稱為基準(zhǔn)危險率舞箍。
- Cox回歸模型的優(yōu)點:
- 未對h0(t)作任何假定,因此Cox回歸模型在處理問題時具有較大的靈活性皆疹。
- 在許多情況下疏橄,即使h0(t)未知,仍可以估計出參數(shù)β略就。(意義:將時間和危險因素對風(fēng)險函數(shù)的影響分開捎迫,僅僅研究危險因素對生存的影響,而不關(guān)心時間對生存的影響)
模型轉(zhuǎn)化
公式(1)可以轉(zhuǎn)化為廣義線性模型表牢,以便計算和解釋:
基本假定
1 比例風(fēng)險假定
各危險因素的作用不隨時間的變化而變化窄绒,即
2 對數(shù)線性假定
對數(shù)風(fēng)險比應(yīng)與模型中的自變量應(yīng)與呈線性關(guān)系:
偏回歸系數(shù)的意義
偏回歸系數(shù)βj解釋了危險因素Xi 對相對危險度RR的影響:
- 若Xj是非暴露組觀察對象的各因素取值位谋,Xi 是暴露組觀察對象的各因素取值,由公式(3)可以求出暴露組對非暴露組的相對危險度RR堰燎。
- 在其他危險因素不變的情況下掏父,危險因素Xi每增加一個測定單位時,所引起的相對危險度的自然對數(shù)的改變量爽待。即lnRRj=βj·△Xj损同,又即:
- 從公式(1)和公式(4)可以看出有如下關(guān)系:
- 若
- 若
- 若
- 若
參數(shù)估計與假設(shè)檢驗
-
其他自變量不變的情況下伶贰,變量Xj每增加一個單位,相對危險度RRi的(1-α)置信區(qū)間為:
Sβj表示βj的標(biāo)準(zhǔn)誤罐栈。
- 若置信區(qū)間內(nèi)包含1黍衙,則認(rèn)為Xj在(1-α)置信水平上對RR沒有顯著影響。
對于回歸模型的假設(shè)檢驗通常采用似然比檢驗荠诬、Wald檢驗和記分檢驗琅翻,其檢驗統(tǒng)計量均服從卡方分布位仁,其自由度為模型中待檢驗的自變量個數(shù)。
用R語言進(jìn)行Cox回歸分析
1.安裝軟件包并加載
install.packages(c("survival","survminer"))
library("survival")
library("survminer")
2.調(diào)用內(nèi)置數(shù)據(jù)
data("lung")
3.計算回歸
res.cox<-coxph(Surv(time,status)~sex+ph.karno+ph.ecog, data=lung)
summary(res.cox)
4.作圖
ggforest(res.cox,main="hazard ratio",cpositions=c(0.02,0.22,0.4),fontsize=0.8,refLabel="reference",noDigits=2)
生存分布圖
通過Cox回歸找到了感興趣的危險因素之后方椎,用R語言畫出生存分布圖聂抢。
- 構(gòu)建surfut生存對象
fit<- survfit(Surv(time, status) ~ sex, data = lung)
- ggsurvplot函數(shù)繪制生存曲線
ggsurvplot(fit, data = lung)
· Ends
參考資料
百度百科:COX回歸模型