今天更新續(xù)文,上篇文章寫了生存曲線的畫法姐叁,但是留了一個問題沒有解決瓦盛,就是Kaplan-Meier生存曲線實際上僅僅把病人分為兩組做了生存率隨時間的比較,但是它并沒有考慮協變量外潜。R數據分析:生存分析的做法和結果解釋
那么谭溉,我們做研究的時候,你發(fā)現了兩個組的生存情況不一樣橡卤,是不是下一步你就要想看看到底是那些因素影響了我們的生存情況扮念。今天的文章就嘗試著解決這么樣問題。
問題描述
我們今天要關注的問題變了碧库,我們會想要探討很多因素造成的病人生存情況的差異:
比如柜与,我們今天想來探究一下究竟是哪些因素會影響結腸癌患者的生存情況巧勤,我們的備選因素有3個,分別是性別sex弄匕,治療方法rx和癌腫附著情況adhere(是否附著到其他器官颅悉,2分類變量)。
那么數據集依然是survival包自帶的colon數據集迁匠。
對于我們的研究問題剩瓶,我可以很自然地想要做亞組分析,窮盡所有亞組來看差異城丧,首先我們依然用Kaplan-Meier方法擬合生存曲線:
require("survival")
fit2 <- survfit( Surv(time, status) ~ sex + rx + adhere,
data = colon )
輸出其實挺混亂的延曙,我們依然可視化看看:
ggsurv <- ggsurvplot(fit2, fun = "event", conf.int = TRUE,
ggtheme = theme_bw())
ggsurv$plot +theme_bw() +
theme (legend.position = "right")+
facet_grid(rx ~ adhere)
通過亞組分析的結果我們可以知道男女的生存情況在所有情況下都有差異,但是局限性在于我們還是不能知道不同的治療方法或者癌腫附著是不是會影響病人的生存亡哄,因為我們的圖都是在分組展示不同性別的差異枝缔。
當然了,你可以改公式自己再跑跑看蚊惯,但這不是我們理想的方法愿卸。
風險比例模型
The Cox proportional-hazards model (Cox, 1972) is essentially a regression model commonly used statistical in medical research for investigating the association between the survival time of patients and one or more predictor variables.
Cox回歸又稱為比例風險模型,Cox回歸比壽命表法和Kaplan-Meier法的應用范圍更廣截型,它能夠同時考慮多個自變量對生存時間分布的影響趴荸。這個就是它最重要的優(yōu)點。
想理解這個模型宦焦,必須要理解風險函數(上篇文章有提)Cox風險比例模型的基本形式如下:
[圖片上傳失敗...(image-e58a57-1612362029739)]
上面的式子赊舶,一句話就是:t時間的風險等于基線風險乘以所有預測變量造成的風險的指數冪。上面式子做一個簡單的數學變換就可以得到以lnHR為因變量赶诊,自變量為研究變量的線性組合的形式:
[圖片上傳失敗...(image-d5580d-1612362029739)]
那么笼平,寫到這兒,大家肯定就知道了風險比例模型中自變量系數的解釋舔痪,就是自變量每改變一個單位寓调,風險比的自然對數的改變量。
那么具體到我們的例子锄码,我們可以做一個風險比例模型瞅瞅:
fit.coxph <- coxph(Surv(time, status) ~ sex + rx + adhere,
data = colon)
summary(fit.coxph)
從輸出結果看性別對死亡風險沒有顯著影響夺英,圖中的兩種治療方案相對于參照組都可以降低死亡風險,癌腫附著會增加死亡風險滋捶。
具體解釋為:相對于觀察組痛悯,施加rxlev治療和relev+5FU治療的病人發(fā)生結局(死亡)的風險會分別是基線風險的0.97和0.64,有癌腫附著的病人發(fā)生結局(死亡)的風險會是基線的1.34倍重窟。
我們還可以畫出變量對死亡風險影響的森林圖:
ggforest(fit.coxph, data = colon)
當然了這個森林圖對我們這個例子并沒有啥用哈载萌,僅供看官一樂。
小結
今天主要給大家寫了Cox風險比例模型的做法和解釋,感謝大家耐心看完扭仁,自己的文章都寫的很細垮衷,代碼都在原文中,希望大家都可以自己做一做乖坠,請關注后私信回復“數據鏈接”獲取所有數據和本人收集的學習資料搀突。如果對您有用請先收藏,再點贊轉發(fā)熊泵。
也歡迎大家的意見和建議仰迁。
如果你是一個大學本科生或研究生,如果你正在因為你的統(tǒng)計作業(yè)顽分、數據分析徐许、論文、報告怯邪、考試等發(fā)愁绊寻,如果你在使用SPSS,R花墩,Python悬秉,Mplus, Excel中遇到任何問題,都可以聯系我冰蘑。因為我可以給您提供最好的和泌,最詳細和耐心的數據分析服務。
如果你對Z檢驗祠肥,t檢驗武氓,方差分析,多元方差分析仇箱,回歸县恕,卡方檢驗,相關剂桥,多水平模型忠烛,結構方程模型,中介調節(jié)权逗,量表信效度等等統(tǒng)計技巧有任何問題美尸,請私信我,獲取最詳細和耐心的指導斟薇。
If you are a student and you are worried about you statistical #Assignments, #Data #Analysis, #Thesis, #reports, #composing, #Quizzes, Exams.. And if you are facing problem in #SPSS, #R-Programming, #Excel, Mplus, then contact me. Because I could provide you the best services for your Data Analysis.
Are you confused with statistical Techniques like z-test, t-test, ANOVA, MANOVA, Regression, Logistic Regression, Chi-Square, Correlation, Association, SEM, multilevel model, mediation and moderation etc. for your Data Analysis...??
Then Contact Me. I will solve your Problem...
加油吧师坎,打工人!