各位小伙伴大家好啊~我是奕嶙联予,過年在家實(shí)在是懶的動(dòng)啊辑甜,在推出第一篇關(guān)于sas的推送一個(gè)月之后檐薯,今天終于把第二篇憋出來啦,今天給大家介紹如何用sas軟件進(jìn)行生存分析,之后會(huì)陸續(xù)把sas的其他用法補(bǔ)上哦~
我之前的文章包括如下:
1. 如何使用SAS軟件實(shí)現(xiàn)logistic回歸分析
2. 如何使用SPSS實(shí)現(xiàn)logistic回歸分析
3. 如何利用SPSS實(shí)現(xiàn)多元線性回歸(啞變量設(shè)置與分析)
更多數(shù)據(jù)分析知識坛缕,請關(guān)注純學(xué)術(shù)的公墓猎,眾號:全哥的學(xué)習(xí)生涯
1.相關(guān)概念:
生存分析是將事件發(fā)生的結(jié)果和出現(xiàn)這一結(jié)果所經(jīng)歷的時(shí)間結(jié)合起來進(jìn)行分析的一種統(tǒng)計(jì)分析方法,不僅考慮事件是否出現(xiàn)赚楚,而且也考慮事件出現(xiàn)的時(shí)間長短毙沾。
失效事件:失效事件是反映治療效果特征的事件,又稱為死亡事件宠页、終點(diǎn)事件左胞,比如患者因某病死亡、患者某病復(fù)發(fā)等举户。
起始事件:起始事件是反映生存時(shí)間起始特征的事件烤宙,比如疾病確診、某種治療開始俭嘁、接觸毒物等躺枕。
生存時(shí)間:生存時(shí)間是任何兩個(gè)有聯(lián)系的事件之間的事件間隔,常用符號t來表示供填。
完全數(shù)據(jù):在臨床上對病人進(jìn)行隨訪時(shí)拐云,一部分研究對象可以觀察到死亡,從而得到準(zhǔn)確的生存時(shí)間近她,其所提供的信息是完全的叉瘩,稱為完全數(shù)據(jù)。
截尾數(shù)據(jù):有一部分病人粘捎,由于中途失訪薇缅、死于其他原因或觀察結(jié)束時(shí)仍然存活,對這部分病人無法知道準(zhǔn)確的生存時(shí)間晌端,只知道其生存時(shí)間比觀察到的時(shí)間要長捅暴,它提供不完全的信息,稱為不完全數(shù)據(jù)咧纠,也叫截尾數(shù)據(jù)蓬痒。
生存分析的基本方法:主要有生存率的估計(jì)、生存率的比較和Cox回歸分析漆羔。
2.代碼實(shí)現(xiàn):
2.1數(shù)據(jù)的準(zhǔn)備:
data a ;
input t gender age group status@@;
#這里有五個(gè)變量梧奢,分別為生存時(shí)間、性別演痒、年齡亲轨、分組、結(jié)局(0代表完全數(shù)據(jù)鸟顺,1代表截尾數(shù)據(jù))惦蚊。如果數(shù)據(jù)是以頻數(shù)的形式出現(xiàn)器虾,可以再多加一個(gè)頻數(shù)變量,在進(jìn)行生存分析時(shí)用freq語句指定頻數(shù)變量蹦锋。
cards;
10 0 27 1 1
1 0 47 1 0
5 1 40 1 1
34 1 37 0 1
…
;
run;
2.2. 生存率的估計(jì)及比較:
proc lifetest data=a plots=survival(cb);
#proc lifetest語句執(zhí)行生存分析過程兆沙,該語句比較重要的選項(xiàng)如下:
選項(xiàng)功能
Method= 指定生存函數(shù)的估計(jì)方法,method=pl表示使用Kaplan-Meier法莉掂,此選項(xiàng)為默認(rèn)選項(xiàng)葛圃;method=lt表示使用壽命表法。
Plots= 繪制生存曲線圖憎妙。常用選項(xiàng)為plots=survival库正,表示繪制生存曲線圖,如果需要估計(jì)生存曲線可信區(qū)間可以加上(cb)厘唾。
strata group;
#指定用于進(jìn)行生存率比較的變量褥符,該語句用于對組別做單因素分析,比較不同組別的生存率阅嘶。若比較不同性別的生存率把“group”替換為“gender”即可属瓣。若只估計(jì)生存率而不進(jìn)行比較可以不要該語句。
time t*status(1);
#估計(jì)生存率讯柔,括號內(nèi)的值代表截尾數(shù)據(jù)
run;
2.3 Cox回歸分析:
proc phreg data=a;
strata gender;
#指定分層變量抡蛙。
model t*status(1)=age group;
#定義模型。如果想要分析兩個(gè)變量間的交互作用魂迄,需要把兩個(gè)變量的交互項(xiàng)生成一個(gè)新變量粗截,再把這個(gè)新變量放入model語句中,創(chuàng)建新變量的語句可以放在input語句后捣炬,也可以放在model語句后熊昌,如果交互項(xiàng)中包含時(shí)間變量,則必須要放在model語句后湿酸。
#model語句常用的選項(xiàng)如下:
選項(xiàng)功能
Selection= ?指定變量篩選的方法婿屹,常用的有backward,forward,stepwise,score
Slentry= ?指定變量選入標(biāo)準(zhǔn)
Slstay= ?指定變量剔除標(biāo)準(zhǔn)
rl ?輸出風(fēng)險(xiǎn)比HR及其可信區(qū)間
run;
2.4 結(jié)果如下:
生存率的比較:
Cox回歸:
進(jìn)行cox回歸需要滿足等比例風(fēng)險(xiǎn)假設(shè),對于比例風(fēng)險(xiǎn)的判定可以在過程步中使用assess語句的PH選項(xiàng)推溃,例如:assess var=(group) ph;也可以在模型中加入研究因素與時(shí)間的交互項(xiàng)來判定昂利。如果不滿足等比例風(fēng)險(xiǎn)假設(shè),可以將不成比例關(guān)系的協(xié)變量作為分層變量铁坎,再進(jìn)行cox回歸分析蜂奸,此種方法的缺點(diǎn)是不能分析該分層變量的效應(yīng);也可以在模型中加入時(shí)間與研究因素的交互項(xiàng)來進(jìn)行分析硬萍。更多數(shù)據(jù)分析知識扩所,請關(guān)注純學(xué)術(shù)的公,眾號:全哥的學(xué)習(xí)生涯