在醫(yī)學(xué)研究中哟楷,為了控制一些重要的混雜因素,經(jīng)常會把病例和對照按年齡徊件,性別等條件進(jìn)行配對,形成多個(gè)匹配組蒜危。各匹配組的病例數(shù)和對照人數(shù)是任意的虱痕,比如一個(gè)病例和若干個(gè)對照匹配即1:1,在醫(yī)學(xué)上稱作“1:1病歷對照研究”,常見還有1:M(M <=3),即1個(gè)病例和1或2或3個(gè)對照匹配断楷。
病歷對照研究或者傾向得分匹配研究(一種將研究數(shù)據(jù)處理成‘隨機(jī)對照實(shí)驗(yàn)數(shù)據(jù)’的方法)中常使用條件Logistic回歸進(jìn)行分析。其與普通的二元logistic回歸區(qū)別在于新思,多出配對ID,即將配對組納入考慮范疇赘风。
1夹囚、案例背景
某北方城市研究喉癌發(fā)病的危險(xiǎn)因素,使用1:2匹配的病例對照研究方法進(jìn)行調(diào)查邀窃。共有25對配對數(shù)據(jù)(每對3個(gè)荸哟,即25*3=75行數(shù)據(jù))。現(xiàn)研究兩個(gè)影響因素分別是:是否吸煙和是否有癌癥家族史。數(shù)據(jù)格式(部分)如下表:
提示:
條件logistic回歸時(shí)鞍历,數(shù)據(jù)中一定需要記錄配對編號舵抹,比如1:2的配對(1個(gè)病例配對2個(gè)對照,且共有20個(gè)組堰燎,組別編號從1到20掏父,那么同時(shí)會有3個(gè)1笋轨,3個(gè)2秆剪,3個(gè)3,類似下去)爵政,而且在分析時(shí)將配對編號放入對應(yīng)框中仅讽。
配對編號ID:共有25對配對,編號從1~25钾挟,每個(gè)數(shù)字會重復(fù)3次(分別對應(yīng)病例或?qū)φ战M)洁灵;
Y是否患喉癌:數(shù)字1表示病例組即患喉癌,數(shù)字0表示對照組即沒有患喉癌掺出;
X1是否吸煙:數(shù)字1表示吸煙徽千,數(shù)字0表示不吸煙;
X2癌癥家族史:數(shù)字1表示有家族患喉癌史汤锨,數(shù)字0表示沒有家族患喉癌史双抽。
在做條件logistic回歸時(shí),因變量只能為0和1二分類數(shù)據(jù)闲礼。數(shù)字中只能包括0和1牍汹,如果不是,可使用[數(shù)據(jù)處理]->[數(shù)據(jù)編碼]進(jìn)行設(shè)置柬泽。
2慎菲、操作
本例子操作截圖如下:
3、結(jié)果分析
SPSSAU共輸出三個(gè)表格锨并,分別是:“條件logit回歸模型似然比檢驗(yàn)結(jié)果”露该,“條件logit回歸模型分析結(jié)果匯總”,“條件logit回歸模型分析結(jié)果匯總”第煮。
①?第一個(gè)表格:條件logit回歸模型似然比檢驗(yàn)結(jié)果
模型似然比檢驗(yàn)有决,用于分析模型是否有效;
在分析上空盼,首先需要模型通過似然比檢驗(yàn)书幕,其原定假設(shè)為不加入X和加入X模型無明顯差異,如果對應(yīng)的p值小于0.05揽趾,意味著拒絕原假設(shè)台汇,也即說明模型有意義。
從上表可知:此處模型檢驗(yàn)的原定假設(shè)為:是否放入自變量(X1是否吸煙, X2癌癥家族史)兩種情況時(shí)模型質(zhì)量均一樣;從上表可知苟呐,模型拒絕原定假設(shè)(chi=6.319痒芝,p=0.042 <0.05),即說明本次構(gòu)建模型時(shí)牵素,放入的自變量具有有效性严衬,本次模型構(gòu)建有意義。
②?第二個(gè)表格:條件logit回歸模型分析結(jié)果匯總
包括模型的回歸系數(shù)笆呆,R方值等數(shù)據(jù)请琳;
從上表可知:模型McFadden R方值為0.115,意味著是否吸煙, 癌癥家族史共2項(xiàng)可解釋是否患喉癌的11.5%原因赠幕。
具體來看:X1是否吸煙的回歸系數(shù)值為1.243俄精,并且呈現(xiàn)出0.05水平的顯著性(z=2.322,p=0.020 <0.05)榕堰,意味著X1是否吸煙會對Y是否患喉癌產(chǎn)生顯著的正向影響關(guān)系竖慧。以及 (RR值,exp(b)值)為3.465(95% CI:1.214~9.892)逆屡,意味著相對不吸煙群體圾旨,吸煙群體患喉癌的風(fēng)險(xiǎn)倍數(shù)會加大3.465倍。
X2癌癥家族史的回歸系數(shù)值為-0.184魏蔗,但是并沒有呈現(xiàn)出顯著性(z=-0.365砍的,p=0.715>0.05),意味著是否有癌癥家族史并不會對患喉癌產(chǎn)生影響沫勿。
4挨约、總結(jié)
分析過程涉及以下幾個(gè)關(guān)鍵點(diǎn):
(1)條件logistic回歸時(shí),數(shù)據(jù)中一定需要記錄下配對編號产雹,比如1:2的配對(1個(gè)病例配對2個(gè)對照诫惭,且共有20個(gè)組,組別編號從1到20蔓挖,那么同時(shí)會有3個(gè)1夕土,3個(gè)2,3個(gè)3瘟判,類似下去)怨绣,而且在分析時(shí)將配對編號放入對應(yīng)框中。
(2)條件logistic回歸時(shí)拷获,因變量只能為0和1二分類數(shù)據(jù)篮撑,數(shù)字中只能包括0和1,如果不是匆瓜,可使用數(shù)據(jù)處理->數(shù)據(jù)編碼進(jìn)行設(shè)置赢笨。