廣義相加混合效應(yīng)模型,是混合效應(yīng)和相加模型的結(jié)合,不僅可以引進隨機效應(yīng)搏明,還可以對重復(fù)測量的X(自變量)鼠锈、t及其他協(xié)變量使用曲線擬合,可以滿足上述的分析要求星著。本文主要采用mgcv包中g(shù)amm函數(shù)分析购笆。
文獻分享
文獻1
這篇文章是基于MIMIC-III數(shù)據(jù)庫2021年5月份發(fā)表在Frontiers in Medicine(IF=5.091分)上的文獻。收集ARDS患者入院后7天內(nèi)重復(fù)測量的NLR值虚循,結(jié)局變量:30天死亡率和院內(nèi)死亡率同欠;作者①首先采用多因素Logistic回歸样傍,并擬合光滑曲線探索基線NLR與結(jié)局變量之間的相關(guān)性;②進一步采用廣義相加混合模型(GAMM)用于分析死亡者和存活者之間NLR差異隨時間的早期變化铺遂。The Association Between the Baseline and the Change inNeutrophil-to-Lymphocyte Ratio and Short-Term Mortality in Patients With Acute Respiratory Distress Syndrome
上圖是:擬合平滑曲線探索基線NLR水平與結(jié)局變量之間的關(guān)系的結(jié)果衫哥,關(guān)于這個圖是分析和繪制。
上圖是:采用GAMM模型分析存活者與死亡者之間的NLR差異隨時間(入ICU后第一周)的變化襟锐,圖片中紅色表示死亡組撤逢,藍色表示存活組,顯示兩組患者的NLR趨勢明顯不同粮坞,兩組之間的差異隨時間而增加蚊荣。
文獻2
這篇文章是2021年發(fā)表European Radiology的一個關(guān)于新冠的研究,新冠患者按癥狀分成重癥組和輕微組莫杈,入院3到30天內(nèi)互例,采用CT多次重復(fù)掃描肺部肺部感染量和感染總量比,觀察兩者隨時間的變化和影響筝闹。Generalized additive mixed model to evaluate the association between total pulmonary infection volume and volume ratio, and clinical types, in patients with COVID-19 pneumonia: a propensity score analysis.
作者采用線性混合效應(yīng)模型研究時間和癥狀對感染量和感染總量比的影響媳叨,結(jié)果見表四。同時采用GAMM模型研究感染量和總量比隨時間的變化趨勢丁存,如上圖所示肩杈。紅色是重癥組,藍色是輕微組解寝,結(jié)果:
圖a是總肺部感染量隨時間的影響扩然,同時受臨床類型的顯著影響(交互作用 p =0.01)。輕微組隨著時間增加而減少聋伦,而重癥組患者肺部感染總量夫偶,隨著時間增加每天增加14.66 cm3(95% CI:3.92 至 25.40)。
圖b 肺部感染總量比隨時間的影響觉增,同時受到臨床類型的顯著影響(p表示相互作用= 0.01)兵拢。輕微組隨著時間增加而減少,而重癥組肺部感染總量比逾礁,隨著時間增加每天增加 0.45% (95% CI: 0.13 to 0.77).
本案例數(shù)據(jù)來自外部數(shù)據(jù)集说铃,根據(jù)5個城市每年的某傳染病感染率與癌癥死亡率的數(shù)據(jù),分析這兩者之間的關(guān)系嘹履,其中Infec_Disease表示某傳染病感染率腻扇,Cancer_Mortality表示癌癥死亡率,具體數(shù)據(jù)概況如下表:
數(shù)據(jù)特點:①某傳染病感染率與癌癥死亡率砾嫉,均是重復(fù)測量的數(shù)據(jù)集幼苛,都隨時間變化;②各個城市提供的數(shù)據(jù)年份不完全相同焕刮,如城市3的資料年份是1969-2008舶沿,共計32個數(shù)據(jù)墙杯;城市5的資料的年份是1955-2008,共計38個數(shù)據(jù)括荡。
分析思路:1傳染病感染率(X)和腫瘤死亡率(Y)分別隨t(時間)的變化趨勢是什么高镐?(請看上篇推文)2.傳染病感染率(X)和腫瘤死亡率(Y)有沒有聯(lián)系?(本篇解決)3.有沒有滯后效應(yīng),有沒有非線性關(guān)系一汽?
在分析X與Y有沒有聯(lián)系的時候避消,需要考慮以下兩個問題:
①X,Y都隨時間變化,因此在分析X與Y的關(guān)系時召夹,要調(diào)整t的影響岩喷,如何調(diào)整呢?調(diào)整的不好监憎,t的混雜因素作用并沒有得到有效控制纱意,得出來的結(jié)果就不可靠。②Y隨X變化是否是線性變化關(guān)系鲸阔?有沒有分段或者閾值效應(yīng)呢偷霉?如果不是線性變化,而是直接用直線擬合褐筛,就不能發(fā)現(xiàn)他們之間得關(guān)系类少。
接下來帶著這兩個問題,往下走:
1數(shù)據(jù)加載
library(mgcv) gamm
library(dplyr) 數(shù)據(jù)轉(zhuǎn)換
dt <- read.csv('cancer.csv')
col<- c("#FF5151",'blue')##制作一個顏色變量
2GAMM模型構(gòu)建
首先采用曲線擬合傳染病感染率(X)與t渔扎,回答分析思路的第二個問題硫狞。
fml <- "Cancer_Mortality~s(Infec_Disease,bs='cr')+s(Year,bs='cr')"
fit<-gamm(formula(fml),random=list(Country=~1),data=dt,family=gaussian)
fit
gamm的參數(shù):
formula:GAMM模型表達式,s()表示是平滑項晃痴,平滑的方法可以通過bs參數(shù)自定義残吩,其中“tp”代表薄板回歸樣條,“cr”代表三次回歸樣條倘核。
random:設(shè)置隨機效應(yīng)泣侮,這里的隨機效應(yīng)是不同患者的隨機截距效應(yīng)。
family:鏈接函數(shù)紧唱,同glm函數(shù)活尊,連續(xù)變量寫gaussian,二分類寫binomial
data:數(shù)據(jù)集漏益,縱向數(shù)據(jù)酬凳。
其他參見幫助文檔。
3繪制平滑曲線
繪制平滑曲線回答上述分析思路的第二個問題遭庶,傳染病感染率(X)和腫瘤死亡率(Y)有沒有聯(lián)系?下面代碼是調(diào)整曲線擬合t后,繪制X與Y曲線圖稠屠,而調(diào)整曲線X峦睡,繪制t與Y的曲線圖翎苫。
提取擬合值
pred<-predict.gam(fit$gam,type="terms",se.fit=TRUE)
mfit<-mfit+mean(fit$gam$fitted.values)-mean(mfit)d
at<-cbind(dt,mfit,sfit)rm(mfit,sfit)
計算擬合值95%CI置信區(qū)間
dat$y.low <- dat$mfit-1.96*dat$sfit
dat$y.upp <- dat$mfit+1.96*dat$sfit
attach(dat)
繪制曲線
co<-c(0.003, 19.2415, 55.15824 ,77.0227) #前兩個是x軸的范圍,后兩個y軸的范圍榨了。
plot(mfit~Infec_Disease,ylim=c(co[3],co[4]),xlim=c(co[1],co[2]),col=col[1],type="p", pch=20, ylab="", xlab="")
par(new=TRUE);
plot(y.low~Infec_Disease,ylim=c(co[3],co[4]),xlim=c(co[1],co[2]),col=col[2], type="p", pch=16, lwd=2,ylab="", xlab="",cex=0.5)
par(new=TRUE);
plot(y.upp~Infec_Disease,ylim=c(co[3],co[4]),xlim=c(co[1],co[2]),col=col[2], type="p", pch=16, ylab='Cancer_Mortality', xlab='Infec_Disease',cex=0.5)
結(jié)果解讀:
由上圖一可以看出煎谍,調(diào)整曲線t后,可以看到X與Y成線性關(guān)系龙屉,橫軸是Infec_Disease(X),縱軸是Cancer_Mortality(Y),隨著Infec_Disease的增加呐粘,Cancer_Mortality呈線性下降。
由上圖二可以看出转捕,調(diào)整曲線X后作岖,可以看到t與Y成非線性關(guān)系,橫軸是t,縱軸是Cancer_Mortality(Y),隨著t的增加五芝,Cancer_Mortality呈非線性上升痘儡。
因此說明要分析Infec_Disease和Cancer_Mortality的關(guān)系時,需要調(diào)整t的影響枢步,且要用非線性關(guān)系調(diào)整t的混雜作用沉删。
接下來,我們采用直線分別擬Infec_Disease醉途,曲線擬合t矾瑰,重新構(gòu)建GAMM模型。
4直線擬合GAMM
根據(jù)上述的分析結(jié)果隘擎,X與Y成線性殴穴,t與Y成曲線,因此我們采用直線分別擬Infec_Disease嵌屎,曲線擬合t推正,重新構(gòu)建GAMM模型,探索X與Y的關(guān)系宝惰。
fit<-gamm(formula(fml),random=list(Country=~1),
data=dt,family=gaussian)
summary(fit$gam) 查看相加部分結(jié)果
anova(fit$gam) 查看方差檢驗結(jié)果
summary(fit$lme)查看混合效應(yīng)部分結(jié)果
結(jié)果解讀:
一開始提到廣義相加混合效應(yīng)模型是混合模型和相加模型的結(jié)合植榕,fit這個對象結(jié)果中同時包含gam和lme部分的結(jié)果,并且直線擬合傳染病感染率(X)與癌癥死亡率(Y)時尼夺,gam和lme的結(jié)果一致,主要看相加模型的線性回歸項和混合效應(yīng)模型的固定效應(yīng)部分尊残,這是回歸的主要結(jié)果。
結(jié)果顯示:
曲線調(diào)整t的混雜作用后淤堵,Y隨X成反向變化寝衫,回歸系數(shù)是-0.6437,傳染病感染率每增加一個單位拐邪,癌癥死亡率下降0.6437慰毅,那么如果用直線擬合t就不一定能充分調(diào)整t的混雜作用,就可能會影響對X作用的準確評估扎阶。這個地方還可以采用線性混合效應(yīng)模型擬合t2/t3調(diào)整t的作用汹胃。
其他關(guān)于R返回的結(jié)果見上述紅框標注婶芭,詳細可以參考前篇推文的介紹