上篇文章有寫(xiě)多水平模型走贪,這篇文章接著寫(xiě)惑芭,肯定好多人沒(méi)搞懂遂跟,因?yàn)槲易约阂裁悦院幕盟宥軐擂巍?/p>
傳統(tǒng)的回歸需要滿足的假設(shè)之一就是測(cè)量之間是相互獨(dú)立的富拗,然而有一種實(shí)驗(yàn)設(shè)計(jì)叫做重復(fù)測(cè)量設(shè)計(jì)啃沪,或者叫做被試內(nèi)設(shè)計(jì)within-subjects design谅阿,這么一種設(shè)計(jì)方法中一個(gè)受試對(duì)象會(huì)被測(cè)量多次,因?yàn)楹芏嗟臏y(cè)量都是來(lái)自同一個(gè)人所以這些測(cè)量我們有理由相信他們之間是不獨(dú)立的寓涨。
那么就不能使用傳統(tǒng)的回歸,而混合效應(yīng)就可以將不同水平(測(cè)量水平和個(gè)體水平)的變異都系統(tǒng)地分離開(kāi)氯檐。
什么時(shí)候使用混合效應(yīng)模型呢?------Studies that obtain multiple measurements over time (longitudinal, time-series) or multiple trials per participant (within subjects) lend themselves well to mixed model analyses.
實(shí)例描述
寫(xiě)個(gè)例子給大家一個(gè)更加直觀的感覺(jué)冠摄,比如我們想知道披薩的消費(fèi)量和心情有沒(méi)有關(guān)系(是不是有關(guān)系,關(guān)系是不是穩(wěn)定)河泳,我們招募一群受試者,讓他們報(bào)告他們的披薩消費(fèi)量和他們的心情拆挥,報(bào)告15個(gè)時(shí)間點(diǎn)薄霜。
Hypothetical sample size, n = 30
DV: Mood rating (scale)
IV1: Pizza consumption
IV2: Time points (Weeks, 1-10)
此例就是一個(gè)被試內(nèi)設(shè)計(jì),一個(gè)人測(cè)了15次纸兔,可怕。
接下來(lái)我們對(duì)這個(gè)例子進(jìn)行分析:
隨機(jī)效應(yīng)與固定效應(yīng)
Fixed effects are, essentially, your predictor variables. This is the effect you are interested in after accounting for random variability (hence, fixed).
固定效應(yīng)就是你感興趣的預(yù)測(cè)變量崎坊,在我舉得這個(gè)例子中就是披薩消費(fèi)量和時(shí)間洲拇,因?yàn)槲覀兏信d趣
披薩消費(fèi)量對(duì)心情的影響和影響隨時(shí)間的變化情況。
Random effects are best defined as noise in your data. These are effects that arise from uncontrollable variability within the sample. Subject level variability is often a random effect.
隨機(jī)效應(yīng)就是噪聲蚕捉,通常我們研究低水平的變量,高水平統(tǒng)統(tǒng)為噪聲为严,此例中,我們研究消費(fèi)量和心情肺稀,可以把這兩個(gè)變量看作是嵌套在人的水平上的第股,那么人與人之間的差異就是隨機(jī)效應(yīng)。
截距與斜率
Intercepts: The baseline relationship between IV & DV. Fixed effects are plotted as intercepts to reflect the baseline level of your DV.
截距就是基線時(shí)自變量和因變量的關(guān)系话原。此例中隨機(jī)截距就是披薩消費(fèi)量基線時(shí)人與人之間不同夕吻,而固定截距就是基線時(shí)所以人的披薩消費(fèi)量相同。
Slope: The strength of the relationship between IV & DV (controlling for randomness), which represent random effects. You should expect to see differences in the slopes of your random factors.
斜率就是自變量和因變量的關(guān)系強(qiáng)度繁仁。此例中涉馅,隨機(jī)斜率就是人與人之間披薩消費(fèi)量和心情的關(guān)系不一樣,而固定斜率就是人與人之間披薩消費(fèi)量和心情的關(guān)系一樣黄虱。
特別注意稚矿,截距和斜率有可能有相關(guān)性。就是不同基線的個(gè)體披薩消費(fèi)量和心情的關(guān)系不一樣捻浦。
隨機(jī)效應(yīng)結(jié)構(gòu)
(1 + IV | unit level)
(1 + IV.1*IV.2 | unit level)
#or
(0 + IV | unit level)
(0 + IV.1*IV.2 | unit level)
通常我們?cè)谀P椭薪⑽畲В瑢?duì)于隨機(jī)效應(yīng)的表述語(yǔ)法如上,1代表隨機(jī)斜率朱灿,0代表固定斜率
(1| subject) =每個(gè)個(gè)體都是隨機(jī)截距和隨機(jī)斜率
(1 + pizza |subject) =不同個(gè)體間披薩消費(fèi)量的影響不同昧识,披薩消費(fèi)量有隨機(jī)截距,個(gè)體間披薩消費(fèi)量的影響不同盗扒。
(1 + pizza | subject) + (0 + time| subject)=個(gè)體在被披薩消費(fèi)量影響時(shí)有隨機(jī)截距和隨機(jī)斜率跪楞。時(shí)間的斜率也是隨機(jī)的,但是披薩消費(fèi)量和時(shí)間是獨(dú)立的环疼。
(1 + pizza + time | subject) =和上面一樣习霹,但是披薩消費(fèi)量和時(shí)間是有共變的
(1 + pizza * time | subject) =在時(shí)間和披薩消費(fèi)量上每一個(gè)個(gè)體都有他們的截距和隨機(jī)斜率朵耕,以及披薩消費(fèi)量和時(shí)間的交互炫隶,且所以的截距和斜率都有相關(guān)。
尋找最好的隨機(jī)效應(yīng)結(jié)構(gòu)
從上面的結(jié)構(gòu)中我們可以知道阎曹,其實(shí)隨機(jī)效應(yīng)有很多伪阶,我們到底選擇哪種隨機(jī)效應(yīng)最好呢?
這就需要我們進(jìn)行模型比較了:
nullmodel1 <- lmer( mood ~ 1 + (1|subject), data = pizzadata, REML=FALSE)
nullmodel2 <- lmer( mood ~ 1 + (1 + pizza |subject), data = pizzadata, REML=FALSE)
nullmodel3 <- lmer( mood ~ 1 + (1 + pizza * time |subject), data = pizzadata, REML=FALSE)
anova (nullmodel1, nullmodel2, nullmodel3)
我們可以通過(guò)模型的AIC,BIC和卡方來(lái)進(jìn)行模型的比較处嫌,上圖的結(jié)果中我們可以看到模型二相對(duì)模型三并沒(méi)有提高擬合栅贴,所以模型二就是最佳模型,(1 + pizza +time|subject)就是最佳隨機(jī)效應(yīng)結(jié)構(gòu)熏迹,意思就是不同的個(gè)體他們的極限披薩消費(fèi)量是不同的檐薯,而且在披薩消費(fèi)量影響心情時(shí)的斜率也是不同的。
加入固定效應(yīng)
上一部分我們找到了模型最好的隨機(jī)效應(yīng)結(jié)構(gòu),接下來(lái)我們就給模型加入固定效應(yīng):
m1=lmer(mood ~ pizza + (1 + pizza + time |subject), data=pizzadata, REML = FALSE)
summary(m1)
m2= lmer(mood ~ pizza + time + (1 + pizza + time |subject), data=pizzadata, REML = FALSE)
summary(m2)
m3 = lmer(mood ~ pizza*time + (1 + pizza + time |subject), data=pizzadata, REML = FALSE)
summary(m3)
跑3個(gè)模型坛缕,分別加入固定效應(yīng)和固定效應(yīng)的交互之后我們開(kāi)始檢驗(yàn)到底哪一個(gè)模型好:
anova (m1, m2, m3)
通過(guò)p值我們發(fā)現(xiàn)模型二其實(shí)是最好的模型墓猎,所以我們可以得到結(jié)論:控制隨機(jī)效應(yīng)后披薩的消費(fèi)量越高,心情越好赚楚,但時(shí)間會(huì)減弱這種效應(yīng)毙沾。時(shí)間和披薩的消費(fèi)量之間并沒(méi)有交互作用。
小結(jié)
如果你是一個(gè)大學(xué)本科生或研究生宠页,如果你正在因?yàn)槟愕慕y(tǒng)計(jì)作業(yè)左胞、數(shù)據(jù)分析、論文举户、報(bào)告烤宙、考試等發(fā)愁,如果你在使用SPSS,R俭嘁,Python门烂,Mplus, Excel中遇到任何問(wèn)題,都可以聯(lián)系我兄淫。因?yàn)槲铱梢越o您提供最好的屯远,最詳細(xì)和耐心的數(shù)據(jù)分析服務(wù)。
如果你對(duì)Z檢驗(yàn)捕虽,t檢驗(yàn)慨丐,方差分析,多元方差分析泄私,回歸房揭,卡方檢驗(yàn),相關(guān)晌端,多水平模型捅暴,結(jié)構(gòu)方程模型,中介調(diào)節(jié)等等統(tǒng)計(jì)技巧有任何問(wèn)題咧纠,請(qǐng)私信我蓬痒,獲取最詳細(xì)和耐心的指導(dǎo)。
If you are a student and you are worried about you statistical #Assignments, #Data #Analysis, #Thesis, #reports, #composing, #Quizzes, Exams.. And if you are facing problem in #SPSS, #R-Programming, #Excel, Mplus, then contact me. Because I could provide you the best services for your Data Analysis.
Are you confused with statistical Techniques like z-test, t-test, ANOVA, MANOVA, Regression, Logistic Regression, Chi-Square, Correlation, Association, SEM, multilevel model, mediation and moderation etc. for your Data Analysis...??
Then Contact Me. I will solve your Problem...
加油吧漆羔,打工人梧奢!
(站外鏈接發(fā)不了,請(qǐng)關(guān)注后私信回復(fù)“數(shù)據(jù)鏈接”獲取本號(hào)所有使用數(shù)據(jù))
往期內(nèi)容:
從“我丑到我自己了”說(shuō)起——混合效應(yīng)模型續(xù)