?????混合效應模型(Mixed-effects model)最早應用于教育領域,研究不同學生成績時足淆,同一個班級的學生成績是不獨立的巢块,呈現(xiàn)一定的相關性。具有層級結(jié)構(gòu)(hierarchy)巧号,在分析的時候族奢,需要考慮該相關性。不同的層級為不同的水平丹鸿,也叫做多水平模型(multilevel model)歹鱼、隨機系數(shù)模型(random coefficient model)。
?????混合效應模型可以用于分析連續(xù)性變量(linear mixed model)卜高,也可以用于分類變量(logistic mixed model)。這里主要討論線性混合效應模型南片。
水平2???????水平1
班級1: ?????學生11掺涛,學生12,...疼进,
班級2: ?????學生21薪缆,學生22,...伞广,
班級3: ?????學生31拣帽,學生32,...嚼锄,
... ...
班級J:?????學生J1减拭,學生J2,...
方差分析或者線性回歸的基本假設:正態(tài)性区丑、獨立性拧粪、方差齊性。多水平數(shù)據(jù)不滿足獨立性沧侥。
對于分類變量可霎,模型的校正意味著對不同的分類對應不同的截距。
??????e.g. ??????宴杀,假設男性對應gender=0癣朗,女性gender=1,則
??????Gender=0:
??????Gender=1:旺罢。
??????即不同性別為截距不同而斜率相同的平行回歸線旷余。
??????當上述數(shù)據(jù)當采用常規(guī)的線性模型分析時绢记,班級作為需要校正的分類變量,將轉(zhuǎn)換為虛擬變量放入模型荣暮,J個班級對應J-1個虛擬變量庭惜,相應需要估計J-1個系數(shù),50個班級則需要估計49個系數(shù)穗酥,模型的效率低护赊,且班級只是需要校正的因素,而不是真正關心的結(jié)局變量砾跃】考慮采用隨機效應模型,將班級作為隨機變量放入模型抽高,此時不需要估計各個班級的具體均值判耕,而僅估計班級的方差成分。
??????可以通過-2Log 似然比統(tǒng)計量翘骂,對比加了隨機效應與不加隨機效應的似然比檢驗(自由度為兩個模型變量的差值)是否有意義來判斷是否需要放入隨機效應壁熄,也可以用于其他嵌套模型的對比。
- 模型的分類
- 隨機效應模型(random-effects model):僅包含隨機效應
- 固定效應模型(fixed-effects model):僅包含固定效應
- 混合效應模型(mixed model):同時包含固定效應和隨機效應
- 混合效應模型
- 隨機截距模型:僅考慮不同水平截距不同碳竟,但所有水平的斜率相同草丧。即不同水平為截距不同的平行線。
- 隨機系數(shù)模型:不同水平的截距不同莹桅,且不同水平的斜率不同昌执。即不同水平為截距不同且不平行的回歸線。
- 模型的假設
線性混合效應模型(linear mixed model)是傳統(tǒng)線性模型的拓展诈泼,線性模型的大部分假設也適用于線性混合效應模型懂拾。但混合效應模型進一步考慮了變量之間的相關性。
- 固定效應與隨機效應
- ?????? 固定效應(Fixed effect): 僅研究某幾個固定的處理或組別铐达,不考慮將其結(jié)果推廣到更大的總體岖赋。變量不是從更大樣本中抽取的變量,如研究特定某幾個藥之間的區(qū)別瓮孙,并不需要通過研究結(jié)果推廣到其他藥物贾节。
?????固定效應模型表示為
或
(不存在協(xié)變量的情況下)
?????為各個組的均值,這里不存在變異衷畦,變異來源僅為
?????栗涂。
?????此時的
?????對應固定效應模型
- ?????? 隨機效應(Random effect):當變量為更大的總體中抽取的子集,此時關心的不再是某幾個組具體組之間的差異祈争,而考慮其所代表的總體的差異斤程。
?????
, 原假設不再針對均值,而在于檢驗各個組之間的方差有無差異忿墅。
?????模型表示為扁藕,此時變異來源為
?????疚脐。
和
相互獨立亿柑。
?????對應隨機效應模型
????????隨機效應的一個特性為可交換性(exchangeability),即這些效應分類是否可以被替換棍弄。如研究某藥物時望薄,受試者可以為總體中的這一個子集,但也可以用該總體的其他子集進行研究呼畸,或者研究不同地區(qū)醫(yī)院滿意度時痕支,可以抽取醫(yī)院A、B蛮原,也可以抽取醫(yī)院C卧须、D,醫(yī)院作為隨機效應儒陨,具有可交換性花嘶。而研究某幾種藥物時,藥物組別無法用其他組別進行替代蹦漠。
-
組內(nèi)相關系數(shù)(intra-class correlation察绷,ICC)
????? 為 組間變異度(Within group variance),由不同水平(e.g. 醫(yī)院津辩、中心、社區(qū))導致的變異
????? 為 組內(nèi)變異度(Between group variance)容劳,由低水平不同個體本身的差異造成的變異
?????不同變異對應兩個不同的水平的隨機誤差喘沿。低水平的測量值具有一定的相關性,通過組內(nèi)相關系數(shù)(intra-class correlation竭贩,ICC)ρ衡量蚜印。
??????????????????????????????
-
與其他分析方法的對比
對于嵌套的多水平數(shù)據(jù),可以的方法包括
- 采用常規(guī)的方差分析或回歸模型(disaggregation analysis)留量,忽略了數(shù)據(jù)間的相關性
- 對各個高水平求均值之后進行分析( aggregation analysis)窄赋,未考慮水平內(nèi)的變異。
- 采用多水平模型
文獻中關于幾種不同模型的結(jié)果對比(兩水平數(shù)據(jù)楼熄,自變量為組別):
混合效應模型的標準誤高于忽略數(shù)據(jù)相關性的方差分析方法忆绰。當數(shù)據(jù)被視為互相獨立時,每個觀測能提供100%的信息可岂,但實際上同一個水平中的不同觀測間數(shù)據(jù)具有相關性错敢,相關性越高能提供的信息越少(低于100%),混合效應模型標準誤增加(需要加上數(shù)據(jù)之間的協(xié)方差)缕粹。由此可見稚茅,針對這類數(shù)據(jù)如果采用常規(guī)的分析方法纸淮,假陽性增加。
聚類分析因為樣本量的減少(一個水平視為一個樣本求均值后進行分析)亚享,標準誤增加
Blanced結(jié)構(gòu)的數(shù)據(jù)咽块,截距效應估計相同,但標準誤有差異欺税。Unbalanced結(jié)構(gòu)侈沪,均有差異
-
參考:
醫(yī)學和公共衛(wèi)生研究常用多水平統(tǒng)計模型(李曉松)
Applied Mixed Model Analysis A Practical Guide (Jos W. R. Twisk)