好多同學(xué)咨詢我混合效應(yīng)模型坊罢,有些問題自己需要講很多遍,想想就再開一貼擅耽,爭取這一篇文章給大家寫清楚活孩。
混合效應(yīng)模型名字很多,Hierarchical Modeling, also known as Mixed Effects Modeling乖仇,有叫分層模型的诱鞠,分層回歸的,隨機(jī)模型的等等这敬,你要知道它都是指的是一個東西航夺。
這個東西就是用來分析嵌套數(shù)據(jù)的!---------nested data
嵌套數(shù)據(jù)
這個時候有人就問崔涂,啥是嵌套數(shù)據(jù)把羝?
These are instances in which each observation is a member of a group, and you believe that group membership has an important effect on your outcome of interest.
嵌套數(shù)據(jù)就是套著的數(shù)據(jù)冷蚂,你就這么理解缭保,就是比如說我要分析學(xué)生學(xué)習(xí)對收入的影響,我調(diào)查了好多學(xué)校蝙茶,我是不是可以很有理由的認(rèn)為學(xué)校水平上的特征也會影響學(xué)生收入艺骂?
這個時候?qū)W生就是嵌套在學(xué)校水平上的。
再來一個例子隆夯,比如我要調(diào)查焦慮和抑郁的關(guān)系钳恕,我調(diào)查了30個人,每個人調(diào)查了5次蹄衷,我得到了150個數(shù)據(jù)忧额,那么這些數(shù)據(jù)是不是嵌套在個人水平上的?
理解沒愧口?
還沒有睦番,好吧,繼續(xù)
我們收集的數(shù)據(jù)先做個散點(diǎn)圖:
我們假設(shè)上面的數(shù)據(jù)是員工的收入數(shù)據(jù)托嚣,橫軸是工作年限巩检,縱軸是收入,我調(diào)查了整個公司的員工示启,員工分布在不同部門吧兢哭,我說部門的不同會影響員工收入沒問題吧,上圖中顏色不同代表部門不同丑搔。
其實(shí)數(shù)據(jù)就是嵌套的,它是這樣的:
每個人嵌套在不同部門種啤月,好,現(xiàn)在你要看收入和工作時間的關(guān)系劳跃,你如果不考慮嵌套谎仲,會怎么做?
是不是你直接做個以工作時間為自變量刨仑,以收入為因變量的回歸郑诺?
做出來就長這樣:
看著還行杉武?
錯辙诞!
你這個系數(shù)根本就不準(zhǔn),你沒有考慮嵌套轻抱,沒有考慮部門間也就是更高水平的變異!
混合效應(yīng)模型
那么飞涂,告訴我到底怎么做嘛,
接著看祈搜,你肯定聽過隨機(jī)斜率和隨機(jī)截距较店。
我們一個個來看,我剛剛說了你沒有考慮更高水平的變異容燕,那么這個變異情況有什么可能梁呈,你自己想嘛,是不是有可能部門間的起薪不一樣蘸秘?有可能部門間薪資增長率不一樣官卡?或者兩個都不一樣嘛。
那么隨機(jī)截距就是描述不同部門起薪的醋虏,加上隨機(jī)截距就意味著我們認(rèn)為不同的部門起薪不一樣味抖,可以變化,這個時候就是有隨機(jī)截距的混合效應(yīng)模型:
在上面的描述中仔涩,個體水平上斜率是一定的,是固定效應(yīng)粘舟,部門水平上可以有不同的起薪熔脂,是隨機(jī)效應(yīng)佩研。
再看隨機(jī)斜率,
就是說霞揉,有可能員工起薪都一樣只是薪資增長斜率在不同部門不一樣旬薯,要擬合這樣一個混合效應(yīng)模型我們就要給模型的高水平,也就是部門水平加上隨機(jī)斜率:
此時我們的模型可以擬合不同部門的斜率绊序,這個叫做隨機(jī)斜率模型。此時我們認(rèn)為秽荞,個人薪資受到個人水平上的工作年限的影響和不同部門薪資增長的影響骤公,工作年限是主效應(yīng),部門薪資增長是隨機(jī)效應(yīng)扬跋。
但是我們看到阶捆,對于我們這個例子來說,只有隨機(jī)斜率似乎不太理想钦听。
繼續(xù)看洒试,
隨機(jī)斜率+隨機(jī)截距
也就是說更合理的情況就是每個部門的起薪和每個部門的薪資增長都是不一樣的,這種情況就是隨機(jī)截距+隨機(jī)斜率:
這種情況下垒棋,我們就認(rèn)為每個人的薪資受到部門起薪的影響,還受到部門薪資增長的影響痪宰,此時工作年限是主效應(yīng)捕犬,部門起薪,部門薪資增長都是隨機(jī)效應(yīng)酵镜。
如何選擇
你明白上面三種模型后碉碉,又出現(xiàn)問題了
那我咋知道我到底該加隨機(jī)截距還是隨機(jī)斜率啊
問的好,此時要么你就更具理論經(jīng)驗(yàn)淮韭,比如我就確定部門起薪就是一樣的垢粮,那我就只加隨機(jī)斜率;還有你可以一個一個試錯靠粪,因?yàn)槟P蛿M合出來都有擬合優(yōu)度指數(shù)蜡吧,你去看哪個模型的擬合優(yōu)度最好你就選哪個。
小結(jié)
今天給大家寫了混合效應(yīng)模型的不同類型占键,至于具體如何做昔善,請看我之前的文章。感謝大家耐心看完畔乙,自己的文章都寫的很細(xì)君仆,代碼都在原文中,希望大家都可以自己做一做,請關(guān)注后私信回復(fù)“數(shù)據(jù)鏈接”獲取所有數(shù)據(jù)和本人收集的學(xué)習(xí)資料返咱。如果對您有用請先收藏钥庇,再點(diǎn)贊轉(zhuǎn)發(fā)。
也歡迎大家的意見和建議咖摹。
如果你是一個大學(xué)本科生或研究生评姨,如果你正在因?yàn)槟愕慕y(tǒng)計(jì)作業(yè)、數(shù)據(jù)分析萤晴、論文吐句、報告、考試等發(fā)愁店读,如果你在使用SPSS,R嗦枢,Python,Mplus, Excel中遇到任何問題两入,都可以聯(lián)系我净宵。因?yàn)槲铱梢越o您提供好的敲才,詳細(xì)和耐心的數(shù)據(jù)分析服務(wù)裹纳。
如果你對Z檢驗(yàn),t檢驗(yàn)紧武,方差分析剃氧,多元方差分析,回歸阻星,卡方檢驗(yàn)朋鞍,相關(guān),多水平模型妥箕,結(jié)構(gòu)方程模型滥酥,中介調(diào)節(jié),量表信效度等等統(tǒng)計(jì)技巧有任何問題畦幢,請私信我坎吻,獲取詳細(xì)和耐心的指導(dǎo)。
If you are a student and you are worried about you statistical #Assignments, #Data #Analysis, #Thesis, #reports, #composing, #Quizzes, Exams.. And if you are facing problem in #SPSS, #R-Programming, #Excel, Mplus, then contact me. Because I could provide you the best services for your Data Analysis.
Are you confused with statistical Techniques like z-test, t-test, ANOVA, MANOVA, Regression, Logistic Regression, Chi-Square, Correlation, Association, SEM, multilevel model, mediation and moderation etc. for your Data Analysis...??
Then Contact Me. I will solve your Problem...
加油吧宇葱,打工人瘦真!
猜你喜歡
R數(shù)據(jù)分析:混合效應(yīng)模型實(shí)例
從“我丑到我自己了”說起——混合效應(yīng)模型續(xù)
重復(fù)測量數(shù)據(jù)分析系列:混合效應(yīng)模型基礎(chǔ)