其實(shí)很早之前給大家寫中介分析的做法的時(shí)候我也有思考過當(dāng)中介變量或者因變量不是連續(xù)變量的時(shí)候展懈,中介怎么做橄浓?或者說這個(gè)時(shí)候中介的結(jié)果如何解釋吠谢?當(dāng)時(shí)反正是一直沒有太想明白這些問題份氧,畢竟這些情況在發(fā)表的文獻(xiàn)中也較少見唯袄,也就稀里糊涂過去了。
近期又被好多同學(xué)多次問及這些問題蜗帜。想著逃避不過去了恋拷,試著看些文獻(xiàn)給大家寫寫,而且我看中文的關(guān)于這些方面的講解的資源也很少厅缺,希望我寫下的東西能給大家一些啟發(fā)蔬顾。
傳統(tǒng)中介方法
寫反事實(shí)框架之前我們先回顧傳統(tǒng)的中介做法,就是下面4步湘捎,其中第一步可以省略不要:
[圖片上傳失敗...(image-967bf0-1698754365182)]
我們期望通過分析知道暴露對(duì)結(jié)局的作用有多大部分是被中介變量介導(dǎo)的诀豁。分析方法包括兩種:
一種是difference method:
[圖片上傳失敗...(image-d26480-1698754365182)]
[圖片上傳失敗...(image-48d488-1698754365182)]
另外一種是Product method:
[圖片上傳失敗...(image-d2e522-1698754365182)]
通過這兩方法我們就計(jì)算出來了中介效應(yīng)。但是比如說我的中介變量是一個(gè)二分類變量這個(gè)時(shí)候因?yàn)閮蓚€(gè)回歸方程是不一樣尺度的窥妇,一個(gè)線性回歸舷胜,一個(gè)邏輯回歸,這個(gè)時(shí)候再用上面的方法就完全是講不通的活翩。
Traditional mediation analysis defines direct and indirect effects in terms of linear regression coefficients. It is unclear how these traditional effects are estimated in settings with binary variables
就是說傳統(tǒng)中介方法只能服務(wù)于線性回歸框架烹骨,只適用于中介變量和結(jié)局變量均為連續(xù)變量的情況翻伺。當(dāng)中介變量或者結(jié)局變量是非連續(xù)變量的時(shí)候整個(gè)中介效應(yīng)就無法分解了。
Traditional mediation methods are also limited to simple linear models展氓,all continuous exposure and mediators are assumed to have a linear effect. Incorporating non-linearities in the traditional approach is not straigthforward.
針對(duì)上述問題的解決方法就是換一個(gè)思維去看待中介作用穆趴。
反事實(shí)框架
反事實(shí),或者叫潛在結(jié)局遇汞,指的是個(gè)案在我們設(shè)定的暴露情形下將會(huì)觀測到的結(jié)局未妹。
比如個(gè)案在干預(yù)條件下的結(jié)局表示為y1,在控制條件下觀測到的結(jié)局表示為y0空入。如果同一個(gè)個(gè)案可以同時(shí)有兩種結(jié)局络它,那么干預(yù)的效應(yīng)就可以表示為y1-y0。這句加粗的話對(duì)理解反事實(shí)框架下的效應(yīng)表達(dá)很重要歪赢,多讀幾遍化戳,多感受下這句話的正確性。
但是這句話存在一個(gè)問題就是同一個(gè)個(gè)體不可能同時(shí)接受干預(yù)又在控制組埋凯,我們不可能同時(shí)觀測到y(tǒng)1和y0点楼。這與事實(shí)情況不符所以叫反事實(shí)或者潛在結(jié)局。
Participants cannot realistically serve in all conditions which is a Fundamental Problem of Causal Inference.
雖然對(duì)個(gè)體來講不可實(shí)現(xiàn)白对,但是對(duì)群體來講我們可以估計(jì)平均的y1和y0掠廓,從而可以得到平均干預(yù)效應(yīng)the average causal intervention effect *****E*****[*****Yi*****(1)???*****Yi*****(0)]。
對(duì)中介分析來講甩恼,在反事實(shí)框架中我們還涉及到中介變量m蟀瞧,反事實(shí)情形的表達(dá)就更加的復(fù)雜一些了,比如 E[Yi(1, m)]就表示當(dāng)暴露為1中介變量為m的時(shí)候y的值条摸,Mi(1)就是表示個(gè)案在干預(yù)組時(shí)中介變量的取值悦污。
像這樣的反事實(shí)結(jié)果表示還有很多,可以一張表格總結(jié)如下:
[圖片上傳失敗...(image-9584b3-1698754365182)]
借助這些反事實(shí)的表達(dá)我們就可以用兩個(gè)反事實(shí)結(jié)果的差值來定義中介作用了钉蒲,這么一整套中介的定義方法就叫做基于反事實(shí)框架的因果中介切端。
Causal mediation analysis defines causal effects as the difference between two potential outcomes. These definitions can be applied to any mediation model to estimate natural direct and indirect effects, including models with binary variables and an exposure–mediator interaction.
基于反事實(shí)框架的因果中介
比如:
x對(duì)y的總效應(yīng)就可以表示為x取a的時(shí)候y的期望與x取a的反事實(shí)時(shí)(a)y的期望的差值,即:E[Y(X=a,M=M(a))] – E[Y(X=a,M=M(a*))]
x對(duì)y的間接效應(yīng)就可以表示為x取a的時(shí)候y的期望與x取a顷啼,m取a的反事實(shí)時(shí)(a)y的期望的差值帆赢,即:E[Y(X=a,M=M(a))] – E[Y(X=a,M=M(a))]
x對(duì)y的直接效應(yīng)就可以表示為x取a,m取a的反事實(shí)時(shí)(a)y的期望與x取a的反事實(shí)時(shí)(a)y的期望的差值线梗,即:E[Y(X=a,M=M(a))] – E[Y(X=a,M=M(a*))]
上面兩個(gè)紅色的式子相加剛好就是總效應(yīng)。在考慮直接效應(yīng)的時(shí)候m可以設(shè)定在不同的水平怠益,設(shè)定在M(a*)時(shí)叫做自然直接效應(yīng)仪搔,設(shè)定在別的水平時(shí)叫做控制直接效應(yīng)
上面的敘述也可以總結(jié)成下圖:
[圖片上傳失敗...(image-6021f1-1698754365182)]
或者更詳細(xì)一點(diǎn),總結(jié)成如下圖:
[圖片上傳失敗...(image-61b2be-1698754365182)]
到這兒蜻牢,在完全沒有依賴于任何模型的情況下我們將整個(gè)中介分析重新定義了烤咧。
Causal inference methods for mediation analysis (“causal mediation”) are an extension of the traditional approach, developed to better address the main limitations described above. First, these methods allow for effect decomposition in the presence of X-M interaction by defining direct and indirect effects (controlled or natural) from a potential outcomes (PO) framework and developing estimations of these quantities that are not model specific偏陪。
理論上定義各種效應(yīng)的表達(dá)確實(shí)沒問題,但是這些效應(yīng)都是兩個(gè)反事實(shí)情況的差值煮嫌,在實(shí)際情況下我又不能同時(shí)觀測到兩個(gè)反事實(shí)笛谦,那么這些基于反事實(shí)框架定義出來的中介效應(yīng)值又如何算呢?
這個(gè)時(shí)候依然需要建模做預(yù)測(一個(gè)預(yù)測m的模型和一個(gè)預(yù)測y的模型)昌阿,模型出來了后饥脑,我們可以利用模型得到每個(gè)個(gè)案的反事實(shí)結(jié)果,這樣就可以得出直接效應(yīng)和間接效應(yīng)了懦冰。
[圖片上傳失敗...(image-b644f8-1698754365181)]
和傳統(tǒng)中介不同的是這些模型不是服務(wù)于效應(yīng)分解的灶轰,是用來估計(jì)反事實(shí)結(jié)果的。
[圖片上傳失敗...(image-e05b47-1698754365181)]
就是根據(jù)原來數(shù)據(jù)模擬預(yù)測然后得到個(gè)案的反事實(shí)結(jié)果刷钢,再根據(jù)反事實(shí)結(jié)果笋颤,得到中介的效應(yīng)分解。比如我們來看一個(gè)實(shí)際例子:下面數(shù)據(jù)集中有5個(gè)個(gè)案内地,通過模型估計(jì)出每個(gè)個(gè)案的反事實(shí)結(jié)果伴澄,然后根據(jù)反事實(shí)框架的下效應(yīng)的計(jì)算方法即可得到我們需要的中介效應(yīng):
[圖片上傳失敗...(image-193826-1698754365181)]
比如上圖中我們的總效應(yīng)就是85-4.2,我們的自然間接效應(yīng)就是31.4-4.2阱缓。
以上就是和大家分享的反事實(shí)框架下的因果中介理解方法非凌,最后再給大家放一張總結(jié)圖,圖中詳細(xì)地總結(jié)了上面的內(nèi)容:
[圖片上傳失敗...(image-6f2b2e-1698754365181)]
因果中介的結(jié)果報(bào)告
對(duì)于因果中介的結(jié)果表達(dá)茬祷,我們也來看一篇文獻(xiàn)清焕,文獻(xiàn)來自Journal of the American College of Cardiology文獻(xiàn)名字如下:
Long-Term Cardiovascular Risk in Women With Hypertension During Pregnancy
作者的研究了hypertensive disorder of pregnancy和cardiovascular disease的關(guān)系,利用因果中介方法探究了3個(gè)中介變量在上述關(guān)系中起到的中介作用祭犯。作者通過中介占比的顯著性檢驗(yàn)得到是否中介成立的結(jié)論秸妥,中介部分具體報(bào)告內(nèi)容如下:
[圖片上傳失敗...(image-1bd14-1698754365181)]
可以看到對(duì)于因果中介分析,作者就報(bào)告了中介占比的點(diǎn)估計(jì)和置信區(qū)間以及p值沃粗,省略了對(duì)各種間接效應(yīng)的報(bào)告和解釋(可能是因?yàn)樽髡叩慕Y(jié)局是個(gè)生存數(shù)據(jù)粥惧,效應(yīng)解釋起來蠻有挑戰(zhàn)性的,報(bào)告中介占比其實(shí)也完全夠了最盅,所以沒報(bào))突雪。大家寫文章的時(shí)候完全可以借鑒。
上圖的報(bào)告內(nèi)容在R語言中的Mediation包中可以輕松實(shí)現(xiàn)涡贱,實(shí)操我們安排在下一篇文章咏删,請持續(xù)關(guān)注。
文獻(xiàn)推薦:
Rijnhart JJM, Valente MJ, Smyth HL, MacKinnon DP. Statistical Mediation Analysis for Models with a Binary Mediator and a Binary Outcome: the Differences Between Causal and Traditional Mediation Analysis. Prev Sci. 2023 Apr;24(3):408-418. doi: 10.1007/s11121-021-01308-6. Epub 2021 Nov 16. PMID: 34782926; PMCID: PMC9108123.