R數(shù)據(jù)分析:反事實(shí)框架和因果中介的理論理解

其實(shí)很早之前給大家寫中介分析的做法的時(shí)候我也有思考過當(dāng)中介變量或者因變量不是連續(xù)變量的時(shí)候展懈,中介怎么做橄浓?或者說這個(gè)時(shí)候中介的結(jié)果如何解釋吠谢?當(dāng)時(shí)反正是一直沒有太想明白這些問題份氧,畢竟這些情況在發(fā)表的文獻(xiàn)中也較少見唯袄,也就稀里糊涂過去了。

近期又被好多同學(xué)多次問及這些問題蜗帜。想著逃避不過去了恋拷,試著看些文獻(xiàn)給大家寫寫,而且我看中文的關(guān)于這些方面的講解的資源也很少厅缺,希望我寫下的東西能給大家一些啟發(fā)蔬顾。

傳統(tǒng)中介方法

寫反事實(shí)框架之前我們先回顧傳統(tǒng)的中介做法,就是下面4步湘捎,其中第一步可以省略不要:

[圖片上傳失敗...(image-967bf0-1698754365182)]

我們期望通過分析知道暴露對(duì)結(jié)局的作用有多大部分是被中介變量介導(dǎo)的诀豁。分析方法包括兩種:

一種是difference method:

[圖片上傳失敗...(image-d26480-1698754365182)]

[圖片上傳失敗...(image-48d488-1698754365182)]

另外一種是Product method:

[圖片上傳失敗...(image-d2e522-1698754365182)]

通過這兩方法我們就計(jì)算出來了中介效應(yīng)。但是比如說我的中介變量是一個(gè)二分類變量這個(gè)時(shí)候因?yàn)閮蓚€(gè)回歸方程是不一樣尺度的窥妇,一個(gè)線性回歸舷胜,一個(gè)邏輯回歸,這個(gè)時(shí)候再用上面的方法就完全是講不通的活翩。

Traditional mediation analysis defines direct and indirect effects in terms of linear regression coefficients. It is unclear how these traditional effects are estimated in settings with binary variables

就是說傳統(tǒng)中介方法只能服務(wù)于線性回歸框架烹骨,只適用于中介變量和結(jié)局變量均為連續(xù)變量的情況翻伺。當(dāng)中介變量或者結(jié)局變量是非連續(xù)變量的時(shí)候整個(gè)中介效應(yīng)就無法分解了。

Traditional mediation methods are also limited to simple linear models展氓,all continuous exposure and mediators are assumed to have a linear effect. Incorporating non-linearities in the traditional approach is not straigthforward.

針對(duì)上述問題的解決方法就是換一個(gè)思維去看待中介作用穆趴。

反事實(shí)框架

反事實(shí),或者叫潛在結(jié)局遇汞,指的是個(gè)案在我們設(shè)定的暴露情形下將會(huì)觀測到的結(jié)局未妹。

比如個(gè)案在干預(yù)條件下的結(jié)局表示為y1,在控制條件下觀測到的結(jié)局表示為y0空入。如果同一個(gè)個(gè)案可以同時(shí)有兩種結(jié)局络它,那么干預(yù)的效應(yīng)就可以表示為y1-y0。這句加粗的話對(duì)理解反事實(shí)框架下的效應(yīng)表達(dá)很重要歪赢,多讀幾遍化戳,多感受下這句話的正確性。

但是這句話存在一個(gè)問題就是同一個(gè)個(gè)體不可能同時(shí)接受干預(yù)又在控制組埋凯,我們不可能同時(shí)觀測到y(tǒng)1和y0点楼。這與事實(shí)情況不符所以叫反事實(shí)或者潛在結(jié)局。

Participants cannot realistically serve in all conditions which is a Fundamental Problem of Causal Inference.

雖然對(duì)個(gè)體來講不可實(shí)現(xiàn)白对,但是對(duì)群體來講我們可以估計(jì)平均的y1和y0掠廓,從而可以得到平均干預(yù)效應(yīng)the average causal intervention effect *****E*****[*****Yi*****(1)???*****Yi*****(0)]。

對(duì)中介分析來講甩恼,在反事實(shí)框架中我們還涉及到中介變量m蟀瞧,反事實(shí)情形的表達(dá)就更加的復(fù)雜一些了,比如 E[Yi(1, m)]就表示當(dāng)暴露為1中介變量為m的時(shí)候y的值条摸,Mi(1)就是表示個(gè)案在干預(yù)組時(shí)中介變量的取值悦污。

像這樣的反事實(shí)結(jié)果表示還有很多,可以一張表格總結(jié)如下:

[圖片上傳失敗...(image-9584b3-1698754365182)]

借助這些反事實(shí)的表達(dá)我們就可以用兩個(gè)反事實(shí)結(jié)果的差值來定義中介作用了钉蒲,這么一整套中介的定義方法就叫做基于反事實(shí)框架的因果中介切端。

Causal mediation analysis defines causal effects as the difference between two potential outcomes. These definitions can be applied to any mediation model to estimate natural direct and indirect effects, including models with binary variables and an exposure–mediator interaction.

基于反事實(shí)框架的因果中介

比如:

x對(duì)y的總效應(yīng)就可以表示為x取a的時(shí)候y的期望與x取a的反事實(shí)時(shí)(a)y的期望的差值,即:E[Y(X=a,M=M(a))] – E[Y(X=a,M=M(a*))]

x對(duì)y的間接效應(yīng)就可以表示為x取a的時(shí)候y的期望與x取a顷啼,m取a的反事實(shí)時(shí)(a)y的期望的差值帆赢,即:E[Y(X=a,M=M(a))] – E[Y(X=a,M=M(a))]

x對(duì)y的直接效應(yīng)就可以表示為x取a,m取a的反事實(shí)時(shí)(a)y的期望與x取a的反事實(shí)時(shí)(a)y的期望的差值线梗,即:E[Y(X=a,M=M(a))] – E[Y(X=a,M=M(a*))]

上面兩個(gè)紅色的式子相加剛好就是總效應(yīng)。在考慮直接效應(yīng)的時(shí)候m可以設(shè)定在不同的水平怠益,設(shè)定在M(a*)時(shí)叫做自然直接效應(yīng)仪搔,設(shè)定在別的水平時(shí)叫做控制直接效應(yīng)

上面的敘述也可以總結(jié)成下圖:

[圖片上傳失敗...(image-6021f1-1698754365182)]

或者更詳細(xì)一點(diǎn),總結(jié)成如下圖:

[圖片上傳失敗...(image-61b2be-1698754365182)]

到這兒蜻牢,在完全沒有依賴于任何模型的情況下我們將整個(gè)中介分析重新定義了烤咧。

Causal inference methods for mediation analysis (“causal mediation”) are an extension of the traditional approach, developed to better address the main limitations described above. First, these methods allow for effect decomposition in the presence of X-M interaction by defining direct and indirect effects (controlled or natural) from a potential outcomes (PO) framework and developing estimations of these quantities that are not model specific偏陪。

理論上定義各種效應(yīng)的表達(dá)確實(shí)沒問題,但是這些效應(yīng)都是兩個(gè)反事實(shí)情況的差值煮嫌,在實(shí)際情況下我又不能同時(shí)觀測到兩個(gè)反事實(shí)笛谦,那么這些基于反事實(shí)框架定義出來的中介效應(yīng)值又如何算呢?

這個(gè)時(shí)候依然需要建模做預(yù)測(一個(gè)預(yù)測m的模型和一個(gè)預(yù)測y的模型)昌阿,模型出來了后饥脑,我們可以利用模型得到每個(gè)個(gè)案的反事實(shí)結(jié)果,這樣就可以得出直接效應(yīng)和間接效應(yīng)了懦冰。

[圖片上傳失敗...(image-b644f8-1698754365181)]

和傳統(tǒng)中介不同的是這些模型不是服務(wù)于效應(yīng)分解的灶轰,是用來估計(jì)反事實(shí)結(jié)果的。

[圖片上傳失敗...(image-e05b47-1698754365181)]

就是根據(jù)原來數(shù)據(jù)模擬預(yù)測然后得到個(gè)案的反事實(shí)結(jié)果刷钢,再根據(jù)反事實(shí)結(jié)果笋颤,得到中介的效應(yīng)分解。比如我們來看一個(gè)實(shí)際例子:下面數(shù)據(jù)集中有5個(gè)個(gè)案内地,通過模型估計(jì)出每個(gè)個(gè)案的反事實(shí)結(jié)果伴澄,然后根據(jù)反事實(shí)框架的下效應(yīng)的計(jì)算方法即可得到我們需要的中介效應(yīng):

[圖片上傳失敗...(image-193826-1698754365181)]

比如上圖中我們的總效應(yīng)就是85-4.2,我們的自然間接效應(yīng)就是31.4-4.2阱缓。

以上就是和大家分享的反事實(shí)框架下的因果中介理解方法非凌,最后再給大家放一張總結(jié)圖,圖中詳細(xì)地總結(jié)了上面的內(nèi)容:

[圖片上傳失敗...(image-6f2b2e-1698754365181)]

因果中介的結(jié)果報(bào)告

對(duì)于因果中介的結(jié)果表達(dá)茬祷,我們也來看一篇文獻(xiàn)清焕,文獻(xiàn)來自Journal of the American College of Cardiology文獻(xiàn)名字如下:

Long-Term Cardiovascular Risk in Women With Hypertension During Pregnancy

作者的研究了hypertensive disorder of pregnancy和cardiovascular disease的關(guān)系,利用因果中介方法探究了3個(gè)中介變量在上述關(guān)系中起到的中介作用祭犯。作者通過中介占比的顯著性檢驗(yàn)得到是否中介成立的結(jié)論秸妥,中介部分具體報(bào)告內(nèi)容如下:

[圖片上傳失敗...(image-1bd14-1698754365181)]

可以看到對(duì)于因果中介分析,作者就報(bào)告了中介占比的點(diǎn)估計(jì)和置信區(qū)間以及p值沃粗,省略了對(duì)各種間接效應(yīng)的報(bào)告和解釋(可能是因?yàn)樽髡叩慕Y(jié)局是個(gè)生存數(shù)據(jù)粥惧,效應(yīng)解釋起來蠻有挑戰(zhàn)性的,報(bào)告中介占比其實(shí)也完全夠了最盅,所以沒報(bào))突雪。大家寫文章的時(shí)候完全可以借鑒。

上圖的報(bào)告內(nèi)容在R語言中的Mediation包中可以輕松實(shí)現(xiàn)涡贱,實(shí)操我們安排在下一篇文章咏删,請持續(xù)關(guān)注。

文獻(xiàn)推薦:

Rijnhart JJM, Valente MJ, Smyth HL, MacKinnon DP. Statistical Mediation Analysis for Models with a Binary Mediator and a Binary Outcome: the Differences Between Causal and Traditional Mediation Analysis. Prev Sci. 2023 Apr;24(3):408-418. doi: 10.1007/s11121-021-01308-6. Epub 2021 Nov 16. PMID: 34782926; PMCID: PMC9108123.

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末问词,一起剝皮案震驚了整個(gè)濱河市督函,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖辰狡,帶你破解...
    沈念sama閱讀 219,539評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件锋叨,死亡現(xiàn)場離奇詭異,居然都是意外死亡宛篇,警方通過查閱死者的電腦和手機(jī)娃磺,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,594評(píng)論 3 396
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來叫倍,“玉大人偷卧,你說我怎么就攤上這事《伪辏” “怎么了涯冠?”我有些...
    開封第一講書人閱讀 165,871評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長逼庞。 經(jīng)常有香客問我蛇更,道長,這世上最難降的妖魔是什么赛糟? 我笑而不...
    開封第一講書人閱讀 58,963評(píng)論 1 295
  • 正文 為了忘掉前任派任,我火速辦了婚禮,結(jié)果婚禮上璧南,老公的妹妹穿的比我還像新娘掌逛。我一直安慰自己,他們只是感情好司倚,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,984評(píng)論 6 393
  • 文/花漫 我一把揭開白布豆混。 她就那樣靜靜地躺著,像睡著了一般动知。 火紅的嫁衣襯著肌膚如雪皿伺。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,763評(píng)論 1 307
  • 那天盒粮,我揣著相機(jī)與錄音嚷闭,去河邊找鬼抵蚊。 笑死载萌,一個(gè)胖子當(dāng)著我的面吹牛搪哪,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播摊崭,決...
    沈念sama閱讀 40,468評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼讼油,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了呢簸?” 一聲冷哼從身側(cè)響起汁讼,我...
    開封第一講書人閱讀 39,357評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤淆攻,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后嘿架,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,850評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡啸箫,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,002評(píng)論 3 338
  • 正文 我和宋清朗相戀三年耸彪,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片忘苛。...
    茶點(diǎn)故事閱讀 40,144評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡蝉娜,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出扎唾,到底是詐尸還是另有隱情召川,我是刑警寧澤,帶...
    沈念sama閱讀 35,823評(píng)論 5 346
  • 正文 年R本政府宣布胸遇,位于F島的核電站荧呐,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏纸镊。R本人自食惡果不足惜倍阐,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,483評(píng)論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望逗威。 院中可真熱鬧峰搪,春花似錦、人聲如沸凯旭。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,026評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽罐呼。三九已至鞠柄,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間弄贿,已是汗流浹背春锋。 一陣腳步聲響...
    開封第一講書人閱讀 33,150評(píng)論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留差凹,地道東北人期奔。 一個(gè)月前我還...
    沈念sama閱讀 48,415評(píng)論 3 373
  • 正文 我出身青樓,卻偏偏與公主長得像危尿,于是被迫代替她去往敵國和親呐萌。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,092評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容