a paper on Interaction effects

Summary of How Much Should We Trust Estimates from Multiplicative Interaction Models? Simple Tools to Improve Empirical Practice

研究過(guò)程中一個(gè)經(jīng)典場(chǎng)景是:開(kāi)開(kāi)心心地解決了各種報(bào)錯(cuò)庵寞,跑出了一個(gè)沒(méi)有任何omit狸相,看起來(lái)還不錯(cuò)的結(jié)果,那么一個(gè)新的問(wèn)題又來(lái)了捐川,即脓鹃,這個(gè)結(jié)果是啥玩意兒。
黃河泉老師的PPT里沒(méi)有解釋邊際效應(yīng)的結(jié)果圖應(yīng)該怎么看属拾,于是就只好從原文找答案啦将谊。

1 問(wèn)題介紹

交叉項(xiàng)探討的是 the relationship between an outcome Y and an independent variable/treatment D changes with a moderating variable X (Y,D,X三個(gè)變量的關(guān)系)

實(shí)證研究應(yīng)用過(guò)程中經(jīng)常犯的兩個(gè)錯(cuò)誤是:

  1. 模型設(shè)定錯(cuò)誤冷溶,假設(shè)交叉項(xiàng)的影響是線性的 LIE——實(shí)證數(shù)據(jù)往往并非如此理想
    First, these models assume a linear interaction effect that changes at a constant rate with the moderator.
  2. 調(diào)節(jié)變量缺乏共同支持[想不到更貼切的翻譯] lack of common support
    Second, estimates of the conditional effects of the independent variable can be misleading if there is a lack of common support of the moderator.
錯(cuò)誤1 Model misspecification: LIE假設(shè)

交叉項(xiàng)模型的普遍設(shè)定隱含了這個(gè)關(guān)鍵假設(shè)—— LIE: linear interaction effect assumption
表達(dá)式為
\frac{\partial Y}{\partial D}=\alpha +\beta X
含義是

This linear interaction effect (LIE) assumption states that the
effect of D on Y can only linearly change with X at a constant rate given by \beta. In other words, the LIE assumption implies that the heterogeneity in effects is such that as X increases by one unit, the effect of D on Y changes by \beta and this change in the effect is constant across the whole range of X.

錯(cuò)誤2 Insufficient common support in X

common support又是個(gè)啥?

Ideally, to compute the marginal effect of D at a given value of the moderator, Xo, there needs to be
(1) a sufficient number of observations whose X values are close to Xo and
(2) variation in the treatment, D, at Xo.
If either of these two conditions fails, the conditional marginal effects estimates are based on extrapolation or interpolation of the functional form to an area where there is no or only sparse data and therefore the effect estimates are fragile and model dependent.

百度翻譯一下:
理想情況下尊浓,為了計(jì)算處理變量D在給定的調(diào)節(jié)變量值Xo的邊際效應(yīng)逞频,需要

  1. 有足夠數(shù)量的觀測(cè)值,它們的X值接近于Xo栋齿。
    也就是說(shuō)苗胀,使用的數(shù)據(jù)在Xo附近有足夠多的觀測(cè)值。
  2. 在X處的處理變量D是有變化的瓦堵。

不滿足以上的任何一個(gè)條件基协,那么條件邊際效應(yīng)的估計(jì)就是以函數(shù)形式對(duì)沒(méi)有數(shù)據(jù)或極少量數(shù)據(jù)的區(qū)域的過(guò)度外推或內(nèi)插,因此效果估計(jì)是脆弱的并且依賴于模型菇用。[一針見(jiàn)血]
注:聯(lián)系一下 Curse of dimensionality澜驮,就很好理解了。

Insufficient common support 經(jīng)常出現(xiàn)于以下情況:

  1. D或X的分布是高度有偏的(highly skewed)
  2. D或X在二者的共同支持區(qū)域內(nèi)沒(méi)有變化(does not vary in some regions of the joint support of D and X)

2 模型

略惋鸥。
總之作者經(jīng)過(guò)一系列推導(dǎo)杂穷,針對(duì)以上兩個(gè)問(wèn)題進(jìn)行證明,再一次論證了:

  1. 如果真實(shí)模型是非線性的而強(qiáng)行使用和線性模型卦绣,那么得到的結(jié)果是不一致和有偏的(conditional marginal effects estimates are inconsistent and biased)耐量;
  2. 如果不滿足共同支持條件,那么結(jié)果高度依賴于模型滤港。

3 檢驗(yàn)診斷

問(wèn)題提出來(lái)了廊蜒,怎么解決呢?作者給出了一種非常簡(jiǎn)單又有效的辦法:數(shù)據(jù)可視化溅漾。

Linear Interaction Diagnostic (LID) plots
  • 第一步山叮,將原始數(shù)據(jù)按X進(jìn)行分組,畫(huà)出Y-D的散點(diǎn)圖樟凄。
    如果X是類(lèi)別變量聘芜,那么直接分組;如果X是連續(xù)變量缝龄,那么按照分位數(shù)等分成low, midium, high三組(binning approach)。
  • 第二步挂谍,在散點(diǎn)圖上用藍(lán)色線進(jìn)行線性回歸擬合叔壤,用紅色線進(jìn)行LOESS擬合。
    如果真實(shí)模型是線性的口叙,那么兩條線非常接近炼绘;反之,當(dāng)真實(shí)模型是非線性的妄田,兩條線走勢(shì)有明顯差異俺亮。這是對(duì)錯(cuò)誤1的檢驗(yàn)驮捍。
    此外,對(duì)比同一條擬合線在不同分組中的走勢(shì)脚曾,還可以對(duì)交互項(xiàng)的作用方向做出初步判斷东且。
  • 第三步,在散點(diǎn)圖上疊加X(jué)分布的box plot本讥。散點(diǎn)圖本身也提供了X分布的信息珊泳。
    如果X在數(shù)據(jù)區(qū)間內(nèi)都有分布而且比較均勻,比如25分位點(diǎn)到75分位點(diǎn)幾乎占據(jù)整個(gè)區(qū)域拷沸,那么滿足共同支持條件色查;反之,X集中在某個(gè)區(qū)間撞芍,在另外的區(qū)域數(shù)據(jù)很少或沒(méi)有秧了,則不滿足共同支持條件。

如果交互作用是雙向的(一般模型均如此)序无,那么要把D與X互換再做一遍验毡。也可以用generalized additive model (GAM)做三維的surface plot。

介紹完畢愉镰。分以下情形進(jìn)行圖示:
(1) linear marginal effect with a dichotomous treatment,
(2) linear marginal effect with a continuous treatment, and
(3) nonlinear marginal effect with adichotomous treatment.

LID plots

4 估計(jì)量

光看圖還是不夠米罚,數(shù)字到底比較可靠。于是丈探,作者提供了兩種估計(jì)量:Binning Estimator 和 Kernel Estimator录择,并且提供了將其可視化的程序 interflex [天地良心]
這里的 bias-variance trade-off 在于碗降,一方面隘竭,這些估計(jì)量減少了缺乏共同支持造成的偏差;另一方面讼渊,如果交互項(xiàng)的影響確實(shí)是線性的动看,那么線性模型的結(jié)果比這些估計(jì)量更有效。

Binning Estimator

按照連續(xù)變量的分組方法進(jìn)行估計(jì)爪幻,得到三個(gè)邊際效應(yīng)估計(jì)系數(shù)和置信區(qū)間菱皆。如圖所示,

  1. 如果
    (1)線性回歸線與L,M,H大致重疊(至少在置信區(qū)間內(nèi))
    (2)L,M,H在整個(gè)數(shù)據(jù)區(qū)間內(nèi)分布比較均勻挨稿,不是集中在某個(gè)區(qū)域
    那么請(qǐng)放心使用線性模型仇轻。
  2. 如果L,M,H錯(cuò)落有致,那么恭喜你喜提非線性模型奶甘,請(qǐng)參考作者提供的估計(jì)量篷店。
Binning Estimator
Kernel Estimator

Binning Estimator是三個(gè)點(diǎn),Kernel Estimator則呈現(xiàn)了數(shù)據(jù)區(qū)間內(nèi)的完整曲線臭家。

  1. 如果Kernel Estimator結(jié)果接近一條直線疲陕,則滿足LIE假設(shè)方淤;如果彎曲程度很大,那么LIE假設(shè)不滿足蹄殃,線性模型結(jié)果不一致携茂。
  2. 置信區(qū)間越寬的區(qū)域,越缺乏共同支持窃爷。
Kernel Estimator

5 數(shù)據(jù)

作者針對(duì)幾本頂刊上的許多文章進(jìn)行了驗(yàn)證(檢驗(yàn)方法見(jiàn)下)邑蒋,結(jié)果一塌糊涂,只有4篇文章完全通過(guò)檢驗(yàn)按厘。

6 結(jié)果

作者報(bào)告了結(jié)果的4種典型情形医吊,也是圖示邊際效應(yīng)的應(yīng)用實(shí)例:完美的線性邊際效應(yīng)[優(yōu)秀]、由于情況1數(shù)據(jù)分布不均的缺乏共同支持逮京、由于情況2的過(guò)度外推卿堂,以及非線性。[到了這里依然看不懂`interflex`結(jié)果圖的可以參考原文此部分]

如何識(shí)別后三種情形懒棉?依次進(jìn)行以下檢驗(yàn):
(1) H0:no statistically different treatment effects at typical low and typical high levels of the moderator——t test

whether the binning estimator at the median value in the low tercile of the moderator was statistically different from the effect estimate at the median of the high tercile of the moderator (p < .05, two-tailed)

即檢驗(yàn)binning estimator的L與H是否具有顯著性差異草描,拒絕原假設(shè)說(shuō)明交互作用顯著

(2) H0:no severe extrapolation——L-Kurtosis

whether the L-Kurtosis of the moderator exceeds a threshold that indicates severe extrapolation

(3) no nonlinear interaction effects——Wald test
H0:the interaction effect is indeed linear as claimed in the original study
interflex 的結(jié)果中,程序報(bào)告了Wald檢驗(yàn)的p值策严。拒絕原假設(shè)說(shuō)明存在非線性影響穗慕,但接受原假設(shè)不一定就滿足LIE假設(shè),尤其是在小樣本的情況下妻导。

結(jié)論

好啦逛绵,文章的主要內(nèi)容就是針對(duì)線性交互模型中存在的LIEcommon support兩個(gè)主要問(wèn)題,分析問(wèn)題的由來(lái)(模型設(shè)定錯(cuò)誤和數(shù)據(jù)不足)及可能的影響(估計(jì)量不一致且有偏或高度依賴模型)倔韭,提出了問(wèn)題的識(shí)別方法(LID plot)以及更普遍適用的估計(jì)量(Binning和Kernel)术浪,并且把新方法用于已有文章進(jìn)行檢驗(yàn)。

最后寿酌,作者建議分析交互作用的研究者采取以下安全措施:

  1. 畫(huà)LID圖以檢查原始數(shù)據(jù)胰苏。X|D和D|X最好都畫(huà)哦。
  2. 參考Binning估計(jì)量醇疼。
  3. 參考Kernel估計(jì)量硕并。
  4. 謹(jǐn)慎使用線性交互模型。得到Binning或Kernel估計(jì)量支持才使用線性模型秧荆,并且應(yīng)當(dāng)在有充分的共同支持的數(shù)據(jù)區(qū)域計(jì)算邊際效應(yīng)鲤孵。建立線性模型后還要再參考Brambor, Clark and Golder (2006)一文的使用指導(dǎo)。

彩蛋

論文作者的interflex使用指南
另外一種交互作用的圖示方法

學(xué)習(xí)愉快~晚安辰如!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市贵试,隨后出現(xiàn)的幾起案子琉兜,更是在濱河造成了極大的恐慌凯正,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,084評(píng)論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件豌蟋,死亡現(xiàn)場(chǎng)離奇詭異廊散,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)梧疲,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,623評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門(mén)允睹,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人幌氮,你說(shuō)我怎么就攤上這事缭受。” “怎么了该互?”我有些...
    開(kāi)封第一講書(shū)人閱讀 163,450評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵米者,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我宇智,道長(zhǎng)蔓搞,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,322評(píng)論 1 293
  • 正文 為了忘掉前任随橘,我火速辦了婚禮喂分,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘机蔗。我一直安慰自己蒲祈,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,370評(píng)論 6 390
  • 文/花漫 我一把揭開(kāi)白布蜒车。 她就那樣靜靜地躺著讳嘱,像睡著了一般。 火紅的嫁衣襯著肌膚如雪酿愧。 梳的紋絲不亂的頭發(fā)上沥潭,一...
    開(kāi)封第一講書(shū)人閱讀 51,274評(píng)論 1 300
  • 那天,我揣著相機(jī)與錄音嬉挡,去河邊找鬼钝鸽。 笑死,一個(gè)胖子當(dāng)著我的面吹牛庞钢,可吹牛的內(nèi)容都是我干的拔恰。 我是一名探鬼主播,決...
    沈念sama閱讀 40,126評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼基括,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼颜懊!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 38,980評(píng)論 0 275
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤河爹,失蹤者是張志新(化名)和其女友劉穎匠璧,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體咸这,經(jīng)...
    沈念sama閱讀 45,414評(píng)論 1 313
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡夷恍,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,599評(píng)論 3 334
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了媳维。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片酿雪。...
    茶點(diǎn)故事閱讀 39,773評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖侄刽,靈堂內(nèi)的尸體忽然破棺而出指黎,到底是詐尸還是另有隱情,我是刑警寧澤唠梨,帶...
    沈念sama閱讀 35,470評(píng)論 5 344
  • 正文 年R本政府宣布袋励,位于F島的核電站,受9級(jí)特大地震影響当叭,放射性物質(zhì)發(fā)生泄漏茬故。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,080評(píng)論 3 327
  • 文/蒙蒙 一蚁鳖、第九天 我趴在偏房一處隱蔽的房頂上張望磺芭。 院中可真熱鬧,春花似錦醉箕、人聲如沸钾腺。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,713評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)放棒。三九已至,卻和暖如春己英,著一層夾襖步出監(jiān)牢的瞬間间螟,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,852評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工损肛, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留厢破,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,865評(píng)論 2 370
  • 正文 我出身青樓治拿,卻偏偏與公主長(zhǎng)得像摩泪,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子劫谅,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,689評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容

  • 馬桶終于搞定了,近幾日用個(gè)水麻煩死鳄梅,快遞慢了點(diǎn)叠国,省了點(diǎn)錢(qián),拿著明天打牌戴尸,就坐地起價(jià)了! 另冤狡,關(guān)于價(jià)格與價(jià)值孙蒙! 看到...
    縱情嬉戲天地間閱讀 140評(píng)論 0 0
  • 1、了解推送原理 1.1悲雳、需要哪些組成部分:Your APP :你的應(yīng)用挎峦,包含一些信息 {AppID:你的APPi...
    藍(lán)白七七閱讀 995評(píng)論 1 1
  • 在《如何成為高效能教師》一書(shū)的學(xué)習(xí)中,我知道了當(dāng)人們除了自己之外合瓢,沒(méi)有其他學(xué)習(xí)榜樣時(shí)坦胶,便會(huì)懈怠。要向你的同...
    一葉一花_d911閱讀 253評(píng)論 0 1