第13章 試驗和準試驗

? ? ? ? 雖然經(jīng)濟中的隨機對照試驗并不常見拜秧,但是有三個理由表明有必要在計量經(jīng)濟學課程中學習它:

? ? ①首先拓提,從概念層面上講,理想化隨機對照試驗的概念提供了在實際中判斷因果效應估計的基準;

? ? ②其次,當實際實施試驗時齿坷,它們的結果可能是非常具有影響力的桂肌,因此了解實際試驗的局限和有效性威脅及其優(yōu)點都是非常重要的;

? ? ③最后永淌,有時外部環(huán)境會產(chǎn)生看似隨機的東西崎场,即由于某些外部事件,對待某些個體就像它是隨機的遂蛀,亦即準試驗/自然試驗谭跨。


一、理想化試驗和因果效應

????????隨機分配的效應可用下面的一元回歸模型表述:Y_i=\beta_0+\beta_1X_i+u_i\quad(1)

? ? 其中X_i為處理水平李滴,u_i包含了所有決定結果Y_i的其他因素

????????理想化隨機試驗的中心思想是通過從總體中隨機抽取個體螃宙,然后將處理隨機分配給其中某些個體來度量因果效應

? ??????xY的因果效應(causal effect)為條件期望之差\mathbb{E}(Y|X=x)-\mathbb{E}(Y|X=0),其中\mathbb{E}(Y|X=x)為理想化隨機對照試驗中接受處理水平x的處理組的Y期望值所坯,\mathbb{E}(Y|X=0)為對照組的Y期望值谆扎,參數(shù)估計值\hat{\beta}即為差異估計量(differences estimator)


二、實際試驗中的潛在問題

? ? 1.內(nèi)部有效性的威脅

? ? ? ? 減弱了有關因果效應的統(tǒng)計推斷對研究總體及其環(huán)節(jié)的真實可信性

? ? ①非隨機化

? ? ? ? 如果處理不隨隨機分配的芹助,而是部分取決于主體的特征或偏好堂湖,測試結果同時反映了處理的效應和非隨機分配的效應

? ? ②沒有遵循處理協(xié)議

? ? ? ? 個體沒有完全遵循隨機處理協(xié)議,稱為部分服從(partial compliance)處理協(xié)議

? ? ③損耗

? ? ? ? 隨機分配到處理組和對照組中的主體離開了研究

? ? ④試驗效應

? ? ? ? 在以人為主體的試驗中状土,僅僅是主體處在試驗中的事實也可能會影響他們的行為无蜂,這種現(xiàn)象有時被稱為霍索恩效應(Hawthorne effect)

? ? ⑤小樣本

? ? ? ? 由于以人為主體的試驗可能非常昂貴,因此樣本容量有時候很小

? ? ? ? 雖然小樣本容量不會使因果效應的估計量有偏蒙谓,但它確實意味著因果效應的估計不是精確的


? ? 2.外部有效性的威脅

? ? ? ? 減弱了將研究結果推廣到其他總體及環(huán)境的能力

? ? ①非代表性樣本

? ? ? ? 研究總體和感興趣總體必須充分相似才能保證試驗結果的推廣是正確的

? ? ②非代表性的項目或政策

? ? ? ? 感興趣的政策或項目必須和研究的項目充分相似才能將其結果推廣

? ? ③一般均衡效應

? ? ? ? 與規(guī)模和持續(xù)時間有關的問題涉及經(jīng)濟學家們所謂的“一般均衡”效應

? ? ④處理對資格的效應

? ? ? ? 由于在經(jīng)濟和一般社會項目中酱讶,實際非試驗項目的參與者通常是非志愿的,因此產(chǎn)生了另一種外部有效性的威脅


三彼乌、基于試驗數(shù)據(jù)的因果效應回歸估計量

? ? 1.包含其他回歸變量時的差異估計量

? ? ? ? 通常我們能獲得與決定試驗結果有關主體的其他特征數(shù)據(jù),如果除了處理X_i以外這些個體特征也是決定結果Y_i的因素渊迁,則這些變量隱含在(1)的誤差項里

? ? ? ? 若假定以線性形式加入上述特征慰照,則我們可以得到如下多元回歸模型:Y_i=\beta_0+\beta_1X_i+\beta_2W_i+u_i\quad(2)

? ? 其中X為處理變量,W為控制變量

? ? ? ? 處理變量和控制變量間的差異可通過條件均值獨立性假設琉朽,即給定X_i,W_i變量時毒租,u_i的條件期望不依賴于X_i,但可以依賴于W_i箱叁,此時W_i變量的系數(shù)不再是其因果效應的一致估計量


????2.包含其他回歸變量時采用差異估計量的理由

? ? ①效率

? ? ? ? 如果處理是隨機分配的墅垮,則模型(2)\beta_1的OLS估計量比模型(1)中OLS估計量有效,原因是包含其他決定因素后減小了誤差項的方差

? ? ②隨機化的檢驗

? ? ? ? 如果處理不是隨機分配的耕漱,尤其是當處理是根據(jù)與W有關的方式分配的算色,則模型(1)中差異估計量是非一致的且一般情況下其概率極限不等于包含其他回歸變量時模型(2)中差異估計量的概率極限

? ? ? ? 也就是說,兩個OLS估計的巨大差異表明螟够,X其實不是隨機分配的


? ? 3.倍差估計量

? ? ? ? 試驗數(shù)據(jù)通常是面板數(shù)據(jù)灾梦,即對同一主體在試驗前和試驗后的觀測

? ? ? ? 有了面板數(shù)據(jù)后峡钓,我們可以用倍差估計量來估計因果效應,即處理組在試驗過程中Y的平均變化減去同一時間段內(nèi)控制組中Y的平均變化

? ? ? ? 令\overline{Y}^{treatment,before}表示試驗前處理組中Y的樣本均值若河,\overline{Y}^{treatment,after}表示試驗后處理組中Y的樣本均值

????????又令\overline{Y}^{control,before}表示試驗前對照組中Y的樣本均值能岩,\overline{Y}^{control,after}表示試驗后對照組中Y的樣本均值

? ? ? ? 倍差估計量(differences-in-differences estimator)為處理組的Y平均變化減去對照組的Y平均變化,即

\begin{align*}\hat{\beta}_1^{diffs-in-diffs}&=(\overline{Y}^{treatment,after}-\overline{Y}^{treatment,before})-(\overline{Y}^{control,after}-\overline{Y}^{control,before})\\&=\Delta\overline{Y}^{treatment}-\Delta\overline{Y}^{control}\quad(3)\end{align*}

? ? ? ? 若處理是隨機分配的萧福,則\hat{\beta}_1^{diffs-in-diffs}是因果效應的無偏拉鹃、一致估計量

? ? ? ? 我們用回歸符合表示倍差估計量,得\Delta Y_i=\beta_0+\beta_1X_i+u_i\quad(4)


? ? ? ? 采用倍差估計量的理由

? ? ①效率

? ? ? ? 如果處理是隨機接受的鲫忍,且不可觀測決定因素隨時間持續(xù)存在膏燕,則倍差估計量可能比差異估計量更有效

? ? ②消除了Y中的處理前差異

? ? ? ? 倍差估計量通過集中于Y在試驗過程中的變化,從而消除了處理組和對照組初始Y值系統(tǒng)差異的影響


? ? ? ? 包含其他回歸變量時的倍差估計量:\Delta Y_i=\beta_0+\beta_1X_i+\beta_2W_i+u_i\quad(5)

? ? 4.不同組的因果效應估計

? ? ? ? 取決于個體特征饲窿,不同主體間的因果效應可能是不同的

? ? ? ? 依賴于可觀測變量W_i的因果效應煌寇,可通過加入處理變量X_i與控制變量W_i的交互效應進行估計

? ? 5.存在部分服從時的估計

? ? ? ? 如果存在部分服從試驗協(xié)議的情況,則處理水平X_i可能與不可觀測的個體特征u_i相關逾雄,因此到目前為止的OLS估計量都是非一致的

? ? ? ? 工具變量提供了假定有一個工具變量時阀溶,解決回歸變量和誤差相關的一般方法;在部分服從的試驗中鸦泳,分配的處理水平可作為實際處理水平的工具變量

? ? 6.隨機化檢驗

? ? ? ? 通過檢查隨機化的變量實際上是否依賴于任何可觀測個體特征可檢驗隨機化银锻。

? ? ①隨即接受處理的檢驗

? ? ? ? 如果處理是隨機接受的,則X_i與可觀測的個體特征不相關

? ? ? ? 因此做鹰,隨機接受處理的假設可通過X_i關于W_i回歸中W_i系數(shù)均為零的假設

? ? ②隨機接受分配的檢驗

? ? ? ? 如果處理是隨機分配的击纬,則分配Z_i與可觀測的個體特征不相關

? ? ? ? 因此,隨機接受分配的假設可通過Z_i關于W_i回歸中W_i系數(shù)均為零的假設


四钾麸、準試驗

? ? ? ? 由于成本更振、倫理和實踐原因,真正的隨機對照試驗在社會科學與醫(yī)藥科學中是非常罕見的饭尝,但隨機對照試驗的統(tǒng)計洞察力和方法可運用到非試驗背景中

? ? ? ? 準試驗(quasi-experiment)肯腕,亦稱自然試驗(natural experiment),通過個體境況的差異引入的隨機性钥平,使處理看上去就像是隨機分配的实撒,這些個體境況的差異可能是由于法律制度、位置涉瘾、政策或項目實施時間知态、自然隨機性如生日、降雨或其他與研究效應無關的不同因素造成的

? ? ? ? 由于準試驗通常不具有真正的隨機性立叛,因此處理組和對照組之間可能存在系統(tǒng)差異负敏,此時在回歸中包含個體處理前特征的可觀測度量W是很重要的


? ? ? ? 存在兩種準試驗:

? ? ①把個體或更一般的實體是否接受處理看作是隨機確定的,在這種情況下秘蛇,可通過把處理X_i當作回歸變量并利用OLS來估計因果效應

? ? ②這種“就像”隨機的變異只是處理的部分決定因素原在,在這種情況下友扰,可通過工具變量回歸來估計因果效應,其中工具變量為“就像”隨機的變異來源


五庶柿、準試驗的潛在問題

? ? 1.內(nèi)部有效性的威脅

? ? ①非隨機化

? ? ? ? 準試驗依賴于諸如法律變化村怪、突發(fā)不相關事件等個體境況的差異提供“就像”隨機分配的處理水平。如果這種“就像”隨機的選擇無法產(chǎn)生隨機的處理水平X浮庐,則OLS估計量一般是有偏的甚负,或工具變量估計量是非一致的

? ? ②沒有遵循試驗協(xié)議

? ? ? ? 在真正的試驗中,當處理組成員沒有接受處理或?qū)φ战M成員實際上接受了處理時就表示沒有遵循試驗協(xié)議审残;結果導致因果效應的OLS估計量中存在選擇偏差梭域,準試驗中對應著“就像”隨機的選擇影響了但不是決定了處理水平

? ? ③損耗

? ? ? ? 由于個人選擇和特征引入的損耗會造成處理水平和誤差項相關,在這種意義下準試驗中的損耗類似于真正試驗中的損耗搅轿,由此會產(chǎn)生樣本選擇偏差病涨,故因果效應的OLS估計量是有偏的、非一致的

? ? ④試驗效應

? ? ? ? 由于準試驗不是真正的試驗璧坟,因此個體一般沒有理由認為他們是試驗對象既穆,這是準試驗的一個優(yōu)勢

? ? ⑤準試驗中的工具有效性

? ? ? ? 評估利用工具變量回歸研究的重要一步,是仔細考查工具變量事實上是否有效雀鹃,即工具相關性和工具外生性


? ? 2.外部有效性的威脅

? ? ? ? 準試驗研究使用的是觀測數(shù)據(jù)幻工,因此基于準試驗研究的外部有效性威脅通常類似于基于觀測數(shù)據(jù)的傳統(tǒng)回歸威脅


六、異質(zhì)總體的試驗和準試驗估計

? ? ? ? 因果效應可能取決于個體特征黎茎,即在總體不同成員間可能是不同的囊颅,我們稱這種總體內(nèi)因果效應中的不可觀測差異情形為具有一個異質(zhì)總體

? ? 1.總體異質(zhì)性:誰的因果效應

? ? ? ? 若總體內(nèi)每一成員的因果效應相同,則在這個意義下總體是同質(zhì)的傅瞻,此時包含一個因果效應\beta_1的模型(1)適用于總體的所有成員踢代;但實際研究的總體可能是異質(zhì)的,特別是因果效應可能由于個體情況嗅骄、背景和其他特征不同而不同

? ? ? ? 第i個個體有其自己的截距\beta_{0i}和因果效應\beta_{1i}奸鬓,即對于這個人的處理效應,則總體回歸方程可以表示為:Y_i=\beta_{0i}+\beta_{1i}X_i+u_i\quad(6)

? ? ? ? 給定總體的因果效應掸读,是總體成員為隨機抽取試驗中的期望效應;當總體為異質(zhì)時宏多,這個效應實際上是平均因果效應(average causal effect)儿惫,也稱平均處理效應(average treatment effect),即個體因果效應的總體均值

? ? ? ? IV估計量中伸但,若X_iZ_i部分影響肾请,則基于工具變量Z_i的IV估計量得到的是因果效應的加權平均,其中受到工具變量影響大的個體其權重大

????2.異質(zhì)因果效應的OLS

? ? ? ? 假設受到的處理X_i是完全服從下的隨機分配或“就像”隨機分配的更胖,于是\mathbb{E}(u_i|X_i)=0铛铁,且差異估計量\hat{\beta}_1是平均因果效應的一致估計量

? ? 3.異質(zhì)因果效應的IV回歸

? ? ? ? 假定處理只是部分隨機確定的隔显,Z_i是一個有效的工具變量(相關且外生),且Z_iX_i的效應是異質(zhì)的饵逐,具體假定X_iZ_i之間具有如下線性模型關系:X_i=\pi_{0i}+\pi_{1i}Z_i+v_i\quad(7)括眠,其中不同個體的系數(shù)\pi_{0i},\pi_{1i}不同

? ? ? ? 已知TSLS估計量\hat{\beta}_1^{TSLS}=\frac{s_{ZY}}{s_{ZX}}\xrightarrow{p}\frac{\sigma_{ZY}}{\sigma_{ZX}}=\frac{\mathbb{E(}{\beta_{1i}\pi_{1i})}}{\mathbb{E}(\pi_{1i})},即個人因果效應\beta_{1i}的加權平均倍权,權為\pi_{1i}/\mathbb{E}(\pi_{1i})掷豺,即TSLS估計量是個體因果效應加權平均的一致估計量,稱通過TSLS估計的加權平均因果效應為局部平均處理效應(local average treatment effect)

最后編輯于
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末薄声,一起剝皮案震驚了整個濱河市当船,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌默辨,老刑警劉巖德频,帶你破解...
    沈念sama閱讀 219,490評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異缩幸,居然都是意外死亡壹置,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,581評論 3 395
  • 文/潘曉璐 我一進店門桌粉,熙熙樓的掌柜王于貴愁眉苦臉地迎上來蒸绩,“玉大人,你說我怎么就攤上這事铃肯』家冢” “怎么了?”我有些...
    開封第一講書人閱讀 165,830評論 0 356
  • 文/不壞的土叔 我叫張陵押逼,是天一觀的道長步藕。 經(jīng)常有香客問我,道長挑格,這世上最難降的妖魔是什么咙冗? 我笑而不...
    開封第一講書人閱讀 58,957評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮漂彤,結果婚禮上雾消,老公的妹妹穿的比我還像新娘。我一直安慰自己挫望,他們只是感情好立润,可當我...
    茶點故事閱讀 67,974評論 6 393
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著媳板,像睡著了一般桑腮。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上蛉幸,一...
    開封第一講書人閱讀 51,754評論 1 307
  • 那天破讨,我揣著相機與錄音丛晦,去河邊找鬼。 笑死提陶,一個胖子當著我的面吹牛烫沙,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播搁骑,決...
    沈念sama閱讀 40,464評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼斧吐,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了仲器?” 一聲冷哼從身側響起煤率,我...
    開封第一講書人閱讀 39,357評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎乏冀,沒想到半個月后蝶糯,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,847評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡辆沦,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,995評論 3 338
  • 正文 我和宋清朗相戀三年昼捍,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片肢扯。...
    茶點故事閱讀 40,137評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡妒茬,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出蔚晨,到底是詐尸還是另有隱情乍钻,我是刑警寧澤,帶...
    沈念sama閱讀 35,819評論 5 346
  • 正文 年R本政府宣布铭腕,位于F島的核電站银择,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏累舷。R本人自食惡果不足惜浩考,卻給世界環(huán)境...
    茶點故事閱讀 41,482評論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望被盈。 院中可真熱鬧析孽,春花似錦、人聲如沸只怎。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,023評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽尝盼。三九已至,卻和暖如春佑菩,著一層夾襖步出監(jiān)牢的瞬間盾沫,已是汗流浹背裁赠。 一陣腳步聲響...
    開封第一講書人閱讀 33,149評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留赴精,地道東北人佩捞。 一個月前我還...
    沈念sama閱讀 48,409評論 3 373
  • 正文 我出身青樓,卻偏偏與公主長得像蕾哟,于是被迫代替她去往敵國和親一忱。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,086評論 2 355