本文是在我在這學(xué)期聽了北京大學(xué)國發(fā)院2019年春季學(xué)期沈艷老師開設(shè)的《高級計(jì)量經(jīng)濟(jì)學(xué)2》后對因果推斷部分的總結(jié)贯吓,主要涉及DID首有、RD砰左、傾向得分匹配、HCW及合成控制法等計(jì)量方法歇由。
因?yàn)槲恼掳撕芏辔覀€人的理解,免不了有所疏漏或者有理解不到位之處果港,還請大家批評指正沦泌。大家如果有興趣對因果推斷的方法進(jìn)一步探究,可以閱讀我在文章最下方列出的課程參考文獻(xiàn)以及我自己認(rèn)為對理解因果推斷很有幫助的一些文章辛掠。
首先谢谦,什么是因果推斷?我認(rèn)為因果推斷是用已有的證據(jù)去證明兩件事公浪、兩個變量之間的因果聯(lián)系他宛,比如證明教育年限對于工資水平的影響,或者是氣候變化對于農(nóng)作物產(chǎn)量的影響欠气,這里的教育年限和氣候變化就是因厅各,而工資水平和農(nóng)作物產(chǎn)量則是果。
用于驗(yàn)證因果關(guān)系最理想的辦法预柒,自然是做實(shí)驗(yàn)。繼續(xù)上文教育年限和工資水平的例子宜鸯,我們?nèi)绻胱C明教育年限對于工資水平有影響淋袖,在理想狀態(tài)下應(yīng)該找一群人即碗,控制他們的性別剥懒、年齡初橘、智商等等所以可能影響工資水平的因素不變化保檐,而只讓教育年限發(fā)生變化夜只,來觀察工資水平是否會發(fā)生變化以及發(fā)生多大的變化盐肃。但現(xiàn)實(shí)中,尤其是對于社會學(xué)科來說推盛,通常的研究對象是人耘成,很難像自然科學(xué)一樣在可以對各變量進(jìn)行嚴(yán)格控制的環(huán)境下進(jìn)行實(shí)驗(yàn)驹闰,所以就又有了下面我們要講的方法。
第一種是隨機(jī)控制實(shí)驗(yàn)(random control trial)师妙,也就是近些年比較火的RCT方法屹培。用藥品測試作為例子蓄诽,為了測試某種新藥到底有沒有效果仑氛,藥品公司招募了一批符合條件的被試者锯岖,將這些被試者隨機(jī)分入控制組或者實(shí)驗(yàn)組嚎莉∏髀幔控制組僅發(fā)放安慰劑叫确,而實(shí)驗(yàn)組則會發(fā)放真正的藥品竹勉,但是被試者并不知道發(fā)放到自己手中的藥品究竟是安慰劑還是開發(fā)的新藥。在實(shí)驗(yàn)結(jié)束以后娄琉,對比實(shí)驗(yàn)組與控制組的相應(yīng)身體指標(biāo)吓歇,二者之間的平均差異就是新藥的效果票腰。
第二種是自然實(shí)驗(yàn)(natural experiment)或者準(zhǔn)實(shí)驗(yàn)(quasi-experiment)城看。這類實(shí)驗(yàn)主要是指由于某些外部突發(fā)事件杏慰,使得當(dāng)事人仿佛隨機(jī)地被分配到了實(shí)驗(yàn)組和控制組测柠,因而可以進(jìn)行比較,探究是否存在因果關(guān)系缘滥。通過個體分組是否完全取決于這一突發(fā)事件,我們又可以進(jìn)一步將其分為兩類實(shí)驗(yàn):第一類個體分組完全取決于突發(fā)事件,比如1992年吟税,美國新澤西州通過法律將最低工資從每小時4.25美元提高到5.05美元,但在相鄰的賓夕法尼亞州最低工資依然保持不變异旧,這兩個州的雇主仿佛被隨機(jī)地分配到實(shí)驗(yàn)組(新澤西州)與控制組(賓夕法尼亞州)。這類自然實(shí)驗(yàn)可以直接用OLS估計(jì)因果效應(yīng)。第二類個體分組只是部分地由自然實(shí)驗(yàn)所決定潮针,如Angrist(1990) 考察越戰(zhàn)期間的參軍者术荤,當(dāng)時美國對全國年輕男子以生日抽簽的方式進(jìn)行征兵,盡管抽簽完全隨機(jī)每篷,但是否參軍取決于體檢瓣戚,且有些人得到豁免,另一些人未抽中卻自愿參軍焦读,此時應(yīng)以自然實(shí)驗(yàn)所帶來的隨機(jī)變動作為工具變量子库。
那在介紹完以上的實(shí)驗(yàn)之后,我們正式進(jìn)入因果推斷的框架矗晃。我們這里主要用到的是RCM的模型仑嗅,即Rubin Causal Model (RCM; Rubin 1978)。首先我們引入潛在因變量的概念。
什么叫做潛在因變量呢仓技?例如一個人上了大學(xué)鸵贬,我們想研究上大學(xué)這一事件對于他的收入帶來了多大的提升,這一提升叫做上大學(xué)這一事件的處理效應(yīng)浑彰。為了計(jì)算這一處理效應(yīng)恭理,我們就要對這個人上了大學(xué)的收入和沒上大學(xué)的收入兩者相減。但在實(shí)際情況中郭变,我們只能觀察到他上了大學(xué)的收入,而無法觀察到他沒上大學(xué)的話收入是多少涯保,因?yàn)橐粋€人無法像薛定諤的貓一樣同時兼具兩種狀態(tài)诉濒,要么是生,要么是死夕春,一旦一種狀態(tài)被確定未荒,另一種狀態(tài)下發(fā)生的事情就無法觀測到了。此時及志,這個無法觀測到的因變量就叫做潛在因變量片排。那我們引入以下的一些notation。
接下來我們就要定義所謂的處理效應(yīng)速侈。因?yàn)榭傮w可以分為實(shí)驗(yàn)組和控制組率寡,相應(yīng)在總體、實(shí)驗(yàn)組和控制組三個層面上就有三種處理效應(yīng)倚搬。用我們上面提到的總體處理效應(yīng)是指總體隨機(jī)分配個體到實(shí)驗(yàn)組與控制組所得到的處理效應(yīng)冶共,即。而實(shí)驗(yàn)組處理效應(yīng)為
每界⊥苯控制組的處理效應(yīng)為
。這三者之間的關(guān)系是
眨层,即總體處理效應(yīng)是實(shí)驗(yàn)組處理效應(yīng)與控制組處理效應(yīng)的權(quán)重加總庙楚。
在現(xiàn)實(shí)中由于潛在因變量的問題,我們往往無法估計(jì)以上三種處理效應(yīng)趴樱。我們往往通過比較實(shí)驗(yàn)組與處理組的平均差異來近似個體處理效應(yīng)馒闷,即:
當(dāng)趨于無窮時,該值依概率收斂于
伊佃,經(jīng)過一番操作后可以化為
第一個花括號內(nèi)即為實(shí)驗(yàn)組的處理效應(yīng)窜司,第二個花括號內(nèi)是由實(shí)驗(yàn)組和控制組解釋變量差異帶來的混淆效應(yīng),即實(shí)驗(yàn)組和控制組個體本身的異質(zhì)性航揉,第三個花括號內(nèi)是實(shí)驗(yàn)組和控制組個體不可觀測因素帶來的偏差塞祈。
為了使估計(jì)的總體處理效應(yīng)在期望上等于實(shí)驗(yàn)組的處理效應(yīng),我們需要引入以下兩個假定:
Assumption 1:
Assumption 2:
第一個假定表明在控制了解釋變量之后帅涂,實(shí)驗(yàn)組與控制組個體的選擇與潛在因變量獨(dú)立议薪。第二個假定叫做重合假定尤蛮,表明實(shí)驗(yàn)組與控制組應(yīng)當(dāng)在一個范圍內(nèi)都有觀測值。這兩個假定合起來稱為“the strongly ignorable treatment assignment”假定斯议。
如果以上兩個假定成立产捞,那么我們就可以選用回歸、傾向得分匹配的方法哼御。反之坯临,則根據(jù)需要選用工具變量、DID恋昼、RD看靠、HCW、合成控制法等液肌。
除了假定以外挟炬,實(shí)驗(yàn)組分配機(jī)制也是決定我們能否使用因果推斷以及使用哪種因果推斷方法的重要因素。一般而言嗦哆,我們都需要考慮實(shí)驗(yàn)組分配機(jī)制是否存在內(nèi)部有效性和外部有效性的問題谤祖。內(nèi)部有效性問題主要包含:1)未能完全隨機(jī)分組;2)未能完全遵從實(shí)驗(yàn)設(shè)計(jì)老速;3)中途退出實(shí)驗(yàn)粥喜;4)觀察效應(yīng)或霍桑效應(yīng),即觀察者會給實(shí)驗(yàn)者的行為造成擾動烁峭;5)樣本量過小容客。內(nèi)部有效性問題主要存在于實(shí)驗(yàn)設(shè)計(jì)本身,而外部有效性問題影響實(shí)驗(yàn)結(jié)果是否能夠推廣约郁,具有參考價(jià)值和普遍的代表性缩挑,主要包括:1)樣本代表性不足;2)小型實(shí)驗(yàn)的條件與大規(guī)模推廣時的現(xiàn)實(shí)條件不同鬓梅;3)一般均衡效應(yīng)供置,以市場供需為例,市場在達(dá)到均衡與未達(dá)到均衡時供需機(jī)制顯然是不同的绽快;4)自我選擇效應(yīng)芥丧,以就業(yè)培訓(xùn)項(xiàng)目為例,選擇進(jìn)入就業(yè)培訓(xùn)項(xiàng)目的人往往在近幾年收入較低坊罢,因此研究就業(yè)培訓(xùn)項(xiàng)目對收入的影響就會存在內(nèi)生性問題续担。
因?yàn)槲恼卤容^長,所以我們這部分就先介紹RCM基本框架活孩,接下來依次為大家介紹這一框架下不同的因果推斷方法物遇。
相關(guān)網(wǎng)頁:
Rubin Causal Model (RCM) 和隨機(jī)化試驗(yàn)(作者寫的一系列關(guān)于因果推斷的文章可讀性很不錯,大家有興趣可以一覽)