問:工具變量到什么程度才合適靶衍?
對(duì)短面板數(shù)據(jù)進(jìn)行GMM回歸的時(shí)候酪我,遇到兩種情況:
①工具變量通過了弱工具變量檢驗(yàn)、識(shí)別不足和過度識(shí)別檢驗(yàn)泊业,再用DM檢驗(yàn)的時(shí)候還是顯著的把沼;
②工具變量通過了弱工具變量檢驗(yàn)、識(shí)別不足和過度識(shí)別檢驗(yàn)吁伺,但用DM檢驗(yàn)的時(shí)候不是顯著的饮睬;
看到連玉君教授的一篇文章,選了兩個(gè)工具變量篮奄,匯報(bào)了工具變量通過了識(shí)別不足和過度識(shí)別檢驗(yàn)捆愁,DWH檢驗(yàn)顯著。
由此窟却,認(rèn)為符合第一種情況表明選取的工具變量合適昼丑;但也不太確定,想聽聽您的看法夸赫。
答:
工具變量方法經(jīng)歷了兩個(gè)階段的發(fā)展菩帝。傳統(tǒng)的工具變量方法中,在線性模型設(shè)定下茬腿,工具變量需要滿足工具變量外生性和工具變量相關(guān)性兩個(gè)假設(shè)胁附,這在本科層次的計(jì)量教科書中一般都有涉及。在這種情況下滓彰,滿足這兩個(gè)假設(shè)的變量才是合格的工具變量控妻。Imbens and Angrist(1994)一文的發(fā)表則將工具變量方法推向了新的階段,在這一發(fā)展階段揭绑,允許異質(zhì)性處理效應(yīng)存在弓候,工具變量方法識(shí)別假設(shè)的提出和估計(jì)量的推導(dǎo)都是在Donald Rubin提出的潛在結(jié)果分析框架下進(jìn)行的,此時(shí)IV估計(jì)的是局部平均處理效應(yīng)他匪,IV估計(jì)的有效性要求工具變量滿足四個(gè)條件:(1)工具變量是隨機(jī)產(chǎn)生的菇存;(2)滿足排他性約束;(3)滿足單調(diào)性假設(shè)邦蜜;(4)滿足工具變量相關(guān)性依鸥。嚴(yán)格的數(shù)學(xué)表達(dá)請(qǐng)參見Imbens and Angrist(1994)。提問中提到的的“工具變量到什么程度才合適悼沈?”贱迟,準(zhǔn)確的回答應(yīng)該是滿足上述四條假設(shè)才合適姐扮。
提問中提到的弱工具變量檢驗(yàn)用于檢驗(yàn)假設(shè)(4);識(shí)別不足檢驗(yàn)只需要滿足工具變量的個(gè)數(shù)多余內(nèi)生變量的個(gè)數(shù)衣吠,這個(gè)通常都是滿足的茶敏;過度識(shí)別檢驗(yàn)是在假設(shè)不存在異質(zhì)性處理效應(yīng)的情況下,檢驗(yàn)工具變量是否外生的一種方法缚俏,該檢驗(yàn)只有在存在過度識(shí)別(工具變量個(gè)數(shù)(用N表示)多于內(nèi)生變量個(gè)數(shù)(用K表示))的情況下才可以做惊搏,并且要求至少有K個(gè)工具變量已經(jīng)滿足外生性條件,這樣才能檢驗(yàn)剩下的N-K個(gè)變量是否外生忧换。因此恬惯,總結(jié)來看過度識(shí)別假設(shè)檢驗(yàn)需要兩個(gè)很強(qiáng)的假設(shè):(1)至少有K個(gè)有效地工具變量;(2)不存在異質(zhì)性處理效應(yīng)亚茬,因此使用過度識(shí)別檢驗(yàn)檢驗(yàn)工具變量的外生性并不是一種可靠地方法酪耳,其檢驗(yàn)結(jié)果能夠提供的有效性信息并不多。DM檢驗(yàn)(此處指的應(yīng)該是Davidson-MacKinnon檢驗(yàn))則是用于檢驗(yàn)OLS估計(jì)量是否是一致估計(jì)才写,即解釋變量是否存在內(nèi)生性的檢驗(yàn)方法葡兑,同更常用的Hausman test類似。有觀點(diǎn)認(rèn)為赞草,只有當(dāng)DW檢驗(yàn)或者Hausman檢驗(yàn)拒絕原假設(shè)讹堤,即顯示OLS估計(jì)存在內(nèi)生性的時(shí)候,才需要使用IV估計(jì)厨疙,因?yàn)镮V估計(jì)雖然和OLS估計(jì)一樣是一致估計(jì)量的洲守,但是有效性劣于OLS估計(jì)。但是沾凄,上述內(nèi)生性檢驗(yàn)依賴于我們已經(jīng)擁有了有效的工具變量梗醇,從而能夠得到一致估計(jì)量,這是很強(qiáng)的假設(shè)撒蟀,很難實(shí)現(xiàn)叙谨,因?yàn)檎业揭粋€(gè)符合條件的IV實(shí)在太難了,更重要的是保屯,我們無法保證我們所使用的工具變量是有效的手负,所以我們也無法保證DM檢驗(yàn)或者Hausman檢驗(yàn)的結(jié)論一定是有效的。在這種情況下姑尺,我本人更傾向于基于變量之間的理論關(guān)系和具體的模型設(shè)定來判斷OLS估計(jì)是否內(nèi)生竟终,從而決定是否需要采用工具變量方法,而不是依賴于某個(gè)檢驗(yàn)切蟋。
參考文獻(xiàn):Imbens and Angrist, 1994,“Identification and Estimation of Local Average Treatment Effects”, Econometrica, 62(2): 467-475.
問:如圖统捶,自變量與交乘項(xiàng)多重共線性過高,怎么辦?
答:
解釋變量之間存在高度的共線性本身并不一定影響方程的估計(jì)喘鸟。首先匆绣,當(dāng)前實(shí)證研究的核心目的在于實(shí)現(xiàn)因果推斷迷守,即估計(jì)某一個(gè)特定解釋變量X對(duì)被解釋變量Y的因果關(guān)系犬绒,如果高度共線性只是存在于控制變量之間旺入,則既不會(huì)影響X參數(shù)估計(jì)的一致性兑凿,也不會(huì)影響有效性,我們完全無需擔(dān)心茵瘾;其次礼华,如果我們關(guān)心的變量X同其他控制變量,例如變量Z之間存在高度共線拗秘,則共線性本身不影響我們估計(jì)的一致性圣絮,但是會(huì)影響估計(jì)的有效性。在第二種情況下雕旨,如果Z本身對(duì)Y有影響扮匠,遺漏Z會(huì)導(dǎo)致嚴(yán)重的遺漏變量偏誤,因此凡涩,根據(jù)一致性優(yōu)先于有效性的原則棒搜,我們?nèi)匀恍枰刂谱兞縕;如果Z本身對(duì)Y沒有影響活箕,則Z屬于無關(guān)變量力麸,遺漏Z不會(huì)影響一致性,但能夠改善有效性育韩,我們應(yīng)該從方程中去掉Z克蚂。
學(xué)術(shù)指導(dǎo):張曉峒老師
本期解答人:張川川老師
編輯:粥粥 小精靈 一個(gè)聰慧的人
統(tǒng)籌:芋頭
技術(shù):知我者