Bartik IV/SSIV(Shift-Share IV)真的很火锋爪,去年至今參加的每一次會(huì)議都會(huì)遇到使用SSIV的經(jīng)驗(yàn)研究。而最近爸业,好多人給我發(fā)郵件其骄,說(shuō)審稿人總是說(shuō),“IV還是不能令人信服”扯旷。其實(shí)拯爽,這就是為什么“朋友不建議朋友用IV”的根本原因。
我的效應(yīng)評(píng)估理念是“在目前的技術(shù)水平下钧忽,因果效應(yīng)評(píng)估的應(yīng)用研究永遠(yuǎn)得不到真實(shí)的處理效應(yīng)(true ATE/ATT)毯炮,因?yàn)锳TE定義中的反事實(shí)結(jié)果永遠(yuǎn)觀測(cè)不到數(shù)據(jù)。既然如此耸黑,做計(jì)量的(最終)目標(biāo)并不是得到真實(shí)處理效應(yīng)桃煎,而是要盡可能的“接近”真實(shí)處理效應(yīng)”。而計(jì)量的過(guò)程就是這個(gè)“接近”的過(guò)程大刊。
理論上为迈,有效的IV是可以得到真實(shí)的處理效應(yīng)的,不過(guò)現(xiàn)實(shí)中的IV同樣面臨的上述問(wèn)題缺菌。所以在應(yīng)用研究中葫辐,IV也要盡可能的“接近”真實(shí)的處理效應(yīng)。而B(niǎo)artik IV/SSIV利用的就是近似外生的沖擊(要么來(lái)源于shift伴郁,要么來(lái)源于share)來(lái)接近真實(shí)處理效應(yīng)的過(guò)程耿战。但是,Bartik IV/SSIV在應(yīng)用中到底要怎么做焊傅?
現(xiàn)在也有很多文獻(xiàn)應(yīng)用了SSIV剂陡,但是很可惜,大部分的文獻(xiàn)都仍然停留在SSIV理論進(jìn)展(Goldsmith-Pinkham, Paul, Isaac Sorkin, and Henry Swift. 2020租冠;Kirill Borusyak, Peter Hull, Xavier Jaravel鹏倘,2022;Kirill Borusyak顽爹, Peter Hull纤泵,2023)之前的階段,僅僅只是應(yīng)用SSIV的思想镜粤,而不是真正的應(yīng)用它捏题。我推薦的是,既然要用SSIV肉渴,就應(yīng)用把最新的理論進(jìn)展也應(yīng)用了公荧,不然為什么要“跟風(fēng)”“追熱點(diǎn)”?我也能猜到同规,為什么現(xiàn)在國(guó)內(nèi)大部分經(jīng)驗(yàn)研究仍然停留在SSIV理論進(jìn)展之前的階段:沒(méi)有可參考的完整應(yīng)用SSIV最新理論進(jìn)展的經(jīng)驗(yàn)文獻(xiàn)循狰。今天就給大家推薦一篇文章窟社,希望對(duì)Bartik IV/SSIV最新理論進(jìn)展應(yīng)用感興趣人都能好好讀讀,認(rèn)真思考思考:
這篇文章已經(jīng)發(fā)表出來(lái)了绪钥,復(fù)制代碼和數(shù)據(jù)也是公開(kāi)的灿里。
Wright T J. Replication of “How much does immigration boost innovation?”[J]. Economic Inquiry, 2024.
Hunt and Gauthier‐Loiselle (2010) (hereafter HGL)研究了移民對(duì)創(chuàng)新的影響。Wright(2024)嘗試重構(gòu)HGL的IV程腹,但是并不能與HGL完全一致匣吊。Wright(2024)首先重新估計(jì)了結(jié)果,并于原文結(jié)果對(duì)比寸潦,如下表1和2所示色鸳,分別對(duì)應(yīng)原文的表7和表8結(jié)果。
兩表的結(jié)果第一列是原文的結(jié)果见转,而第二列則是Wright(2024)重估的結(jié)果命雀,兩個(gè)結(jié)果都非常接近。所以即使IV數(shù)據(jù)與原文并不一致斩箫,仍然可以復(fù)制原文結(jié)果咏雌。
Bartik IV的最新理論進(jìn)展應(yīng)用
需要注意的是,Bartik IV/SSIV最新的進(jìn)展就是關(guān)注其有效性校焦。因此赊抖,源于shares的識(shí)別并不是SSIV有效的唯一方法。那么寨典,如何呈現(xiàn)實(shí)證過(guò)程氛雪,展示哪種研究設(shè)計(jì)和識(shí)別假設(shè)符合我們的應(yīng)用呢?
Goldsmith‐Pinkham et al. (2020)同時(shí)強(qiáng)調(diào)耸成,描述研究設(shè)計(jì)报亩,以展示共同沖擊的差異化外生暴露。以移民為例井氢,因?yàn)镾SIV結(jié)合了許多變動(dòng)(variation)來(lái)源弦追,Goldsmith‐Pinkham et al. (2020)發(fā)現(xiàn)SSIV估計(jì)量等價(jià)于用精確識(shí)別的估計(jì)量和每個(gè)國(guó)家移民份額加權(quán)組合作為單一IV。Goldsmith‐Pinkham et al. (2020)將權(quán)重稱為Rotemberg權(quán)重花竞,劲件。注意,有一些權(quán)重為負(fù)约急。
下表3呈現(xiàn)了正負(fù)權(quán)重之和零远、均值和占比,以及大學(xué)和研究生畢業(yè)兩種類別各自的加權(quán)和厌蔽。
對(duì)于大學(xué)畢業(yè)(panel A)牵辣,有45.5%的權(quán)重為負(fù),對(duì)于研究生(panel B)奴饮,有44.4%的權(quán)重為負(fù)纬向。權(quán)重之和(sum)是Rotemberg權(quán)重與點(diǎn)估計(jì)量的加權(quán)和择浊,上述結(jié)果計(jì)算的是正負(fù)權(quán)重的工具。這是為了展示負(fù)權(quán)重的重要性——如果權(quán)重為負(fù)的工具的加權(quán)和很大(相對(duì)于正權(quán)重的工具)逾条,那么近她,我們認(rèn)為收到負(fù)權(quán)重的點(diǎn)估計(jì)量驅(qū)動(dòng)了總的估計(jì)效應(yīng)。負(fù)權(quán)重在同質(zhì)處理效應(yīng)時(shí)并不是問(wèn)題膳帕,但是對(duì)于異質(zhì)性處理效應(yīng)可能就會(huì)有偏誤。在異質(zhì)性處理效應(yīng)下薇缅,負(fù)權(quán)重有可能會(huì)使得Bartik IV不具有LATE(局部平均處理效應(yīng))性質(zhì)危彩。在上表3中,負(fù)權(quán)重之和不算太大(panel A中是-0.099還算好理解泳桦,panel B中是-0.229汤徽,但是相對(duì)于Goldsmith‐Pinkham et al. (2020)考慮的-0.368還是算小的)。而加權(quán)和(第四列)灸撰,大學(xué)畢業(yè)更小谒府,而研究生更大。從目前的理論和應(yīng)用來(lái)看浮毯,“多大算大”并沒(méi)有實(shí)踐標(biāo)準(zhǔn)(沒(méi)有合意的閾值)完疫,但是,Goldsmith‐Pinkham et al. (2020)得到負(fù)權(quán)重工具的加權(quán)和的值為6%债蓝,正權(quán)重也類似的規(guī)模壳鹤,而上表3中研究生的負(fù)權(quán)重工具的加權(quán)和為12%,而正權(quán)重達(dá)到23%饰迹。
此外芳誓,這些權(quán)重反映的是估計(jì)量對(duì)于第k個(gè)工具誤設(shè)的敏感性。也就是說(shuō)啊鸭,
越大锹淌,如果工具誤設(shè),那么偏誤越大赠制。
為了刻畫(huà)外生變動(dòng)的來(lái)源赂摆,并且更好地理解研究設(shè)計(jì)如何暴露在誤設(shè)敏感性中,Goldsmith‐Pinkham et al. (2020)還建議要計(jì)算移民的來(lái)源國(guó)的各自的權(quán)重钟些。在移民對(duì)創(chuàng)新影響的例子中库正,有18個(gè)國(guó)家/地區(qū)用來(lái)構(gòu)建工具:United Kingdom,Ireland, Italy, Germany, Poland, Russia, Other Europe, Canada, Mexico, Puerto Rico, Cuba, Other Caribbean, Central America, South America, China, India, Other Asia, and Rest of World。需要注意的是厘唾,這些權(quán)重雖然反映了誤設(shè)對(duì)估計(jì)量的總偏誤的相對(duì)影響褥符,但是它們?nèi)匀辉试S估計(jì)量的絕對(duì)項(xiàng)存在較大的偏誤。
圖1和2分別畫(huà)出了大學(xué)和研究生畢業(yè)生每年的權(quán)重:
從圖中可以看出抚垃,1980年前喷楣,所有的國(guó)家都收到類似較小的權(quán)重(名字省略)趟大,而1970年后,來(lái)自亞洲和中國(guó)的移民收到相對(duì)較大的權(quán)重铣焊。
此外逊朽,表4展示了排名前五的國(guó)家-年份。對(duì)于大學(xué)畢業(yè)生曲伊,前五的國(guó)家收到超過(guò)55%的權(quán)重叽讳,而研究生,前五國(guó)家收到超過(guò)65%的權(quán)重坟募。而且前五國(guó)家-年分中有四個(gè)來(lái)自2000岛蚤。這些權(quán)重表明了外生變動(dòng)的來(lái)源,并強(qiáng)調(diào)哪個(gè)個(gè)體對(duì)識(shí)別假設(shè)的至關(guān)重要的影響懈糯。在表4中涤妒,按照Goldsmith‐Pinkham et al. (2020)的邏輯,研究者應(yīng)該主要考察來(lái)自“other Asia”和中國(guó)較多移民的地區(qū)與較少移民地區(qū)之間的比較赚哗,以及這些移民目的地是否有其它的一些特征(非移民渠道)來(lái)預(yù)測(cè)創(chuàng)新的變化她紫,尤其是在2000年。
最重要的識(shí)別假設(shè)是Shares與條件于觀測(cè)變量后的誤差項(xiàng)變動(dòng)無(wú)關(guān)屿储。如果有其他的特征可以預(yù)測(cè)感興趣的結(jié)果變量的變化贿讹,那么,上述假設(shè)就不成立够掠。
表5呈現(xiàn)的結(jié)果是權(quán)重()围详、恰好識(shí)別的點(diǎn)估計(jì)量(
)、國(guó)家移民增長(zhǎng)率(
)祖屏。研究者應(yīng)該關(guān)注被國(guó)家移民增長(zhǎng)率(
)所解釋的權(quán)重(
)變化助赞。也就是說(shuō),權(quán)重有多少可以被外生沖擊(移民增長(zhǎng))所解釋袁勺。
panel A顯示相關(guān)性為0.869雹食,panel B的相關(guān)性為0.616。這就意味著外生沖擊可以解釋大部分的權(quán)重變化期丰。這為Bartik IV的假設(shè)提供了更多的經(jīng)驗(yàn)證據(jù)支持群叶,往真實(shí)的處理效應(yīng)前進(jìn)了一步。
除了為“識(shí)別來(lái)自于外生沖擊”提供經(jīng)驗(yàn)證據(jù)外钝荡,Goldsmith‐Pinkham et al. (2020)還建議街立,“識(shí)別也可能來(lái)自于shares”。尤其是埠通,來(lái)自于不同國(guó)家的移民沖擊可能對(duì)于不同目的地有差異化影響赎离,這就是shares外生變動(dòng)的來(lái)源。因此Goldsmith‐Pinkham et al. (2020)建議可以做如下檢驗(yàn):
檢驗(yàn)?zāi)康牡靥卣髋c移民來(lái)源國(guó)sahres之間的相關(guān)性端辱;
檢驗(yàn)處理前趨勢(shì)梁剔;
用備擇估計(jì)量和過(guò)度識(shí)別檢驗(yàn)虽画。
表6呈現(xiàn)了目的地特征與移民來(lái)源國(guó)sahres之間的相關(guān)性檢驗(yàn)結(jié)果。每一列都是用1940年移民來(lái)源國(guó)的share對(duì)1940年特征進(jìn)行回歸荣病。從結(jié)果可以看出码撰,(1)這些特征可以解釋大量的shares變動(dòng),范圍從18%-50%+()个盆;(2)影響較大的國(guó)家(中國(guó))脖岛,人均收入與shares之間有顯著的正相關(guān)。對(duì)于其它國(guó)家颊亮,人口也是顯著正相關(guān)的柴梆。此外,工具比變量與這些特征也是正相關(guān)编兄。
為什么這些協(xié)變量預(yù)測(cè)了shares很重要,尤其是當(dāng)協(xié)變量包含中回歸中声登?這是因?yàn)槿绻麉f(xié)變量與shares正相關(guān)狠鸳,那么,我們可能要考慮不可觀測(cè)的變量也可能與shares相關(guān)悯嗓,從而打破shares外生性的假設(shè)件舵,最終使得SSIV研究設(shè)計(jì)無(wú)效。
Goldsmith‐Pinkham et al. (2020)建議做處理前趨勢(shì)檢驗(yàn)脯厨,類似于DID铅祸,選取一個(gè)相關(guān)的政策沖擊。但是合武,有可能沒(méi)有一個(gè)政策沖擊临梗,因此,我們可以檢驗(yàn)1940年的shares是否可以系統(tǒng)性預(yù)測(cè)更大的創(chuàng)新變化稼跳,是否存在趨勢(shì)盟庞。
圖3和4呈現(xiàn)了處理前趨勢(shì)檢驗(yàn)(結(jié)果變量是過(guò)去10年專利對(duì)數(shù)的差分,且相較于控制變量提前一年)汤善,分別對(duì)top來(lái)源國(guó)的1940年shares與工具變量縮減形式回歸什猖。圖中每個(gè)點(diǎn)都是將樣本限制在對(duì)應(yīng)的年份。在1960年红淡,且對(duì)于那些來(lái)源于top權(quán)重的國(guó)家不狮,尤其是中國(guó)和俄羅斯,標(biāo)準(zhǔn)誤非常大在旱。在剔除1960年后摇零,也可以發(fā)現(xiàn)1950年的標(biāo)準(zhǔn)誤較大。這意味著在較低移民的年份(1940-1950,1950-1960)工具變量是弱工具桶蝎。
但是遂黍,結(jié)果中并沒(méi)有顯著的處理前趨勢(shì)终佛。
最后,用stata命令manyiv來(lái)估計(jì)其它IV估計(jì)量雾家,如表7所示铃彰。
local github "https://raw.githubusercontent.com"
net install manyiv, from(`github'/gphk-metrics/stata-manyiv/main/)
manyiv _plugin_check
此外,圖5和6還畫(huà)出了權(quán)重和估計(jì)量系數(shù)的圖芯咧。結(jié)果表明牙捉,更高權(quán)重的來(lái)源國(guó)與其它國(guó)家相比,并沒(méi)有較大差異的估計(jì)系數(shù)()敬飒。與此同時(shí)邪铲,也有一些國(guó)家-年份觀測(cè)值有非常大的估計(jì)系數(shù)(
),但是權(quán)重接近于0无拗。
更多的SSIV檢驗(yàn):我的計(jì)量課程中多次講過(guò)這些檢驗(yàn)步驟: