簡單談一下我本人對空間雙重差分模型(Spatial Difference in Difference Model,SDID
)幾點或許不太成熟的理解午磁。
(本文首發(fā)于個人微信公眾號DMETP
比规,歡迎關(guān)注!)
一、從聚類標(biāo)準(zhǔn)誤到空間相關(guān)性
當(dāng)使用面板數(shù)據(jù)進(jìn)行固定效應(yīng)模型估計時,考慮到組間異方差和組內(nèi)自相關(guān)池磁,我們必然需要將標(biāo)準(zhǔn)誤進(jìn)行聚類調(diào)整。一般來說循帐,聚類調(diào)整后的標(biāo)準(zhǔn)誤大于異方差穩(wěn)健標(biāo)準(zhǔn)誤框仔,而異方差穩(wěn)健標(biāo)準(zhǔn)誤大于普通標(biāo)準(zhǔn)誤舀武,因此拄养,根據(jù)聚類標(biāo)準(zhǔn)誤做出來的結(jié)果是相對最穩(wěn)健的,這里所說的穩(wěn)健银舱,指的是系數(shù)顯著性穩(wěn)健瘪匿,因為標(biāo)準(zhǔn)誤影響t值,而對系數(shù)的本身影響不大寻馏。
然而棋弥,將標(biāo)準(zhǔn)誤聚類調(diào)整到什么層次是一個問題。當(dāng)將個體(id
)作為聚類依據(jù)時诚欠,即假定每個個體不同年份的干擾項存在相關(guān)性(組內(nèi)自相關(guān))顽染,而不同個體的干擾項不存在相關(guān)性(組間不相關(guān))漾岳。但是,這樣的假定可能不符合現(xiàn)實情況粉寞,比如尼荆,對于微觀企業(yè)來說,同一行業(yè)的企業(yè)之間必然存在競合關(guān)系唧垦,此時同一行業(yè)不同企業(yè)之間就存在相關(guān)性捅儒,在這種情況下,將標(biāo)準(zhǔn)誤聚類調(diào)整到行業(yè)層面可能更合理振亮。因此巧还,為了得出更穩(wěn)健的結(jié)果,也為了說服苛刻的讀者(或?qū)徃迦耍┙邮芪覀兏鶕?jù)實證結(jié)果得出的結(jié)論坊秸,將標(biāo)準(zhǔn)誤聚類到更高層級是一種更安全的做法麸祷,當(dāng)然,聚類層級越高系數(shù)越不顯著妇斤。
然而摇锋,有時候我們沒有甚至不能將標(biāo)準(zhǔn)誤聚類到更高層級。除了顯著性與穩(wěn)健性之間的權(quán)衡站超,更多的原因在于聚類層級越高聚類數(shù)目越少荸恕,而大樣本理論要求聚類數(shù)目足夠大,這樣才能保證所估計的標(biāo)準(zhǔn)誤收斂到真實值(Petersen死相,2009)融求,根據(jù)拇指法則,聚類數(shù)少于30可能就不太合適了算撮。
退而求其次生宛,為了同時兼顧聚類層級與聚類數(shù)目,有些文獻(xiàn)將標(biāo)準(zhǔn)誤聚類到行業(yè)-年份層面(在Stata
中可以利用分組函數(shù)group
生成聚類變量再在回歸中進(jìn)行聚類調(diào)整肮柜,即:先egen ind_year = group(industry year)
陷舅,然后reghdfe y xlist, absorb(id year) cluster(ind_year)
),如李青原和章尹賽楠(2021)审洞、邵朝對等(2021)莱睁,即假定同一年同一行業(yè)之間存在自相關(guān),而不同年或不同行業(yè)之間不存在自相關(guān)芒澜。
參考文獻(xiàn):
[1] Petersen M A. Estimating Standard Errors in Finance Panel Data Sets: Comparing Approaches[J]. Review of Financial Studies, 2009, 22(01): 435-480.
[2] 李青原, 章尹賽楠. 金融開放與資源配置效率——來自外資銀行進(jìn)入中國的證據(jù)[J]. 中國工業(yè)經(jīng)濟, 2021(05): 95-113.
[3] 邵朝對, 蘇丹妮, 楊琦. 外資進(jìn)入對東道國本土企業(yè)的環(huán)境效應(yīng): 來自中國的證據(jù)[J]. 世界經(jīng)濟, 2021, 44(03): 32-60.
根據(jù)常識與理論將標(biāo)準(zhǔn)誤聚類調(diào)整到行業(yè)-年份層面仰剿,即先驗式地承認(rèn)同一年份同一行業(yè)的企業(yè)存在相關(guān)性,同理痴晦,當(dāng)聚類到省份-年份層面或區(qū)域-年份層面時南吮,也可以認(rèn)為同一年同一地區(qū)(省份或區(qū)域)不同個體之間存在相關(guān)性,這與構(gòu)建空間計量模型(Spatial Econometric Model)的思想不謀而合誊酌。
空間計量模型最大的特征是放松了空間單位之間相互獨立的假設(shè)部凑,即認(rèn)為本地區(qū)與鄰近地區(qū)存在相互關(guān)系露乏,本地區(qū)變量的變動不僅直接影響本地區(qū),也會影響鄰近地區(qū)涂邀,而且通過影響鄰近地區(qū)最后反作用于本地區(qū)施无。本地區(qū)對本地區(qū)的影響稱為直接效應(yīng)(Direct Effect),本地區(qū)對鄰近地區(qū)的平均影響稱作間接影響或空間溢出效應(yīng)(Indirect Effect or Spatial Spillover Effect)必孤。對具體空間相關(guān)形式的判斷猾骡,是在OLS
模型的基礎(chǔ)上對其殘差進(jìn)行拉格朗日乘子檢驗(LM test)和穩(wěn)健的拉格朗日乘子檢驗(robust LM test),以檢驗OLS
回歸殘差中是否存在某種形式的空間關(guān)聯(lián)敷搪,即檢驗OLS
回歸殘差中是否包含被解釋變量的空間滯后項()抑或擾動項的空間滯后項(
)(Burridge兴想,1980;Anselin赡勘,1988嫂便;Anselin at al.,1996闸与;Elhorst毙替,2014)。
參考文獻(xiàn):
[4] Burridge P. On the Cliff‐Ord Test for Spatial Correlation[J]. Journal of the Royal Statistical Society: Series B (Methodological), 1980, 42(01): 107-108.
[5] Anselin L: Spatial Dependence in Regression Error Terms, Anselin L, editor, Spatial Econometrics: Methods and Models, Dordrecht: Springer Netherlands, 1988: 100-118.
[6] Anselin L, Bera A K, Florax R, et al. Simple Diagnostic Tests for Spatial Dependence[J]. Regional Science & Urban Economics, 1996, 26(01): 77-104.
[7] Elhorst J P. Matlab Software for Spatial Panels[J]. International Regional Science Review, 2014, 37(03): 389-405.
因此践樱,從這種意義上來說厂画,當(dāng)標(biāo)準(zhǔn)誤聚類調(diào)整到地區(qū)-年份層面時,此時假定中的同一年份同一地區(qū)不同個體之間存在的相關(guān)性(組內(nèi)自相關(guān))本質(zhì)上是一種空間相關(guān)性拷邢。也就是說袱院,當(dāng)我們將標(biāo)準(zhǔn)誤聚類調(diào)整到地區(qū)-年份層面時,實質(zhì)上就已經(jīng)變相說明模型中存在一定的空間相關(guān)性瞭稼。
二忽洛、個體處理效應(yīng)穩(wěn)定性假設(shè)
在DID中,一個經(jīng)典的假設(shè)是個體處理效應(yīng)穩(wěn)定性假設(shè)(Stable Unit Treatment Value Assumption环肘,SUTVA
)欲虚。SUTVA
最重要的一點是“處理組個體不會影響控制組個體”(Rubin,1974)悔雹。換言之复哆,在SUTVA
框架下,總體中的任何個體并不會受到其他個體接受處理與否的影響(王金杰和盛玉雪荠商,2020)寂恬。然而续誉,這個假設(shè)在考慮到空間相關(guān)性時被打破了莱没,或者說,當(dāng)不同空間單元之間存在相關(guān)性即存在空間溢出效應(yīng)時酷鸦,SUTVA
不再成立(Kolak & Anselin饰躲,2019)牙咏。
參考文獻(xiàn):
[8] Rubin D B. Estimating Causal Effects of Treatments in Randomized and Nonrandomized Studies[J]. Journal of Educational Psychology, 1974, 66(05): 688-701.
[9] 王金杰, 盛玉雪. 社會治理與地方公共研發(fā)支出——基于空間倍差法的實證研究[J]. 南開經(jīng)濟研究, 2020, 1(01): 199-219.
[10] Kolak M, Anselin L. A Spatial Perspective on the Econometrics of Program Evaluation[J]. International Regional Science Review, 2019, 43(02): 128-153.
事實上,SUTVA
在大多數(shù)情況下可能都不成立嘹裂,而現(xiàn)有的DID類實證文章很少會考慮到這一點妄壶,并且Ferman(2020)指出忽略空間相關(guān)性將導(dǎo)致標(biāo)準(zhǔn)誤被低估,從而夸大系數(shù)的顯著性寄狼。
參考文獻(xiàn):
[11] Ferman B. Inference in Differences-in-Differences: How Much Should We Trust in Independent Clusters? [R]. MPRA Paper 93746, University Library of Munich, Germany, 2020.
一個簡單的道理丁寄,處理組在期初實施了某項政策,控制組沒有實施泊愧,但不是說政策實施之后只會對處理組產(chǎn)生影響伊磺,通過示范、學(xué)習(xí)删咱、要素流動等渠道也會作用于控制組屑埋,因此,政策的施行在長期將會在一個較廣的區(qū)域范圍內(nèi)產(chǎn)生普遍(但不一致)的影響痰滋。
這里有兩個問題,一個是政策實施對控制組作用的力度,另一個是作用的方向宪睹。
首先绞旅,在處理組實施的某項政策不會對全域內(nèi)所有地區(qū)產(chǎn)生相同的影響,可能兩地間經(jīng)濟聯(lián)系越密切多艇,政策的空間溢出效應(yīng)越強莺丑;可能兩地共享同一地理邊界(鄰接),空間溢出效應(yīng)越明顯墩蔓;可能兩地核心城市之間的地理距離或路程距離越短梢莽,空間溢出效應(yīng)就越強〖榕總之昏名,政策的施行不會對其他地區(qū)產(chǎn)生一致的影響,而會隨著某種空間相互關(guān)系的趨弱存在衰減效應(yīng)阵面,而我們論文中的SDID
就是圍繞這種空間相互關(guān)系進(jìn)行研究設(shè)計的(空間權(quán)重矩陣的設(shè)置)轻局。
其次,處理組實施的某項政策對鄰近地區(qū)的影響有正有負(fù)样刷。一方面仑扑,政策施行導(dǎo)致資源向先行區(qū)傾斜集聚,這不僅意味著先行地區(qū)內(nèi)部資源的重新配置置鼻,而且也將導(dǎo)致鄰近地區(qū)的資源(如勞動力镇饮、資金等)向該地區(qū)流動富集,這樣的結(jié)果是抑制了鄰近控制組的經(jīng)濟發(fā)展箕母,形成了“虹吸效應(yīng)
”储藐。另一方面俱济,先行發(fā)展的示范區(qū)一般都是經(jīng)濟發(fā)展較好的地區(qū)(這同時說明DID可能存在嚴(yán)重的樣本自選擇問題!)钙勃,政策實施后這些地區(qū)將已有的蛛碌、相對落后的產(chǎn)能向周圍轉(zhuǎn)移,連帶著將相關(guān)人才辖源、技術(shù)與資金轉(zhuǎn)移蔚携,通過這樣的一種方式促進(jìn)了鄰近地區(qū)的發(fā)展,形成了所謂的“涓滴效應(yīng)
”克饶「∩遥總之,政策的施行對鄰近地區(qū)產(chǎn)生正反兩方面的影響彤路,而我們的工作就是要精準(zhǔn)穩(wěn)健地測度出這種影響秕硝,并進(jìn)一步分析出這種異質(zhì)性影響背后的形成機制或者說機理。
三洲尊、政策實施的空間溢出效應(yīng)
下面結(jié)合幾個實例給出SDID
模型設(shè)計的參考远豺。
空間計量模型中和DID結(jié)合最多的是自變量空間滯后模型(The Spatial Lag of X Model,SLX
)坞嘀,而SLX
是在普通線性模型等式右端引入(所有)自變量的空間滯后項躯护,形如式:
式中的
即為所有自變量的空間滯后項,由于等式右端不包括被解釋變量的空間滯后項丽涩,該模型可以視為普通的線性模型棺滞,并使用
OLS
方法進(jìn)行估計。因此矢渊,式中的
衡量的是直接效應(yīng)的大小继准,
測度的是間接效應(yīng)的大小(Vega & Elhorst矮男,2015)移必。
參考文獻(xiàn):
[12] Vega S H, Elhorst J P. The SLX Model[J]. Journal of Regional Science, 2015, 55(03): 339-363.
SDID
基于式,但等式右邊只有DID交互項的空間滯后項毡鉴,其余自變量均以其初始形式作為控制變量崔泵,形如式
:
其中,代表政策的直接效應(yīng)猪瞬,即絕大多數(shù)論文中所要考察的處理效應(yīng)(Treatment Effect)憎瘸,而
代表政策的間接效應(yīng)或空間溢出效應(yīng)。
王金杰和盛玉雪(2020)在研究社會治理與地方公共研發(fā)支出的關(guān)系時陈瘦,將十八屆三中全會以來的社會治理作為準(zhǔn)自然實驗幌甘,設(shè)計了如下式的實證模型。
其中,DID交互項()空間滯后項系數(shù)
衡量的是平均的溢出效應(yīng)含潘。
可以看出,形如式和式
的
SDID
只能測度平均的空間溢出效應(yīng)线婚,空間滯后項系數(shù)的大小代表在所有處理組實施的政策對鄰近地區(qū)的影響遏弱。從這個意義上來說,以上的研究設(shè)計本質(zhì)上討論的是空間依賴性塞弊,而非空間異質(zhì)性漱逸,而對空間異質(zhì)性的討論或許是我們應(yīng)該關(guān)注的重點,即:在處理組實施的某項政策游沿,在多大范圍內(nèi)存在空間溢出效應(yīng)饰抒?
沈坤榮和金剛(2018)在評估河長制的水污染治理效果時,設(shè)計了如下式的實證模型诀黍。
其中袋坑,表示閾值為
的地理距離倒數(shù)矩陣元素,當(dāng)
地和
地之間的距離在閾值范圍內(nèi)眯勾,該元素取值為距離倒數(shù)枣宫,否則為0。
可以看出吃环,形如式的
SDID
模型以100為步進(jìn)距離也颤,考察在不同地理閾值范圍內(nèi)空間溢出效應(yīng)的大小。
圖 1
是不同地理閾值范圍內(nèi)系數(shù)的大小與顯著性郁轻。
參考文獻(xiàn):
[13] 沈坤榮, 金剛. 中國地方政府環(huán)境治理的政策效應(yīng)——基于“河長制”演進(jìn)的研究[J]. 中國社會科學(xué), 2018(05): 92-115+206.
然而翅娶,也有部分文獻(xiàn)通過巧妙的模型設(shè)計,在不使用SDID
的情況下好唯,測度了不同閾值范圍內(nèi)政策實施的空間溢出效應(yīng)竭沫。
曹清峰(2020)在評估國家級新區(qū)的經(jīng)濟效應(yīng)時,認(rèn)為國家級新區(qū)通過空間溢出效應(yīng)促進(jìn)了區(qū)域協(xié)調(diào)發(fā)展骑篙。該文的實證模型設(shè)計如下式:
其中输吏,表示不同城市間的球面距離;如果在
年距離城市
的空間范圍內(nèi)存在國家級新區(qū)替蛉,
贯溅,否則
;系數(shù)
衡量了國家級新區(qū)設(shè)立后對鄰近城市經(jīng)濟增長率的影響躲查。
圖 2
是不同地理閾值范圍內(nèi)系數(shù)的大小與顯著性它浅。
參考文獻(xiàn):
[14] 曹清峰. 國家級新區(qū)對區(qū)域經(jīng)濟增長的帶動效應(yīng)——基于70大中城市的經(jīng)驗證據(jù)[J]. 中國工業(yè)經(jīng)濟, 2020(07): 43-60.