?本專欄旨在分享日常學(xué)習(xí)計量時整理的筆記没隘。所記之物來自網(wǎng)絡(luò)懂扼、書籍,自己僅有整理匯集之功,涉及資料在文末標(biāo)注阀湿,版權(quán)歸原作者所有赶熟。
一、什么是內(nèi)生性陷嘴?
內(nèi)生性問題是解釋變量與擾動項相關(guān)導(dǎo)致的映砖,具體的表現(xiàn)形式有遺漏變量、雙向因果和測量誤差灾挨。
- 遺漏變量
遺漏變量是指可能與解釋變量相關(guān)的變量邑退,本來應(yīng)該加以控制,但是沒有控制劳澄。此時該變量會跑到擾動項中地技,造成擾動項與解釋變量相關(guān)。 - 雙向因果
雙向因果是指核心解釋變量A和被解釋變量B互相影響秒拔。假設(shè)擾動項發(fā)生正向沖擊莫矗,B會增加,則A發(fā)生變動砂缩,如此就有核心解釋變量A和擾動項相關(guān)趣苏。此時,如果B對A有正向影響梯轻,正向沖擊便會導(dǎo)致A增加食磕,從而導(dǎo)致核心解釋變量A和擾動項正相關(guān)。反之喳挑,會有核心解釋變量A和擾動項負(fù)相關(guān)彬伦。 - 測量誤差
測量誤差是指被解釋變量存在度量誤差或解釋變量存在度量誤差。
(1)當(dāng)解釋變量存在度量誤差
y=α+βx'+e伊诵,x'無法精確觀測单绑,只能觀測到x,x=x'+u曹宴,u為度量誤差
此時有:y=α+βx+(e-βu)
因為u和x相關(guān)搂橙,所以新的擾動項e-βu和x存在相關(guān)關(guān)系,產(chǎn)生了內(nèi)生性笛坦。此時区转,估計得到的系數(shù)絕對值會偏小。
(2)當(dāng)被解釋變量存在度量誤差
y'=α+βx+e版扩,y'無法精確觀測废离,只能觀測到y(tǒng),y=y'+v礁芦,v為度量誤差
此時有:y=α+βx+(e+v)
只要Cov(x,v)=0蜻韭,則OLS估計量仍是一致的悼尾,但會增大擾動項的方差;若Cov(x,v)≠0肖方,就會產(chǎn)生內(nèi)生性問題
有:y=α+βx+(e-βu)闺魏。
二、內(nèi)生性問題的影響
OLS能夠成立的最重要前提條件是解釋變量與擾動項不相關(guān)俯画。否則舷胜,OLS估計量將是有偏且不一致的。
無偏是指估計量的期望等于真實值活翩。一致性是指,隨著樣本的增大翻伺,估計量無限接近于真實值材泄。
三、廣義矩估計
廣義矩估計方法(GMM)常用來解決因使用動態(tài)面板數(shù)據(jù)而產(chǎn)生的內(nèi)生性問題吨岭。
1.動態(tài)面板
動態(tài)面板數(shù)據(jù)模型的典型特征是解釋變量中包含被解釋變量的滯后項拉宗。其意義在于,有些經(jīng)濟(jì)理論認(rèn)為個體的當(dāng)前行為取決于過去行為辣辫,比如企業(yè)投資決策旦事。
此時,即使使用固定效應(yīng)模型估計急灭,即采用組內(nèi)離差或一階差分去除個體效應(yīng)αi姐浮,仍無法解決動態(tài)面板模型的內(nèi)生性問題。
通過上述分析可知葬馋,問題的關(guān)鍵在于yi,t-1作為解釋變量而產(chǎn)生的內(nèi)生性問題卖鲤,為此可以考慮找工具變量來解決。
2.估計方法
2.1發(fā)展歷史
Anderson & Hisao(1982)提出如果擾動項不存在序列相關(guān)畴嘶,則可通過先去除個體效應(yīng)蛋逾,然后使用yi,t-2作為工具變量。但yi,t-2不是唯一的工具變量窗悯,yi,t-3 yi,t-4等可以作為工具變量区匣。Arellano & Bond(1991)認(rèn)為Anderson & Hisao的方法雖然是一致的,但不是有效的蒋院,因為沒有充分運(yùn)用樣本信息亏钩。在Anderson & Hisao方法基礎(chǔ)上,他們提出了使用更多工具變量的廣義矩估計方法欺旧。
2.2廣義矩估計
(1)廣義铸屉、一般化
OLS、IV切端、2SLS彻坛、MLE都是GMM的特殊形式。
(2)矩
矩是隨機(jī)變量的一個特征。
(3)矩估計
補(bǔ)充:關(guān)于2SLS和GMM
2SLS和GMM背后都是工具變量昌屉,兩者的區(qū)別在于權(quán)重分配的依據(jù)不同钙蒙。
- 2SLS利用的是工具變量z和解釋變量x的相關(guān)性,以此確定權(quán)重(相關(guān)性越大间驮,權(quán)重越高)
- GMM利用的是工具變量z和擾動項e的相關(guān)性躬厌,以此確定權(quán)重(相關(guān)性越大,權(quán)重越高)
2.3廣義矩估計分類
廣義矩估計方法有兩種:
(1)差分GMM
對基本模型進(jìn)行一階差分去掉固定效應(yīng)的影響竞帽,然后用一組滯后的解釋變量作為相應(yīng)變量的工具變量(Arellano & Bond扛施,1991)。
(2) 系統(tǒng)GMM
Arellano & Bond(1998)認(rèn)為差分GMM估計量容易受弱工具變量的影響屹篓,進(jìn)一步提出了系統(tǒng)GMM方法疙渣。
系統(tǒng)GMM前提假定:工具變量的一階差分與固定效應(yīng)項不相關(guān),但目前并沒有方法對該前提進(jìn)行檢驗堆巧。
使用系統(tǒng)GMM需要滿足:
- 大N小T
- 線性函數(shù)關(guān)系
- 方程左邊的變量作為動態(tài)變量
- 不是所有的解釋變量都是嚴(yán)格外生的
- 控制了個體固定效應(yīng)
- 默認(rèn)不存在截面相關(guān)問題妄荔。且建議使用雙向固定效應(yīng)
ssc install xtabond2
xtabond2 depvar varlist [if exp] [in range] [weight] [, level(#) svmat svvar twostep robust cluster(varlist) noconstant small noleveleq orthogonal gmmopt [gmmopt ...] ivopt [ivopt ...] pca components(#) artests(#) arlevels h(#) nodiffsargan nomata]
*差分GMM
xtabond2 depvar varlist, gmmstyle(varlist) ivstyle(varlist) twostep nolevel robust
// gmm(varlist) GMM式工具變量
// iv(varlist) IV式工具變量
// twostep 使用GMM
// nolevel 差分GMM
// robust 穩(wěn)健標(biāo)準(zhǔn)誤
*系統(tǒng)GMM
xtabond2 depvar varlist, gmm(varlist) iv(varlist) twostep robust
// gmm(varlist) GMM式工具變量
// iv(varlist) IV式工具變量
// twostep 使用GMM
// robust 穩(wěn)健標(biāo)準(zhǔn)誤
*小樣本:使用small
關(guān)于gmmopt
gmm(前定變量)
gmmstyle() : specifies a set of variables to be used as bases for "GMM-style" instrument sets described in Holtz-Eakin, Newey, and Rosen (1988) and Arellano and Bond (1991).
By default xtabond2 uses, for each time period, all available lags of the specified variables in levels dated t-1 or earlier as instruments for the transformed equation; and uses the contemporaneous first differences as instruments in the levels equation. These
defaults are appropriate for predetermined variables that are not strictly exogenous (Bond 2000).
gmmstyle(varlist [, laglimits(# #) collapse orthogonal equation({diff | level | both}) passthru split])
- laglimits(# #):限定滯后期數(shù),如laglimits(2 5)表示工具變量滯后2-5期谍肤,gmm(L.w)和gmm(w,lag(2.))是等價的啦租。
- 壓縮工具變量數(shù):collapse
關(guān)于ivopt
iv(外生變量)
ivstyle() : specifies a set of variables to serve as standard instruments, with one column in the instrument matrix per variable. Normally, strictly exogenous regressors are included in ivstyle options.
ivstyle(varlist [, equation({diff | level | both}) passthru mz])
如果xit是內(nèi)生變量,那么滯后一期xit-1是前定變量荒揣、滯后兩期xit-2是外生變量篷角。
進(jìn)入模型的變量被分為兩類:
- 內(nèi)生變量
其由模型內(nèi)部決定,被視為隨機(jī)的系任。 - 前定變量
其由模型外部決定的内地,被視為非隨機(jī)的。 前定變量又可以分為:當(dāng)前的外生變量赋除、滯后的外生變量阱缓,滯后的內(nèi)生變量。
關(guān)于orthogonal
orthogonal 向前正交變換
當(dāng)數(shù)據(jù)是非平衡面板時举农,使用一階差分會損失數(shù)據(jù)荆针,建議采用向前正交變換。
xtabond2 depvar varlist, gmm(varlist) iv(varlist) twostep robust orthogonal //系統(tǒng)GMM 穩(wěn)健標(biāo)準(zhǔn)誤 向前正交變換
2.4相關(guān)檢驗
所用的模型越復(fù)雜颁糟,檢驗成本就越高航背。
(1)序列相關(guān)檢驗
通過Arellano-Bond的自相關(guān)檢驗對差分方程隨機(jī)擾動項的二階序列相關(guān)進(jìn)行檢驗,原假設(shè)是一階差分方程的隨機(jī)擾動項不存在二階序列相關(guān)棱貌。
在自相關(guān)檢驗中玖媚,應(yīng)同時滿足AR(1)的p值<0.1,AR(2)的p值>0.1婚脱。
(2)過度識別檢驗
通過Hansen過度識別檢驗對所使用的工具變量有效性進(jìn)行檢驗今魔,原假設(shè)是使用的工具變量與擾動項不相關(guān)勺像。
- Sargen檢驗:對異方差敏感,但工具變量較多時仍沒有問題错森。
- Hansen檢驗:異方差穩(wěn)健吟宦,但工具變量較多時檢驗力下降。
3.常見問題及建議
(1)工具變量過多有什么影響涩维?
過多的工具變量會使得估計結(jié)果失去效率殃姓。Roodman(2006)指出太多的工具變量數(shù)可能過度擬合內(nèi)生變量而不能去掉內(nèi)生部分。此外瓦阐,過多的工具變量還可能弱化Hansen過度識別約束檢驗蜗侈。xtabond2命令可以通過限定滯后期數(shù)來控制工具變量的個數(shù)。
(2)如何判斷GMM估計結(jié)果是否有效睡蟋?
Bond et al.(2002)認(rèn)為如果GMM估計值介于固定效應(yīng)估計值和混合OLS估計值之間踏幻,則GMM估計是可靠有效的。
(3)什么是拇指規(guī)則薄湿?
拇指規(guī)則是指工具變量數(shù)盡可能不超過截面數(shù)。
(4)Hansen檢驗的p值等于1
太多的工具變量會使得Hansen檢驗的p值等于1偷卧,所以在Hansen檢驗接近1時豺瘤,要采用lag()選項和collapse選項將工具變量壓縮,使得p小于1听诸,而不是很接近于1
(5)截面相關(guān)問題
時間虛擬變量的引入可以使得誤差項的截面相關(guān)變得不相關(guān)坐求,所以在模型設(shè)定中盡可能地引入時間虛擬變量。
(6)需要報告什么
AR(2)晌梨、Sargen統(tǒng)計量
(7)序列相關(guān)檢驗和Sargen檢驗通不過
首先確保加了twostep桥嗤,一步估計下Sargen統(tǒng)計量沒有考慮異方差,存在過度拒絕問題仔蝌。
參考資料:
動態(tài)面板模型
《高級計量經(jīng)濟(jì)學(xué)及stata應(yīng)用》
《計量分析與stata應(yīng)用》
面板數(shù)據(jù)分析與Stata應(yīng)用
從零理解廣義矩估計(GMM)
如何用簡單的例子解釋什么是 Generalized Method of Moments (GMM)泛领?
stata面板數(shù)據(jù)回歸操作之GMM