內(nèi)生性處理:廣義矩估計

?本專欄旨在分享日常學(xué)習(xí)計量時整理的筆記没隘。所記之物來自網(wǎng)絡(luò)懂扼、書籍,自己僅有整理匯集之功,涉及資料在文末標(biāo)注阀湿,版權(quán)歸原作者所有赶熟。

一、什么是內(nèi)生性陷嘴?

內(nèi)生性問題是解釋變量與擾動項相關(guān)導(dǎo)致的映砖,具體的表現(xiàn)形式有遺漏變量、雙向因果和測量誤差灾挨。

  • 遺漏變量
    遺漏變量是指可能與解釋變量相關(guān)的變量邑退,本來應(yīng)該加以控制,但是沒有控制劳澄。此時該變量會跑到擾動項中地技,造成擾動項與解釋變量相關(guān)。
  • 雙向因果
    雙向因果是指核心解釋變量A和被解釋變量B互相影響秒拔。假設(shè)擾動項發(fā)生正向沖擊莫矗,B會增加,則A發(fā)生變動砂缩,如此就有核心解釋變量A和擾動項相關(guān)趣苏。此時,如果B對A有正向影響梯轻,正向沖擊便會導(dǎo)致A增加食磕,從而導(dǎo)致核心解釋變量A和擾動項正相關(guān)。反之喳挑,會有核心解釋變量A和擾動項負(fù)相關(guān)彬伦。
  • 測量誤差
    測量誤差是指被解釋變量存在度量誤差或解釋變量存在度量誤差。
    (1)當(dāng)解釋變量存在度量誤差
    y=α+βx'+e伊诵,x'無法精確觀測单绑,只能觀測到x,x=x'+u曹宴,u為度量誤差
    此時有:y=α+βx+(e-βu)
    因為u和x相關(guān)搂橙,所以新的擾動項e-βu和x存在相關(guān)關(guān)系,產(chǎn)生了內(nèi)生性笛坦。此時区转,估計得到的系數(shù)絕對值會偏小。
    (2)當(dāng)被解釋變量存在度量誤差
    y'=α+βx+e版扩,y'無法精確觀測废离,只能觀測到y(tǒng),y=y'+v礁芦,v為度量誤差
    此時有:y=α+βx+(e+v)
    只要Cov(x,v)=0蜻韭,則OLS估計量仍是一致的悼尾,但會增大擾動項的方差;若Cov(x,v)≠0肖方,就會產(chǎn)生內(nèi)生性問題
    有:y=α+βx+(e-βu)闺魏。

二、內(nèi)生性問題的影響

OLS能夠成立的最重要前提條件是解釋變量與擾動項不相關(guān)俯画。否則舷胜,OLS估計量將是有偏且不一致的。
無偏是指估計量的期望等于真實值活翩。一致性是指,隨著樣本的增大翻伺,估計量無限接近于真實值材泄。

三、廣義矩估計

廣義矩估計方法(GMM)常用來解決因使用動態(tài)面板數(shù)據(jù)而產(chǎn)生的內(nèi)生性問題吨岭。

1.動態(tài)面板

動態(tài)面板數(shù)據(jù)模型的典型特征是解釋變量中包含被解釋變量的滯后項拉宗。其意義在于,有些經(jīng)濟(jì)理論認(rèn)為個體的當(dāng)前行為取決于過去行為辣辫,比如企業(yè)投資決策旦事。

image.png

此時,即使使用固定效應(yīng)模型估計急灭,即采用組內(nèi)離差或一階差分去除個體效應(yīng)αi姐浮,仍無法解決動態(tài)面板模型的內(nèi)生性問題。

image.png

通過上述分析可知葬馋,問題的關(guān)鍵在于yi,t-1作為解釋變量而產(chǎn)生的內(nèi)生性問題卖鲤,為此可以考慮找工具變量來解決。

image.png

2.估計方法

2.1發(fā)展歷史

Anderson & Hisao(1982)提出如果擾動項不存在序列相關(guān)畴嘶,則可通過先去除個體效應(yīng)蛋逾,然后使用yi,t-2作為工具變量。但yi,t-2不是唯一的工具變量窗悯,yi,t-3 yi,t-4等可以作為工具變量区匣。Arellano & Bond(1991)認(rèn)為Anderson & Hisao的方法雖然是一致的,但不是有效的蒋院,因為沒有充分運(yùn)用樣本信息亏钩。在Anderson & Hisao方法基礎(chǔ)上,他們提出了使用更多工具變量的廣義矩估計方法欺旧。

2.2廣義矩估計

(1)廣義铸屉、一般化
OLS、IV切端、2SLS彻坛、MLE都是GMM的特殊形式。
(2)矩
矩是隨機(jī)變量的一個特征。

image.png

(3)矩估計

image.png

補(bǔ)充:關(guān)于2SLS和GMM
2SLS和GMM背后都是工具變量昌屉,兩者的區(qū)別在于權(quán)重分配的依據(jù)不同钙蒙。

  • 2SLS利用的是工具變量z和解釋變量x的相關(guān)性,以此確定權(quán)重(相關(guān)性越大间驮,權(quán)重越高)
  • GMM利用的是工具變量z和擾動項e的相關(guān)性躬厌,以此確定權(quán)重(相關(guān)性越大,權(quán)重越高)

2.3廣義矩估計分類

廣義矩估計方法有兩種:
(1)差分GMM
對基本模型進(jìn)行一階差分去掉固定效應(yīng)的影響竞帽,然后用一組滯后的解釋變量作為相應(yīng)變量的工具變量(Arellano & Bond扛施,1991)。

(2) 系統(tǒng)GMM
Arellano & Bond(1998)認(rèn)為差分GMM估計量容易受弱工具變量的影響屹篓,進(jìn)一步提出了系統(tǒng)GMM方法疙渣。
系統(tǒng)GMM前提假定:工具變量的一階差分與固定效應(yīng)項不相關(guān),但目前并沒有方法對該前提進(jìn)行檢驗堆巧。
使用系統(tǒng)GMM需要滿足:

  • 大N小T
  • 線性函數(shù)關(guān)系
  • 方程左邊的變量作為動態(tài)變量
  • 不是所有的解釋變量都是嚴(yán)格外生的
  • 控制了個體固定效應(yīng)
  • 默認(rèn)不存在截面相關(guān)問題妄荔。且建議使用雙向固定效應(yīng)
ssc install xtabond2 

xtabond2 depvar varlist [if exp] [in range] [weight] [, level(#) svmat svvar twostep robust cluster(varlist) noconstant small noleveleq orthogonal gmmopt [gmmopt ...] ivopt [ivopt ...] pca components(#) artests(#) arlevels h(#) nodiffsargan nomata]

*差分GMM
xtabond2 depvar varlist, gmmstyle(varlist) ivstyle(varlist)  twostep  nolevel robust  
// gmm(varlist)  GMM式工具變量
// iv(varlist) IV式工具變量
// twostep 使用GMM
// nolevel 差分GMM
//  robust  穩(wěn)健標(biāo)準(zhǔn)誤

*系統(tǒng)GMM
xtabond2 depvar varlist, gmm(varlist) iv(varlist)  twostep robust  
// gmm(varlist)  GMM式工具變量
// iv(varlist) IV式工具變量
// twostep 使用GMM
//  robust  穩(wěn)健標(biāo)準(zhǔn)誤

*小樣本:使用small

關(guān)于gmmopt

gmm(前定變量)

gmmstyle() : specifies a set of variables to be used as bases for "GMM-style" instrument sets described in Holtz-Eakin, Newey, and Rosen (1988) and Arellano and Bond (1991).
By default xtabond2 uses, for each time period, all available lags of the specified variables in levels dated t-1 or earlier as instruments for the transformed equation; and uses the contemporaneous first differences as instruments in the levels equation. These
defaults are appropriate for predetermined variables that are not strictly exogenous (Bond 2000).

gmmstyle(varlist [, laglimits(# #) collapse orthogonal equation({diff | level | both}) passthru split])

  • laglimits(# #):限定滯后期數(shù),如laglimits(2 5)表示工具變量滯后2-5期谍肤,gmm(L.w)和gmm(w,lag(2.))是等價的啦租。
  • 壓縮工具變量數(shù):collapse

關(guān)于ivopt

iv(外生變量)

ivstyle() : specifies a set of variables to serve as standard instruments, with one column in the instrument matrix per variable. Normally, strictly exogenous regressors are included in ivstyle options.

ivstyle(varlist [, equation({diff | level | both}) passthru mz])

如果xit是內(nèi)生變量,那么滯后一期xit-1是前定變量荒揣、滯后兩期xit-2是外生變量篷角。

進(jìn)入模型的變量被分為兩類:

  • 內(nèi)生變量
    其由模型內(nèi)部決定,被視為隨機(jī)的系任。
  • 前定變量
    其由模型外部決定的内地,被視為非隨機(jī)的。 前定變量又可以分為:當(dāng)前的外生變量赋除、滯后的外生變量阱缓,滯后的內(nèi)生變量。

關(guān)于orthogonal
orthogonal 向前正交變換
當(dāng)數(shù)據(jù)是非平衡面板時举农,使用一階差分會損失數(shù)據(jù)荆针,建議采用向前正交變換。

xtabond2 depvar varlist, gmm(varlist) iv(varlist)  twostep robust  orthogonal //系統(tǒng)GMM 穩(wěn)健標(biāo)準(zhǔn)誤 向前正交變換

2.4相關(guān)檢驗

所用的模型越復(fù)雜颁糟,檢驗成本就越高航背。

(1)序列相關(guān)檢驗
通過Arellano-Bond的自相關(guān)檢驗對差分方程隨機(jī)擾動項的二階序列相關(guān)進(jìn)行檢驗,原假設(shè)是一階差分方程的隨機(jī)擾動項不存在二階序列相關(guān)棱貌。

在自相關(guān)檢驗中玖媚,應(yīng)同時滿足AR(1)的p值<0.1,AR(2)的p值>0.1婚脱。

(2)過度識別檢驗
通過Hansen過度識別檢驗對所使用的工具變量有效性進(jìn)行檢驗今魔,原假設(shè)是使用的工具變量與擾動項不相關(guān)勺像。

  • Sargen檢驗:對異方差敏感,但工具變量較多時仍沒有問題错森。
  • Hansen檢驗:異方差穩(wěn)健吟宦,但工具變量較多時檢驗力下降。

3.常見問題及建議

(1)工具變量過多有什么影響涩维?
過多的工具變量會使得估計結(jié)果失去效率殃姓。Roodman(2006)指出太多的工具變量數(shù)可能過度擬合內(nèi)生變量而不能去掉內(nèi)生部分。此外瓦阐,過多的工具變量還可能弱化Hansen過度識別約束檢驗蜗侈。xtabond2命令可以通過限定滯后期數(shù)來控制工具變量的個數(shù)。

(2)如何判斷GMM估計結(jié)果是否有效睡蟋?
Bond et al.(2002)認(rèn)為如果GMM估計值介于固定效應(yīng)估計值和混合OLS估計值之間踏幻,則GMM估計是可靠有效的。

(3)什么是拇指規(guī)則薄湿?
拇指規(guī)則是指工具變量數(shù)盡可能不超過截面數(shù)。

(4)Hansen檢驗的p值等于1
太多的工具變量會使得Hansen檢驗的p值等于1偷卧,所以在Hansen檢驗接近1時豺瘤,要采用lag()選項和collapse選項將工具變量壓縮,使得p小于1听诸,而不是很接近于1

(5)截面相關(guān)問題
時間虛擬變量的引入可以使得誤差項的截面相關(guān)變得不相關(guān)坐求,所以在模型設(shè)定中盡可能地引入時間虛擬變量。

(6)需要報告什么
AR(2)晌梨、Sargen統(tǒng)計量

(7)序列相關(guān)檢驗和Sargen檢驗通不過
首先確保加了twostep桥嗤,一步估計下Sargen統(tǒng)計量沒有考慮異方差,存在過度拒絕問題仔蝌。

image.png

參考資料:
動態(tài)面板模型
《高級計量經(jīng)濟(jì)學(xué)及stata應(yīng)用》
《計量分析與stata應(yīng)用》
面板數(shù)據(jù)分析與Stata應(yīng)用
從零理解廣義矩估計(GMM)
如何用簡單的例子解釋什么是 Generalized Method of Moments (GMM)泛领?
stata面板數(shù)據(jù)回歸操作之GMM

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市敛惊,隨后出現(xiàn)的幾起案子渊鞋,更是在濱河造成了極大的恐慌,老刑警劉巖瞧挤,帶你破解...
    沈念sama閱讀 217,277評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件锡宋,死亡現(xiàn)場離奇詭異,居然都是意外死亡特恬,警方通過查閱死者的電腦和手機(jī)执俩,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,689評論 3 393
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來癌刽,“玉大人役首,你說我怎么就攤上這事尝丐。” “怎么了宋税?”我有些...
    開封第一講書人閱讀 163,624評論 0 353
  • 文/不壞的土叔 我叫張陵摊崭,是天一觀的道長。 經(jīng)常有香客問我杰赛,道長呢簸,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,356評論 1 293
  • 正文 為了忘掉前任乏屯,我火速辦了婚禮根时,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘辰晕。我一直安慰自己蛤迎,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,402評論 6 392
  • 文/花漫 我一把揭開白布含友。 她就那樣靜靜地躺著替裆,像睡著了一般。 火紅的嫁衣襯著肌膚如雪窘问。 梳的紋絲不亂的頭發(fā)上辆童,一...
    開封第一講書人閱讀 51,292評論 1 301
  • 那天,我揣著相機(jī)與錄音惠赫,去河邊找鬼把鉴。 笑死,一個胖子當(dāng)著我的面吹牛儿咱,可吹牛的內(nèi)容都是我干的庭砍。 我是一名探鬼主播,決...
    沈念sama閱讀 40,135評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼混埠,長吁一口氣:“原來是場噩夢啊……” “哼怠缸!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起钳宪,我...
    開封第一講書人閱讀 38,992評論 0 275
  • 序言:老撾萬榮一對情侶失蹤凯旭,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后使套,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體罐呼,經(jīng)...
    沈念sama閱讀 45,429評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,636評論 3 334
  • 正文 我和宋清朗相戀三年侦高,在試婚紗的時候發(fā)現(xiàn)自己被綠了嫉柴。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,785評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡奉呛,死狀恐怖计螺,靈堂內(nèi)的尸體忽然破棺而出夯尽,到底是詐尸還是另有隱情,我是刑警寧澤登馒,帶...
    沈念sama閱讀 35,492評論 5 345
  • 正文 年R本政府宣布匙握,位于F島的核電站,受9級特大地震影響陈轿,放射性物質(zhì)發(fā)生泄漏圈纺。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,092評論 3 328
  • 文/蒙蒙 一麦射、第九天 我趴在偏房一處隱蔽的房頂上張望蛾娶。 院中可真熱鬧,春花似錦潜秋、人聲如沸蛔琅。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,723評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽罗售。三九已至,卻和暖如春钩述,著一層夾襖步出監(jiān)牢的瞬間寨躁,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,858評論 1 269
  • 我被黑心中介騙來泰國打工切距, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留朽缎,地道東北人惨远。 一個月前我還...
    沈念sama閱讀 47,891評論 2 370
  • 正文 我出身青樓谜悟,卻偏偏與公主長得像,于是被迫代替她去往敵國和親北秽。 傳聞我的和親對象是個殘疾皇子葡幸,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,713評論 2 354