靜態(tài)面板數(shù)據(jù)的主要問題
- 橫截面異方差
- 序列自相關(guān)
- 橫截面同期相關(guān)
基礎(chǔ)工作
屢次失敗的經(jīng)驗(yàn)表明矮固,洗數(shù)據(jù)和看數(shù)據(jù)是非沉耍基礎(chǔ)且不可或缺的工作伪很〈晗簦基礎(chǔ)不牢地動(dòng)山搖杂数,后面的分析全部得再來一遍宛畦,期間又會(huì)出現(xiàn)各種error。因此揍移,面板數(shù)據(jù)分析的前幾步毫無疑問就是
1. 數(shù)據(jù)清理
由于面板也是時(shí)間序列次和,為避免偽回歸問題,很多人糾結(jié)是否應(yīng)當(dāng)先進(jìn)行平穩(wěn)性檢驗(yàn)及差分那伐。并非所有的面板數(shù)據(jù)都要進(jìn)行平穩(wěn)性處理踏施,如短面板數(shù)據(jù)或N與T接近的情形,由于T信息含量不足罕邀,不考慮擾動(dòng)項(xiàng)序列自相關(guān)畅形。只有設(shè)定為時(shí)間序列模型的情況下才需要進(jìn)行平穩(wěn)性檢驗(yàn)。
2. 描述性分析
xtdes
這個(gè)命令的重點(diǎn)在于看數(shù)據(jù)的輪廓:
- 大N小T or 大T小N or 大N大T燃少,即估計(jì)量的漸近性質(zhì)
a. N→∞比T→∞的漸近特性更合適:可以假定橫截面具有大致的無關(guān)性(不存在組間同期相關(guān))束亏;由于T小,不考慮序列自相關(guān)或通過聚類穩(wěn)健標(biāo)準(zhǔn)誤解決阵具;適用短面板模型(FE,RE,GMM)
b. T與N階數(shù)相同或相近:可以假定時(shí)間序列無關(guān)性(不存在組內(nèi)自相關(guān))碍遍;適用PCSE(hetonly)或面板誤差修正模型
c. T比N大:適用長(zhǎng)面板模型或多元時(shí)間序列分析 - balanced or unbalanced,進(jìn)一步
xtbalance, range(#year_begin #year_end) miss(_all)
xtsum
觀察各變量是否正常:
- mean 最好統(tǒng)一量綱阳液,如人均實(shí)際GDP取對(duì)數(shù)
- min和max 是否在合理區(qū)間內(nèi)
- N, n和T 各變量缺失值情況怕敬,區(qū)間長(zhǎng)度可能不一致(與
xtbalance
配合使用)
xttab
類別變量
correlate
相關(guān)性分析的必要性:
- 被解釋變量和核心解釋變量之間的關(guān)系,初步判斷模型設(shè)定是否合理
e.g. 負(fù)相關(guān)與設(shè)定為U型關(guān)系的模型 - 核心解釋變量與工具變量之間的關(guān)系帘皿,事關(guān)內(nèi)生性
P.S. 改變數(shù)據(jù)結(jié)構(gòu)的兩個(gè)常用命令 reshape
和 gather
3. 畫圖
xtline
變量間關(guān)系可視化:與模型設(shè)定是否一致东跪?與模型結(jié)果是否一致?
面板模型及其Stata命令概覽
面板模型根據(jù)數(shù)據(jù)的結(jié)構(gòu)可以分為長(zhǎng)短面板鹰溜,也可以根據(jù)模型的設(shè)定分為靜態(tài)面板和動(dòng)態(tài)面板虽填。本文關(guān)注的是線性不可觀測(cè)效應(yīng)的面板數(shù)據(jù)模型,常用命令如下:
xtreg
Fixed-, between-, and random-effects, and population-averaged linear models
xtregar
Fixed- and random-effects linear models with an AR(1) disturbance
xtgls
Fit panel-data models by using GLS
xtpcse
Linear regression with panel-corrected standard errors
xthtaylor
Hausman–Taylor estimator for error-components models
xtfrontier
Stochastic frontier models for panel data
xtrc
Random-coefficients model
xtivreg
Instrumental variables and two-stage least squares for panel-data models
Source: Stata Longitudinal-Data/Panel-Data Reference Manual - Linear regression estimators
短面板模型
1. 混合回歸
由于混合回歸非常簡(jiǎn)單曹动,人一興奮就直接run
reg
和xtreg, fe
然后Hausman檢驗(yàn)斋日。這個(gè)做法相當(dāng)不嚴(yán)謹(jǐn),產(chǎn)生了誤導(dǎo)性結(jié)果墓陈。記住恶守,所有模型的第一步是進(jìn)行假設(shè)檢驗(yàn)。
1.1 假設(shè)檢驗(yàn)
混合回歸 (Pooled regression) 也被稱為“總體平均估計(jì)量 (Population-averaged model, or PA) ”贡必,基本假設(shè)是不存在個(gè)體效應(yīng)(包括固定效應(yīng)和隨機(jī)效應(yīng))兔港,因此必須對(duì)這個(gè)假設(shè)進(jìn)行檢驗(yàn)。
(1) 固定效應(yīng)檢驗(yàn)
F檢驗(yàn)(不推薦)
xtreg y x1 x2 x3, fe
注意是最下面一行的“F test that all u_i = 0”仔拟,不是表頭的F檢驗(yàn)衫樊。
H0:接受混合回歸;H1:FE優(yōu)于混合回歸理逊。
缺點(diǎn):未使用穩(wěn)健標(biāo)準(zhǔn)誤估計(jì)橡伞,因此F檢驗(yàn)有效性存疑盒揉。使用穩(wěn)健標(biāo)準(zhǔn)誤則愚蠢的stata不會(huì)報(bào)告F檢驗(yàn)結(jié)果晋被。LSDV法
reg y x1 x2 x3 i.id, vce cluster(id)
test id*
test id*=0
若虛擬變量顯著不為0兑徘,則存在個(gè)體效應(yīng),不應(yīng)使用混合回歸羡洛。
(2) 隨機(jī)效應(yīng)檢驗(yàn)
FGLS
xtreg y x1 x2 x3, re r theta
xttest0
LM檢驗(yàn)H0:不存在個(gè)體隨機(jī)效應(yīng)挂脑。MLE
xtreg y x1 x2 x3, mle [nolog]
估計(jì)結(jié)果的最后一行“Likelihood ratio test of sigma_u=0"。
1.2 xtreg
和 reg
的區(qū)別
xtreg
默認(rèn)設(shè)定是隨機(jī)效應(yīng)模型欲侮,混合OLS應(yīng)當(dāng)使用 reg
或者 xtreg, pa
崭闲。
1.3 混合OLS基本格式
reg y x1 x2 x3, vce cluster(id)
劃重點(diǎn):
- 由于不存在個(gè)體效應(yīng),回歸中不應(yīng)包含截面id的虛擬變量威蕉。
- 使用聚類穩(wěn)健標(biāo)準(zhǔn)誤
同一個(gè)體不同時(shí)期的擾動(dòng)項(xiàng)往往存在自相關(guān)刁俭,聚類穩(wěn)健標(biāo)準(zhǔn)誤可以克服組內(nèi)自相關(guān)。Stata默認(rèn)使用的普通穩(wěn)健標(biāo)準(zhǔn)誤(假設(shè)擾動(dòng)項(xiàng)為i.i.d) 大約是聚類穩(wěn)健標(biāo)準(zhǔn)誤的一半韧涨,因此不準(zhǔn)確牍戚。從這個(gè)角度看,此處聚類穩(wěn)健標(biāo)準(zhǔn)誤的使用與cluster個(gè)數(shù)無關(guān)虑粥。(挖個(gè)坑如孝,待填)
在聲明面板數(shù)據(jù)之后,選擇項(xiàng),robust
和,vce cluster(id)
效果完全相同娩贷。
2. 個(gè)體效應(yīng)模型
- 模型選擇問題:Hausman檢驗(yàn)
- 考慮雙向固定效應(yīng):控制時(shí)間變量第晰,并檢驗(yàn)其顯著性
- 若數(shù)據(jù)質(zhì)量不好,可考慮使用組間估計(jì)量(Regression on group means)彬祖,或供模型對(duì)比參考使用茁瘦,命令為
xtreg y x1 x2 x3, be
- 不要忘記使用聚類穩(wěn)健標(biāo)準(zhǔn)誤
- 由于LSDV法跟FE模型得到的估計(jì)量是一致的,因此在使用RE储笑、BE和PA模型的時(shí)候注意不可加入截面id的虛擬變量甜熔。
- 多維固定效應(yīng)
reghdfe
這是一個(gè)可以處理多維固定效應(yīng)(向下兼容)、可以聚類到3個(gè)層面南蓬、還可用工具變量處理內(nèi)生性的命令纺非,推薦使用。安裝方法如下:
ssc install reghdfe
一般情況下會(huì)報(bào)錯(cuò):“command ftools is unrecognized”
檢查ftools是否已安裝:reghdfe, version
安裝ftools:ssc install ftools
可能成功安裝赘方,可能繼續(xù)報(bào)錯(cuò):“connection timed out”
這時(shí)候就需要手動(dòng)安裝了:ftools手動(dòng)安裝包
下載zip解壓到相應(yīng)的ado文件夾中即可
長(zhǎng)面板模型
1. 假設(shè)檢驗(yàn)
- 組間異方差:Wald test
xtreg y x1 x2 x3 i.id t, r fe
或xtgls y x1 x2 x3 i.id t
xttest3
- 組內(nèi)自相關(guān):一階差分回歸(FD)
xtsetrial y x1 x2 x3 i.id t [,output]
- 組間同期相關(guān):
(1) LM檢驗(yàn)--僅適用長(zhǎng)面板
xtreg y x1 x2 x3 i.id t, r fe
或xtgls y x1 x2 x3 i.id t
或ivreg2
xttest2
(2) 截面相關(guān)檢驗(yàn)(cross-sectional dependence)--普遍適用
xtreg
xtcsd, pes
xtcsd, fri
xtcsd, fre abs show
2. 相應(yīng)模型
- 組間異方差:PCSE (hetonly)
xtpcse y x1 x2 x3 i.id t, hetonly
- 組內(nèi)自相關(guān):FGLS
(1) 截面自回歸系數(shù)相同xtpcse y x1 x2 x3 i.id t, corr(ar1)
(2) 截面自回歸系數(shù)不同xtpcse y x1 x2 x3 i.id t, corr(psar1)
- 組間異方差+組間同期相關(guān):PCSE(default)
xtpcse y x1 x2 x3 i.id t
- 組間異方差+組間同期相關(guān)+組內(nèi)自相關(guān):全面FGLS
xtgls y x1 x2 x3 i.id t, panels(cor) corr(ar1) igls
- 當(dāng)異方差烧颖、序列相關(guān)以及截面相關(guān)性質(zhì)未知時(shí),最合適的處理方法是
xtscc
命令窄陡,可以得到FE模型的穩(wěn)健型標(biāo)準(zhǔn)誤炕淮,但在N遠(yuǎn)大于T的情況下也應(yīng)慎用。
注意:分析長(zhǎng)面板數(shù)據(jù)的 xtgls
和 xtpcse
命令都沒有考慮個(gè)體效果 (fixed effects) 跳夭,他們對(duì)截面異質(zhì)性的處理都是通過 OLS 估計(jì)得到的殘差進(jìn)行了涂圆,也就是采用OLS估計(jì)的殘差估得穩(wěn)健型方差-協(xié)方差矩陣们镜。因此,上述回歸中均加入了i.id润歉。這種情形下考慮固定效應(yīng)有兩種方法:
(1) 加入 N-1 個(gè)虛擬變量(LSDV法)
tab id, gen(dumid)
drop dumid1
xtgls y x dumid*, p(h) corr(ar1)
(2) 先采用 xtdata 命令去除個(gè)體效果模狭,再采用 xtgls 命令進(jìn)行估計(jì)
preserve
xtdata y x , fe clear
xtgls y x, p(h) corr(ar1)
restore
推薦采用后者,因?yàn)楫?dāng) N 較大時(shí)踩衩,前者的輸出結(jié)果管理起來比較繁瑣嚼鹉。
Source: 連玉君的回答,固定效應(yīng)的FGLS估計(jì)怎么做
面板工具變量法
這一塊以后跟GMM一起寫驱富。(又挖個(gè)坑)
IV和GMM相關(guān)估計(jì)步驟锚赤,內(nèi)生性、異方差性等檢驗(yàn)方法
古往今來褐鸥,哪一個(gè)工具變量沒有爭(zhēng)議线脚?尋找工具變量
Refer:陳強(qiáng)《高級(jí)計(jì)量經(jīng)濟(jì)學(xué)及stata應(yīng)用(第二版)》