2020-04-24

面板數(shù)據(jù)的知識(shí)點(diǎn)總結(jié)和實(shí)戰(zhàn)經(jīng)驗(yàn)

首先匹厘,面板數(shù)據(jù)是什么嘀趟?

面板數(shù)據(jù)是指在一段時(shí)間內(nèi)跟蹤同一組個(gè)體的數(shù)據(jù),它既有橫截面維度(n個(gè)樣本)又有時(shí)間維度(t個(gè)時(shí)期)愈诚,所以面板數(shù)據(jù)的優(yōu)點(diǎn)在于樣本量比較大她按,而且兼具兩類數(shù)據(jù)的分析特點(diǎn),可以觀測(cè)到動(dòng)態(tài)變化

其次炕柔,為什么要使用面板數(shù)據(jù)酌泰?

面板數(shù)據(jù)的應(yīng)用大多是為了解決遺漏變量的問(wèn)題,一般來(lái)講如果我們的在構(gòu)建回歸模型的時(shí)候忽略了重要的解釋變量匕累,就會(huì)影響整個(gè)模型的解釋力度陵刹,所以我們需要去找這些重要的遺漏變量。通常我們會(huì)使用工具變量法來(lái)阻止這類問(wèn)題欢嘿,但是實(shí)際操作總是比較困難的衰琐,遺漏變量常常是基于個(gè)體不可觀測(cè)的一致性造成的(比如個(gè)體能力),如果這種差異不會(huì)隨時(shí)間而改變炼蹦,那么面板數(shù)據(jù)能很好的為我們解決這一問(wèn)題羡宙。

長(zhǎng)面板/短面板——社會(huì)學(xué)使用一般都是短面板,n>t,畢竟成型的數(shù)據(jù)調(diào)查還是開始不久

平衡面板/非平衡面板——看看是否數(shù)據(jù)完整

動(dòng)態(tài)面板/靜態(tài)面板——解釋變量是否包含被解釋變量的滯后值

最后掐隐,我們要如何利用面板數(shù)據(jù)來(lái)解決遺漏變量的問(wèn)題狗热?

1.混合回歸(pooled regression)--極端的把面板數(shù)據(jù)看成截面數(shù)據(jù),即假定不同個(gè)體之間的擾動(dòng)項(xiàng)相互獨(dú)立,強(qiáng)行忽略個(gè)體效應(yīng)進(jìn)行ols回歸匿刮,(也就是iid僧凰,隨機(jī)誤差獨(dú)立同分布),這時(shí)候估計(jì)會(huì)有偏

這里提及一個(gè)“聚類樣本”僻焚,是指雖然每個(gè)個(gè)體不同時(shí)期的觀測(cè)值很難相互獨(dú)立允悦,聚類樣本就是將同一個(gè)體不同時(shí)期的觀測(cè)值視作一個(gè)聚類,這樣同一聚類內(nèi)部相關(guān)虑啤,但是和其他聚類是可以獨(dú)立隙弛,這樣我們?nèi)匀豢梢允褂胦ls,但是要注意使用聚類穩(wěn)健標(biāo)準(zhǔn)誤(其實(shí)并不知道這是什么狞山,實(shí)際操作中使用普通標(biāo)準(zhǔn)誤的確是不準(zhǔn)確的全闷,一般會(huì)在指令后附加r

2.分別回歸--即每個(gè)個(gè)體效應(yīng)都設(shè)計(jì)一個(gè)獨(dú)立的方程

操作起來(lái)非常不現(xiàn)實(shí)

3.個(gè)體效應(yīng)模型(individual-specific effects model)--折中方案,即假定每個(gè)個(gè)體回歸擁有相同的斜率萍启,但截距項(xiàng)不一樣

就會(huì)長(zhǎng)成這個(gè)樣子总珠,注意角標(biāo),i關(guān)于個(gè)體勘纯,t關(guān)于年份局服、時(shí)間

我們能不能舉出一個(gè)好記的例子呢?

ui和解釋變量相關(guān)驳遵,我們稱其為內(nèi)生性問(wèn)題淫奔,我們把那些關(guān)乎個(gè)體的無(wú)法測(cè)量的變量設(shè)計(jì)成ui(個(gè)體效應(yīng)),單獨(dú)提出來(lái)我們就能關(guān)注到解釋變量的凈效應(yīng)了

如果個(gè)體效應(yīng)ui和某個(gè)解釋變量相關(guān)堤结,我們稱其為固定效應(yīng)模型唆迁,反之為隨機(jī)效應(yīng)模型

4.固定效應(yīng)模型FE(具體公式推導(dǎo)詳見《計(jì)量經(jīng)濟(jì)學(xué)及stata應(yīng)用》的第十二章)

既然ui和解釋變量相關(guān)、多期ui也很難保證完全獨(dú)立竞穷,這違背了線性回歸的假定唐责,那么只要我們需要消掉個(gè)體效應(yīng)ui,ols估計(jì)方法還是能正常去用的

(1)組內(nèi)估計(jì)值--組內(nèi)去心瘾带,消去ui(明白了鼠哥,為了消除zi和ui,去心一減平均月弛,就消除了

(2)LSDV法肴盏,把截距項(xiàng)設(shè)計(jì)成虛擬變量——跟多分類變量是一樣的,個(gè)體差異表現(xiàn)在虛擬變量結(jié)局上帽衙,黑龍江省一條菜皂、上海市就跟它不一樣啦

(3)一階差分法,什么叫一階差分厉萝?——相當(dāng)于我求一個(gè)前一期的方程恍飘,然后兩個(gè)方程做差榨崩,消掉不會(huì)因時(shí)間而變得zi和ui

(4)雙向固定效應(yīng),同時(shí)關(guān)注不隨個(gè)體而變章母,但隨時(shí)間而變的變量母蛛,再去用LSDV法去做ols——比如說(shuō)企業(yè)宏觀經(jīng)濟(jì)環(huán)境,不受個(gè)體企業(yè)控制乳怎,但是會(huì)因時(shí)間而變彩郊,比如金融危機(jī)前后,可能也是會(huì)帶來(lái)影響的蚪缀,我們就得考慮

5.隨機(jī)效應(yīng)模型RE(具體公式推導(dǎo)詳見《計(jì)量經(jīng)濟(jì)學(xué)及stata應(yīng)用》的第十二章)

雖然ui和解釋變量不相關(guān)秫逝,我們可以嘗試使用ols,但是因?yàn)閡i的存在询枚,同一個(gè)體不同時(shí)期的擾動(dòng)項(xiàng)之間仍然存在自相關(guān)(比如三十年內(nèi)同一企業(yè)的投資政策违帆,不太可能完全沒(méi)關(guān)系),我們稱其為不是球型擾動(dòng)項(xiàng)(組內(nèi)自相關(guān))這時(shí)使用ols效率不高

(1)使用GLS(廣義最小二乘法)金蜀,去除自相關(guān)

(2)組間估計(jì)值(為什么固模使用組內(nèi)而隨模使用組間刷后?)其實(shí)都是去心算法,只不過(guò)隨機(jī)效應(yīng)計(jì)算一個(gè)斯塔渊抄,代入公式計(jì)算廣義離差而已尝胆,就是名字不一樣

6.擬合優(yōu)度的度量:估計(jì)量對(duì)模型的擬合程度

如果使用個(gè)體效應(yīng)模型,應(yīng)該會(huì)匯報(bào)出三種“整體R方”护桦、“組內(nèi)R方”班巩、“組間R方”,如果是FE就參考組內(nèi)R方嘶炭,RE就參考組間R方

7.我應(yīng)該使用FE還是RE?

H0:ui與解釋變量不相關(guān)? H1:相關(guān)

如果H0被接受則為RE逊桦,反之FE

也就是豪斯曼檢驗(yàn)啦眨猎,但是傳統(tǒng)的豪斯曼檢驗(yàn)要求組間同方差并且只能解決組內(nèi)自相關(guān)(70年內(nèi)黑龍江省的經(jīng)濟(jì)政策,肯定會(huì)有關(guān)的)强经,組間異方差情況下不可使用睡陪,所以后期有人進(jìn)行修正,提出穩(wěn)健豪斯曼檢驗(yàn)匿情,具體操作可以看看書

8.實(shí)際操作中兰迫,我們?cè)趺催x擇是使用混合回歸還是FE/RE?

當(dāng)我們使用stata進(jìn)行FE模型檢驗(yàn)時(shí)炬称,表格會(huì)提供H0:所有ui都等于0 的原假設(shè)汁果,如果接受原假設(shè),則說(shuō)明個(gè)體效應(yīng)的存在沒(méi)什么意義玲躯,因?yàn)樗粫?huì)變化据德,一起放進(jìn)擾動(dòng)項(xiàng)就可以鳄乏,這時(shí)混合回歸是可以用的,但如果拒絕原假設(shè)棘利,說(shuō)明FE要好得多橱野;如果是RE模型檢驗(yàn),通過(guò)stata自帶的LM檢驗(yàn)善玫,其原假設(shè)H0:sigma_u的平方為0水援,如果拒絕原假設(shè)說(shuō)明原模型包含反應(yīng)個(gè)體特性的隨機(jī)擾動(dòng)項(xiàng)ui,就不能用混合回歸

思考問(wèn)題:

如果被解釋變量與個(gè)體特征有關(guān)茅郎,使用哪種模型--固定蜗元,如果殘差項(xiàng)中某些變量和解釋變量相關(guān),而同時(shí)對(duì)被解釋變量存在影響只洒,就會(huì)導(dǎo)致被解釋變量的系數(shù)是有偏且非一致的许帐。這時(shí)候就需要將這些變量加入模型中。但是有時(shí)候這些變量是不可觀測(cè)的毕谴,固定效應(yīng)回歸可以解決一部分這種問(wèn)題成畦。

如果豪斯曼檢驗(yàn)接受原假設(shè),可不可以使用固定效應(yīng)模型--可以涝开,因?yàn)榫退鉼i和解釋變量不相關(guān)循帐,現(xiàn)實(shí)情況里也很難找到同一聚類里完全組內(nèi)無(wú)關(guān)的情況,所以固定效應(yīng)模型還是更常用的

實(shí)踐部分

謝宇舀武、于嘉《生育對(duì)于我國(guó)女性工資率的影響》

研究問(wèn)題: 1.在我國(guó)拄养,生育是否會(huì)導(dǎo)致女性的工資率降低? 如果會(huì),降低的幅度是多少? ( 2) 在我國(guó)银舱,什么因素會(huì)影響女性的“生育代價(jià)”? 也就是說(shuō)瘪匿,生育對(duì)女性工資率的影響是否在不同群體間有所不同?

研究變量:

描述性分析

數(shù)據(jù)處理的一些注意事項(xiàng):

本文使用的數(shù)據(jù)是中國(guó)健康和營(yíng)養(yǎng)調(diào)查(CHNS)1993、1997寻馏、2000棋弥、2004、2006五次的調(diào)查數(shù)據(jù)诚欠,因?yàn)檫@個(gè)數(shù)據(jù)的問(wèn)卷不是統(tǒng)一放在一起的顽染,所以應(yīng)該是每個(gè)文件分別保存變量再合并再集中清理

合并的指令,需要我們知道對(duì)應(yīng)的id轰绵,如果是1:1粉寞,就是對(duì)應(yīng)的不同方式,具體的詳查左腔。比較重要的是需要修改文件路徑才能順利合并

一個(gè)處理未知值的方法唧垦,對(duì)于那些連續(xù)數(shù)值變量,比如時(shí)間翔悠。我們可以取一取平均值進(jìn)行填充业崖,但是類別變量就不要瞎弄了

先將缺失和未知值處理為.再每個(gè)變量取均值進(jìn)行插值野芒,這樣就避免因?yàn)閯h掉數(shù)據(jù)而導(dǎo)致的數(shù)據(jù)有偏

描述性分析的一些注意事項(xiàng):

啥原理呢?

duplicates report 是把重復(fù)的情況列出來(lái)双炕,duplicate drop var狞悲,force是刪掉重復(fù)值

這是tab,把數(shù)據(jù)輸出成表格

tabstat 是把描述性的內(nèi)容輸出成表格妇斤,而tab一般都是分散列的摇锋,我們還要自己往表里放。其中statistics(mean sd N)是指列出均值站超、標(biāo)準(zhǔn)差和樣本量荸恕,然后birth()是通過(guò)birth這個(gè)類別變量進(jìn)行報(bào)告,最后的format(%6.2f)就是調(diào)整格式死相,整數(shù)6位融求,保留2位小數(shù)點(diǎn),要注意這是連續(xù)變量的用法

輸出出來(lái)就長(zhǎng)這樣

如果想要把描述性的內(nèi)容以縱向表格的形式呈現(xiàn)出來(lái)算撮,可以加col后綴生宛,一般來(lái)講是類別變量的用法

還是很實(shí)用的
輸出就是這樣的

封裝變量,也叫全局暫元肮柜,就是省點(diǎn)力氣不用敲那么多變量上去

所以這個(gè)type和help是干嘛用的陷舅?

操作面板數(shù)據(jù),首先要確定id 和 year ,然后全局暫元就用在逐步回歸上

est sto 用來(lái)保存輸出結(jié)果

注意一下审洞,rtf是一種文本格式莱睁,和doc一樣,但是輸出的表格是帶邊框的芒澜,doc卻沒(méi)有

compress nogap是使結(jié)果更緊湊

b(%4.3f) se(%6.4f) brackets? brackets把原本的小括號(hào)變成了中括號(hào)仰剿,b(%4.3f) 是回歸系數(shù)保留小數(shù)點(diǎn)后三位,se(%6.4f) 是將原本的t值用標(biāo)準(zhǔn)誤替代并保留4位小數(shù)痴晦,star(* 0.1 ** 0.05 *** 0.01)是手動(dòng)設(shè)置顯著性水平酥馍,title是輸出表格表頭,不過(guò)我輸出是亂碼阅酪,不造為什么

注意下theta是隨機(jī)變量需要報(bào)告的值,不附指令就跑不出來(lái)

兩種豪斯曼檢驗(yàn)汁针,之前說(shuō)過(guò)傳統(tǒng)豪斯曼不能應(yīng)對(duì)異方差术辐,所以提供了修正后的穩(wěn)健豪斯曼檢驗(yàn)

注意穩(wěn)健豪斯曼使用需要安裝xtoverid和ivreg2
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市施无,隨后出現(xiàn)的幾起案子辉词,更是在濱河造成了極大的恐慌,老刑警劉巖猾骡,帶你破解...
    沈念sama閱讀 216,919評(píng)論 6 502
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件瑞躺,死亡現(xiàn)場(chǎng)離奇詭異敷搪,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)幢哨,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,567評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門赡勘,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人捞镰,你說(shuō)我怎么就攤上這事闸与。” “怎么了岸售?”我有些...
    開封第一講書人閱讀 163,316評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵践樱,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我凸丸,道長(zhǎng)拷邢,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,294評(píng)論 1 292
  • 正文 為了忘掉前任屎慢,我火速辦了婚禮瞭稼,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘抛人。我一直安慰自己弛姜,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,318評(píng)論 6 390
  • 文/花漫 我一把揭開白布妖枚。 她就那樣靜靜地躺著廷臼,像睡著了一般。 火紅的嫁衣襯著肌膚如雪绝页。 梳的紋絲不亂的頭發(fā)上荠商,一...
    開封第一講書人閱讀 51,245評(píng)論 1 299
  • 那天,我揣著相機(jī)與錄音续誉,去河邊找鬼莱没。 笑死,一個(gè)胖子當(dāng)著我的面吹牛酷鸦,可吹牛的內(nèi)容都是我干的饰躲。 我是一名探鬼主播,決...
    沈念sama閱讀 40,120評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼臼隔,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼嘹裂!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起摔握,我...
    開封第一講書人閱讀 38,964評(píng)論 0 275
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤寄狼,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后氨淌,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體泊愧,經(jīng)...
    沈念sama閱讀 45,376評(píng)論 1 313
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡伊磺,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,592評(píng)論 2 333
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了删咱。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片屑埋。...
    茶點(diǎn)故事閱讀 39,764評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖腋腮,靈堂內(nèi)的尸體忽然破棺而出雀彼,到底是詐尸還是另有隱情,我是刑警寧澤即寡,帶...
    沈念sama閱讀 35,460評(píng)論 5 344
  • 正文 年R本政府宣布徊哑,位于F島的核電站,受9級(jí)特大地震影響聪富,放射性物質(zhì)發(fā)生泄漏莺丑。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,070評(píng)論 3 327
  • 文/蒙蒙 一墩蔓、第九天 我趴在偏房一處隱蔽的房頂上張望梢莽。 院中可真熱鬧,春花似錦奸披、人聲如沸昏名。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,697評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)轻局。三九已至,卻和暖如春样刷,著一層夾襖步出監(jiān)牢的瞬間仑扑,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,846評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工置鼻, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人箕母。 一個(gè)月前我還...
    沈念sama閱讀 47,819評(píng)論 2 370
  • 正文 我出身青樓储藐,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親嘶是。 傳聞我的和親對(duì)象是個(gè)殘疾皇子邑茄,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,665評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容