高級計(jì)量經(jīng)濟(jì)學(xué) 17:面板二值選擇模型
此文內(nèi)容為《高級計(jì)量經(jīng)濟(jì)學(xué)及STATA應(yīng)用》的筆記米愿,陳強(qiáng)老師著佛吓,高等教育出版社出版梦鉴。
我只將個人會用到的知識作了筆記集绰,并對教材較難理解的部分做了進(jìn)一步闡述。為了更易于理解绿鸣,我還對教材上的一些部分(包括證明和正文)做了修改疚沐。
僅供學(xué)習(xí)參考,請勿轉(zhuǎn)載潮模,侵刪亮蛔!
目錄
-
17 非線性面板
- 17.1 面板二值選擇模型
- 17.2 面板二值選擇模型的 RE 估計(jì)
- 17.3 面板二值選擇模型的 FE 估計(jì)
- 17.4 二值選擇 FE 模型的估計(jì)方法:充分統(tǒng)計(jì)量
17.1 面板二值選擇模型
對于面板數(shù)據(jù),如果被解釋變量為虛擬變量擎厢,則稱為面板二值選擇模型
(binary choice model for panel data)究流。對于二值選擇行為,通扯猓可以通過一個潛變量
(latent variable)來概括該行為的凈收益(收益減去成本)芬探。如果凈收益大于0,則選擇做厘惦;否則選擇不做偷仿。假設(shè)凈收益為:
其中,凈收益 為不可觀測的潛變量宵蕉,
為個體效應(yīng)(individual effects)酝静,而解釋變量
不含常數(shù)項(xiàng)。個體的選擇規(guī)則為:
給定 羡玛,
别智,
,則有:
其中稼稿, 為誤差項(xiàng)
的累積分布函數(shù)(cdf)薄榛,并假設(shè)
的密度函數(shù)關(guān)于原點(diǎn)對稱。如果
則為 Probit 模型:
如果 服從邏輯分布让歼,則為 Logit 模型:
面板二值選擇模型主要估計(jì)方法包括:
- 混合回歸
- 隨機(jī)效應(yīng)估計(jì)
- 固定效應(yīng)估計(jì)
在方程 中敞恋,如果
,即沒有個體效應(yīng)是越,則為混合回歸(pooled probit or pooled logit),可將此面板數(shù)據(jù)作為橫截面數(shù)據(jù)處理(參考《高級計(jì)量16》)碌上,此時倚评,只需要使用截面數(shù)據(jù)的相關(guān) Stata 命令即可進(jìn)行混合回歸。然而馏予,由于同一個體不同時期的擾動項(xiàng)可能存在自相關(guān)天梧,故應(yīng)使用以面板為聚類的聚類穩(wěn)健標(biāo)準(zhǔn)誤(cluster-robust standard error)。
17.2 面板二值選擇模型的 RE 估計(jì)
更一般地霞丧,我們允許個體效應(yīng)存在呢岗,即不同的個體擁有不同的 。如果
與所有解釋變量
均不相關(guān),則稱為
隨機(jī)效應(yīng)模型
(Random Effect Model, RE, 見《高級計(jì)量16》)后豫;否則為固定效應(yīng)模型
(Fixed Effect Model, FE)悉尾。
首先考慮 RE 模型。對于線性面板的 RE 模型挫酿,一般使用廣義最小二乘法(GLS)進(jìn)行估計(jì)构眯。但非線性面板不便使用GLS,故轉(zhuǎn)而使用最大似然估計(jì)(MLE)早龟。假設(shè) 惫霸,記密度函數(shù)為
。以 Logit 模型為例葱弟,給定
壹店,則個體
的條件分布為(參考《高級計(jì)量14》):
然而,上式的 不可觀測芝加,為此硅卢,記
的聯(lián)合密度為
,并進(jìn)行如下分解:
在 的聯(lián)合密度重妖混,將
積分去掉暖混,即可得到
的邊緣密度:
上面的積分沒有解析解,可以通過數(shù)值求解的方法求解碰纬,這里就不再敘述了暖庄。
假設(shè)不同個體的觀測值相互獨(dú)立,則可以寫出整個樣本的似然函數(shù)祥楣。最大化此似然函數(shù)即得到 的
RE Logit 估計(jì)量
开财。如果將上述方程的邏輯分布 改為正態(tài)分
,那么就是
RE Probit 估計(jì)量
误褪。由于不同個體的觀測值相互獨(dú)立责鳍,故不同個體的擾動項(xiàng)也不相關(guān),但由于 的存在兽间,同一個體不同時期的擾動項(xiàng)之間仍存在相關(guān):
求
历葛。
即為所求。
如果 嘀略,那么自相關(guān)系數(shù)為:
如果 越大恤溶,就表示復(fù)合擾動項(xiàng)
中個體效應(yīng)
的部分比較大,不能忽視個體效應(yīng)帜羊;極端地咒程,如果
,就表示復(fù)合擾動項(xiàng)中
讼育,個體效應(yīng)接近沒有帐姻,故應(yīng)該使用混合回歸模型稠集。
17.3 面板二值選擇模型的 FE 估計(jì)
在面板二值選擇模型中,如果個體效應(yīng) 與解釋變量
相關(guān)饥瓷,那么就是 FE 模型剥纷,
其中, 可以是
或者
扛伍。此時筷畦,如果使用 RE 模型或混合回歸則得不到一致估計(jì)。
對于線性面板數(shù)據(jù)模型刺洒,參考《高級計(jì)量16》鳖宾,一般采用
組內(nèi)估計(jì)量
或者一階差分
來消去固定效應(yīng),然后就可以正確估計(jì)
逆航。但對于非線性面板數(shù)據(jù)而言鼎文,這些變換一般不起作用,因?yàn)闊o法建立可觀測的
與不可觀測的
(即潛變量
的組內(nèi)離差)之間的對應(yīng)關(guān)系因俐。
就算使用虛擬變量法(LSDV法)拇惋,對于二值選擇的固定效應(yīng)模型,也仍然得不到一致估計(jì)(除非 *
)抹剩,這是因?yàn)槌盘?dāng)
時,待估計(jì)的個體效應(yīng)
的個數(shù)也隨之增加澳眷。這些
被稱為
伴生參數(shù)
(incidental parameters)胡嘿。另一方面,每一個只能由個體
的
個觀測值來估計(jì)钳踊,而
并不增加衷敌。對于現(xiàn)實(shí)的數(shù)據(jù),
通常很小拓瞪,從而
且
有限時缴罗,
不會收斂。更重要的問題是祭埂,對
的不一致估計(jì)還會使得
的估計(jì)也不一致面氓,這被稱為
伴生參數(shù)問題
。
在線性面板模型中蛆橡,可以通過組內(nèi)變換或差分變換解決伴生參數(shù)問題舌界,但對于固定效應(yīng)的面板 Probit 模型,目前尚無法解決此類伴生參數(shù)問題航罗。
17.4 二值選擇 FE 模型的估計(jì)方法:充分統(tǒng)計(jì)量
對于固定效應(yīng)的面板 Logit 模型禀横,可以通過尋找 的
充分統(tǒng)計(jì)量
(sufficient statistic)屁药,然后在給定此充分統(tǒng)計(jì)量的條件下進(jìn)行條件最大似然估計(jì)
(conditional MLE)粥血。
充分統(tǒng)計(jì)量是統(tǒng)計(jì)學(xué)的一個概念柏锄。考慮總體參數(shù)
與統(tǒng)計(jì)量
复亏。如果統(tǒng)計(jì)量
包含了樣本中所有可以用來估計(jì)
的信息趾娃,則稱
是參數(shù)
的充分統(tǒng)計(jì)量。
換言之缔御,給定
以后抬闷,任何根據(jù)樣本計(jì)算的其他統(tǒng)計(jì)量都不可能提供關(guān)于
的額外信息。
對于 Logit 模型耕突,Chamberlain(1980)提出使用
作為 的充分統(tǒng)計(jì)量笤成,并計(jì)算在給定
情況下的條件似然函數(shù)(根據(jù)充分統(tǒng)計(jì)量的性質(zhì),此似然函數(shù)不再依賴于
)眷茁,然后進(jìn)行條件似然最大估計(jì)炕泳。然而,對于 Probit 模型上祈,卻找不到
的充分統(tǒng)計(jì)量培遵。
以最簡單的兩期模型為例進(jìn)行說明,即 登刺。此時籽腕,對于個體
,只有以下三種可能:
纸俭。下面分別考慮著三種情形:
(1)
皇耗,此時必然
,從而
掉蔬,其對數(shù)似然函數(shù)為
廊宪,故對整個樣本的似然函數(shù)沒有貢獻(xiàn)。
直觀來看女轿,由于此條件似然函數(shù)的取值為常數(shù)箭启,故此觀測值不包含任何可以用于估計(jì) 的信息,因此蛉迹,在進(jìn)行條件似然估計(jì)時傅寡,是否包含這些觀測值并不影響估計(jì)結(jié)果。
事實(shí)上北救,等于損失了這些樣本的觀測值荐操。
(2)
,此時必然
珍策,從而
托启,同理,這些觀測值并不包含任何有助于估計(jì)
的信息攘宙,應(yīng)該忽略
(3)
此時屯耸,或者 或者
拐迁,分別計(jì)算其條件概率為:
假設(shè)給定 和
的條件下,
和
相互獨(dú)立疗绣,則:
將表達(dá)式 和
代入
中线召,可得:
注意到, 在分子分母都有
項(xiàng)多矮,于是被消除了缓淹。同理,將
和
代入
可得:
如果定義虛擬變量:如果 則
否則
塔逃,那么就可以把
和
寫在一起讯壶,并將個體
的條件對數(shù)似然函數(shù)寫為:
其中 為示性函數(shù),表示僅考慮
的觀測值湾盗。上式對
加總鹏溯,即可得到整個樣本條件對數(shù)似然函數(shù)。
從 我們發(fā)現(xiàn):
給定
的條件似然函數(shù)不再依賴于
此條件似然函數(shù)仍為 Logit 模型淹仑,只是解釋變量變?yōu)?
不隨時間變化的變量將無法識別其系數(shù)丙挽,因?yàn)槠?
固定效應(yīng)似然函數(shù)并不包含積分,不需要進(jìn)行積分計(jì)算
更一般地匀借,對于 颜阐,可以計(jì)算給定
或
的條件似然函數(shù)。固定效應(yīng)模型的缺點(diǎn)是吓肋,將損失所有
或
的觀測值凳怨,導(dǎo)致樣本容量減少;并且由于
消去了是鬼,也無法估計(jì)個體效應(yīng)
肤舞,也無法預(yù)測
發(fā)生的概率或解釋變量對
的邊際效應(yīng)。解決的方法是假設(shè)