高級(jí)計(jì)量經(jīng)濟(jì)學(xué) 15:多值選擇模型(基礎(chǔ))
此文內(nèi)容為《高級(jí)計(jì)量經(jīng)濟(jì)學(xué)及STATA應(yīng)用》的筆記陪白,陳強(qiáng)老師著,高等教育出版社出版叠荠。
我只將個(gè)人會(huì)用到的知識(shí)作了筆記盹沈,并對(duì)教材較難理解的部分做了進(jìn)一步闡述。為了更易于理解袜香,我還對(duì)教材上的一些部分(包括證明和正文)做了修改撕予。
僅供學(xué)習(xí)參考,請(qǐng)勿轉(zhuǎn)載蜈首,侵刪实抡!
目錄
-
12 多值選擇模型
-
12.1 二值選擇模型的微觀(guān)基礎(chǔ)
- 12.1.1 潛變量
- 12.1.2 隨機(jī)效用最大化模型
- 12.2 多項(xiàng) Logit 與 多項(xiàng) Probit
- 12.3 條件 Logit 模型
- 12.4 混合 Logit 模型
-
12.1 二值選擇模型的微觀(guān)基礎(chǔ)
12.1 二值選擇模型的微觀(guān)基礎(chǔ)
為了將二值模型拓展到多值的情況欠母,我們首先要理解二值選擇模型的經(jīng)濟(jì)意義。
12.1.1 潛變量
在上一篇文章的 Probit 和 Logit 模型中似乎看不到擾動(dòng)項(xiàng)的存在吆寨。為此赏淌,我們先考察二值選擇模型的微觀(guān)基礎(chǔ)。對(duì)于二值選擇模型啄清,通沉可以用一個(gè)潛變量
(latent varibale)來(lái)概括該行為的凈收益。如果凈收益大于 0 則選擇做辣卒;否則選擇不做掷贾。假設(shè)凈收益為:
其中,凈收益 為潛變量荣茫,不可觀(guān)測(cè)想帅。上面的式子也稱(chēng)為指數(shù)函數(shù)
( index function ),個(gè)體的選擇規(guī)則為:
于是:
假設(shè) 或服從邏輯分布啡莉,那么:
其中港准, 為 的累積分布函數(shù),上面的第二個(gè)等號(hào)用到了密度函數(shù)關(guān)于原點(diǎn)對(duì)稱(chēng)的性質(zhì)咧欣。這個(gè)形式與高級(jí)計(jì)量14
中的二值選擇模型的形式相同叉趣,均為:
所以看似不存在的擾動(dòng)項(xiàng)其實(shí)是被包含在分布函數(shù)里頭了。
需要注意的是该押,對(duì)于常數(shù) 疗杉, 。如果擾動(dòng)項(xiàng)的方差為 那么 蚕礼,于是我們發(fā)現(xiàn) 對(duì)模型的擬合與 完全一樣烟具。所以我們無(wú)法同時(shí)
識(shí)別
( identify ) 與 。為此奠蹬,我們通常人為地令擾動(dòng)項(xiàng)的方差 即 朝聋;而對(duì)于 Logit 模型,則令擾動(dòng)項(xiàng)的方差為
12.1.2 隨機(jī)效用最大化模型
另外一種關(guān)鍵的微觀(guān)基礎(chǔ)為隨機(jī)效用最大化
模型( Random utility Maximization, RUM)囤躁。假設(shè)選擇 則可以帶來(lái)效用 冀痕;選擇 則可以帶來(lái)效用 。如果滿(mǎn)足 狸演,那么就選 言蛇,記 ;如果 那么就選擇 記為 宵距。由于存在很多決定效用的未知因素以及未來(lái)的不確定性腊尚,效用方程中包含一個(gè)擾動(dòng)項(xiàng),故名隨機(jī)效用满哪。假設(shè) 婿斥, 那么:
定義 以及 仅乓,于是又會(huì)得到我們前面的表達(dá)式: 赖舟,說(shuō)明潛變量和隨機(jī)效應(yīng)最大化模型雖然嘗試從不同的經(jīng)濟(jì)意義理解二值選擇模型,但最終其表達(dá)式是一樣的夸楣。
在隨機(jī)效用最大化模型中:
- 如果 和 服從正態(tài)且相互獨(dú)立,則 也服從正態(tài)分布石洗,此時(shí)只要將 標(biāo)準(zhǔn)化為 1紧显,即得到 Probit 模型讲衫。
- 如果 和
I型極值分布
( Type I extreme value distribution )正態(tài)且相互獨(dú)立孵班,那么 也服從邏輯分布。
I型極值分布篙程,即累積分布函數(shù)為
的分布枷畏。證明參見(jiàn) Cameron & Trivedi (2005, p.486)
隨機(jī)效用最大化模型的優(yōu)點(diǎn)是比較容易推廣到多值選擇模型,我們下面馬上講解它的應(yīng)用虱饿。
12.2 多項(xiàng) Logit 與 多項(xiàng) Probit
個(gè)體面臨的選擇有時(shí)候是多值的拥诡,而不僅僅是二值的。比如氮发,交通工具的選擇渴肉、職業(yè)的選擇,等等爽冕。假設(shè)個(gè)體的候選方案為 宾娜,其中 。如果 扇售,那么多值選擇模型退化為二值選擇前塔。
使用隨機(jī)效用法嚣艇,假設(shè)個(gè)體 選擇方案 所帶來(lái)的效用為:
其中,解釋變量 只隨個(gè)體 而變华弓,不隨方案 而變食零。比如,個(gè)體的性別寂屏、年齡贰谣、收入等特征。這種解釋變量被稱(chēng)為只隨個(gè)體而變
( case-specific )或不隨方案而變
( alternative-invariant )迁霎。系數(shù) 帶下標(biāo)吱抚,表明 對(duì)隨機(jī)效用 的作用取決于方案 ,在概率表達(dá)式中考廉,表現(xiàn)為對(duì) 的條件概率秘豹。
顯然,當(dāng)且僅當(dāng)方案 帶來(lái)的效用高于所有的其他方案昌粤,個(gè)體 才會(huì)選擇方案 既绕。所以個(gè)體 選擇 的概率可以寫(xiě)為:
假設(shè) 為 且服從 型極值分布,則可證明:
顯然涮坐,各方案的概率之和為1凄贩。上面的方程是對(duì)二值選擇 Logit 模型的自然推廣。需要注意的是袱讹,我們無(wú)法同時(shí)識(shí)別所有的系數(shù) 疲扎, 這是因?yàn)槿绻麑⑾禂?shù) 變?yōu)? ,完全不會(huì)影響模型的擬合捷雕。 為此评肆,通常讓某個(gè)方案(比如方案1)的系數(shù)為 ,即讓它成為參照方案
( base category )非区,于是瓜挽,個(gè)體 選擇方案 的概率為:
其中, 所對(duì)應(yīng)的方案為參照方案征绸。此模型稱(chēng)為多項(xiàng) Logit
( Multinomial Logit )久橙,可以用 MLE 進(jìn)行估計(jì),個(gè)體 的似然函數(shù)為:
其中管怠, 為示性函數(shù)( indicator function )淆衷,即如果括號(hào)中的表達(dá)式成立,則取值為1渤弛;反之取值為0祝拯。將所有個(gè)體的對(duì)數(shù)似然函數(shù)加總,即得到整個(gè)樣本的對(duì)數(shù)似然函數(shù),將其最大化就可以得到參數(shù)估計(jì)值 佳头。
另外鹰贵,如果在 中假設(shè) 服從 維正態(tài)分布,則可以得到多項(xiàng) Probit
( Multinomial Probit )模型康嘉,但該模型的選擇概率設(shè)計(jì)高維積分碉输,不好計(jì)算。
在多項(xiàng) Logit 模型中亭珍,是有多個(gè)參數(shù)向量需要估計(jì)的敷钾。這一點(diǎn)與普通的線(xiàn)性回歸不大一樣?,因?yàn)榫€(xiàn)性模型的參數(shù)向量 只有一個(gè)肄梨。你可以簡(jiǎn)單地把多項(xiàng) Logit 回歸理解為:**個(gè)體選擇方案 ** 的概率的回歸阻荒,既然有 種方案,那自然要回歸 次众羡,也就有了 個(gè) 啦侨赡。然而,受制于識(shí)別問(wèn)題纱控,我們會(huì)選擇一個(gè)參照方案,讓它的 菜秦,于是我們實(shí)際上要計(jì)算的參數(shù)向量其實(shí)只有 個(gè)
其實(shí)我們看看教材給的例子就看得懂了:
在下面的回歸中甜害,我們研究職業(yè)的選擇。假設(shè)有四種工作球昨,分別是:服務(wù)員尔店、藍(lán)領(lǐng)、工匠主慰、白領(lǐng)嚣州;個(gè)體有3種“特征”:是否為白人淮捆、受教育水平溢陪、工齡。然后我們將這三種特征作為解釋變量對(duì)職業(yè)的類(lèi)別進(jìn)行回歸:
在 Stata 中可以用mlogit occ white ed exper
進(jìn)行多項(xiàng) Logit 回歸障陶,報(bào)表如下:可以發(fā)現(xiàn)藐不, 每一個(gè)工種 實(shí)際上都有自己的參數(shù)向量 匀哄。上面的報(bào)表的意義是,在給定的顯著性水平上:
- 白人(white)更不可能選擇服務(wù)業(yè)或工匠雏蛮,但是否白人對(duì)選擇藍(lán)領(lǐng)和白領(lǐng)沒(méi)有顯著影響
- 受教育程度越高涎嚼,越不可能選擇專(zhuān)家(最后一行Prof)以外的職業(yè)
- 工齡越長(zhǎng),越不可能選擇服務(wù)業(yè)和藍(lán)領(lǐng)挑秉;而且工齡對(duì)選擇工匠和白領(lǐng)并無(wú)顯著影響
注意上面解釋回歸結(jié)果時(shí)法梯,我們都用了可能,這是從 Logit 模型的經(jīng)濟(jì)意義而來(lái)的
12.3 條件 Logit 模型
多項(xiàng) Logit 模型僅考慮不隨方案而變的解釋變量(比如犀概,膚色)立哑,但有些解釋變量可能既隨個(gè)體而變夜惭,也隨方案而變,比如刁憋,考慮以下的一個(gè)情景:
在經(jīng)濟(jì)學(xué)研究中滥嘴,我們的數(shù)據(jù)是這樣的:個(gè)體A選擇了火車(chē),個(gè)體B選擇了汽車(chē)至耻,個(gè)體C也選擇了火車(chē)若皱;而且我們也知道不同個(gè)體的一些特征變量,比如尘颓,他們的年齡走触、性別、民族疤苹、收入等互广。
依據(jù)這些個(gè)體的特征變量作為控制變量,我們用核心解釋變量(比如接受教育的程度)來(lái)預(yù)測(cè)個(gè)體的交通工具選擇行為:
問(wèn)題是我們并沒(méi)有把各個(gè)不同方案本身的特征變量考慮進(jìn)來(lái):乘坐火車(chē)卧土、飛機(jī)和汽車(chē)這三種交通工具本身有比如路途耗費(fèi)時(shí)間惫皱、路途耗費(fèi)精力、路途耗費(fèi)的資金尤莺、路途的舒適程度等特征旅敷。這些來(lái)自于方案本身的特征因素很多時(shí)候可能比我們之前基于個(gè)體的特征因素對(duì)個(gè)體的出行交通工具選擇的影響要大得多。基于這樣的邏輯颤霎,我們可以完全不用考慮個(gè)體特征媳谁,反而是把這些方案本身的特征變量作為控制變量去預(yù)測(cè)個(gè)體的出行方案選擇,這就是條件 Logit 模型的由來(lái)
我們把這種解釋變量稱(chēng)為隨方案而變
( alternative-specific )友酱,既包括隨方案與個(gè)體而變的變量(選擇加入不同俱樂(lè)部交的會(huì)費(fèi)不同)晴音,也包括隨方案而變但不隨個(gè)體而變的變量(選擇加入某個(gè)俱樂(lè)部后在這個(gè)俱樂(lè)部里每個(gè)人的會(huì)費(fèi)相同)。于是缔杉,個(gè)體選擇方案 所帶來(lái)的效用是:
其中锤躁,解釋變量 的下標(biāo)為 表明,解釋變量隨個(gè)體 而變或详,也隨方案 而變进苍。系數(shù) 不帶下標(biāo)表明 對(duì)隨機(jī)效用 的作用不依賴(lài)于方案 ,比如乘車(chē)時(shí)間依個(gè)體與方案的改變而改變鸭叙,但乘車(chē)時(shí)間太長(zhǎng)所帶來(lái)的負(fù)效用是一致的觉啊。
根據(jù)多項(xiàng) Logit 類(lèi)似的推導(dǎo)可以計(jì)算,個(gè)體 選擇方案 個(gè)概率為:
此模型稱(chēng)為條件 Logit
( Conditional Logit, CL )沈贝,也稱(chēng)為 McFadden 選擇模型
( McFadden's Choice Model)杠人,來(lái)自于 McFaden 在 1974 年的文章。
條件 Logit 模型的估計(jì)方法與多項(xiàng) Logiot 類(lèi)似,都通過(guò) MLE 估計(jì)以得到系數(shù)的估計(jì)值 嗡善,不過(guò)在 CL 中辑莫,參數(shù) 不依賴(lài)于參照方案,所以也不需要把 的某個(gè)部分標(biāo)準(zhǔn)化為 0罩引。
12.4 混合 Logit 模型
字面上理解各吨,混合 Logit 模型就是糅合了 12.2 和 12.3 兩種模型的特點(diǎn)而發(fā)展來(lái)的。很自然地袁铐,可以寫(xiě)出個(gè)體 選擇方案 所能帶來(lái)的隨機(jī)效用:
其中揭蜒,解釋變量 既隨個(gè)體 而變,也隨方案 而變剔桨;而解釋變量 僅隨個(gè)體 而變屉更。經(jīng)過(guò)類(lèi)似的推導(dǎo),可以計(jì)算出個(gè)體 選擇方案 的概率為:
此模型在文獻(xiàn)中稱(chēng)為混合 Logit
模型( Mixed Logit )洒缀,但 Stata 仍稱(chēng)之為條件 Logit瑰谜。為了識(shí)別模型,方程 中也需要選擇一個(gè)參照方案树绩,并令 萨脑。
12.5 關(guān)于三個(gè)模型的要點(diǎn)
對(duì)于以上三種模型,當(dāng)方案本身的特質(zhì)并不重要饺饭,或缺乏相關(guān)特征的數(shù)據(jù)時(shí)渤早,常常使用多項(xiàng) Logit 模型。如果需要考慮不同方案的特征砰奕,則應(yīng)使用條件 Logit 模型或混合 Logit 模型蛛芥。另外提鸟,在這些多值選擇模型中军援,由于被解釋變量的分布必然為多項(xiàng)分布( multinomial distribution ),故一般不必考慮穩(wěn)健標(biāo)準(zhǔn)誤称勋,使用普通標(biāo)準(zhǔn)誤即可:這一點(diǎn)類(lèi)似于二值選擇模型胸哥。然而,如果數(shù)據(jù)時(shí)聚類(lèi)樣本赡鲜,則仍需要使用穩(wěn)健標(biāo)準(zhǔn)誤空厌。
需要注意的是,在多項(xiàng) Logit 模型和混合 Logit 模型中银酬,對(duì)參數(shù)估計(jì)值 的解釋是以參照方案( base category )為轉(zhuǎn)移的(可以根據(jù)理論或方便來(lái)選擇參照方案)嘲更。以多項(xiàng) Logit 模型為例,假設(shè)“方案1”或“方案“其中一個(gè)必然發(fā)生揩瞪,那么在此條件下赋朦,“方案”發(fā)生的概率為:
上式與二值選擇的 Logit 模型具有完全相同的形式。而幾率比
或相對(duì)風(fēng)險(xiǎn)
為:
從條件概率 可以看出,該條件概率并不依賴(lài)于其他任何方案——換言之宠哄,如果將多值選擇模型的任何兩個(gè)方案單獨(dú)挑出來(lái)壹将,都是二值 Logit 模型。此假定稱(chēng)為無(wú)關(guān)方案的獨(dú)立性
( Idependence of Irrelevant Alternatives, IIA)毛嫉。根據(jù)類(lèi)似的推導(dǎo)诽俯,條件 Logit 模型也服從 IIA 假定。然而承粤,在實(shí)踐中暴区,如果兩個(gè)不同的方案之間十分接近,那么 IIA 假設(shè)不一定成立密任,這是多項(xiàng) Logit颜启、條件 Logit 與混合 Logit 模型存在的通病。
例如浪讳,假設(shè)共有 4 個(gè)備選的交通方式缰盏,自駕車(chē)、自行車(chē)淹遵、紅色公交和藍(lán)色公交口猜。根據(jù) IIA 假定,如果給定條件選擇自駕或坐紅色公交透揣,那么在加上自行車(chē)济炎、藍(lán)色公交這兩種方案以后,不應(yīng)該對(duì)前面的條件概率造成很大的影響辐真。
誠(chéng)然须尚,加入自行車(chē)并不會(huì)對(duì)自家車(chē)和乘坐紅色公交造成很大的影響,加入藍(lán)色公交這種方案以后也不會(huì)對(duì)自駕造成很大的影響侍咱;不過(guò)耐床,加入藍(lán)色公交車(chē)會(huì)使得乘坐紅色公交的概率降低一半,這將會(huì)影響 IIA 假定楔脯。
如果還是不理解撩轰,那么我們可以嘗試去理解檢驗(yàn) IIA 的方法:豪斯曼檢驗(yàn),的基本想法:
也就是說(shuō)堪嫂,如果 IIA 成立,那么去掉某個(gè)方案以后的系數(shù)估計(jì) 與全樣本估計(jì)值 沒(méi)有系統(tǒng)性差別木柬,為此 Hausman & McFadden (1984) 提出了以下統(tǒng)計(jì)量:
其中皆串, 等于 的維度。另外還有 Small & Hsiao (1985) 也提出了檢驗(yàn) IIA 的方法眉枕,不過(guò)這兩個(gè)方法的小樣本性質(zhì)都不好恶复,故結(jié)論只具有參考價(jià)值娇唯。