一個(gè)疑惑:解釋變量中類別變量的處理

我們知道哭靖,當(dāng)分類自變量的類別大于兩個(gè)的時(shí)候坦敌,需要建立一組虛擬變量(啞變量)來代表變量的歸屬性質(zhì)。一般虛擬變量的數(shù)目比分類變量的數(shù)目少一個(gè)碉碉,少掉的那個(gè)就作為參照類(reference category),參照類的選取是隨意的淮韭。

問題來了:為什么要這么做呢垢粮?如果把這個(gè)類別變量(尤其是有序變量)當(dāng)做連續(xù)變量處理,有什么不對的地方嗎靠粪?

舉個(gè)栗子:教育變量在回歸中作為控制變量蜡吧。按教育程度由低到高依次記為 1~6粱腻,回歸中把教育作為一個(gè)連續(xù)變量 edu 和作為 6 個(gè)啞變量 edu1~edu6 處理有何不同?

從系數(shù)含義來講斩跌,作為連續(xù)變量的 edu, 其系數(shù)代表每提升一個(gè)教育程度對因變量的影響捞慌。由于結(jié)果中只有一個(gè)系數(shù)耀鸦,其潛在假設(shè)是 edu1 和 edu2 對因變量影響的差異 = edu2 和 edu3 對因變量影響的差異 = edu3 和 edu4 對因變量影響的差異 = ……。現(xiàn)實(shí)中滿足這種假設(shè)的情形極為少見啸澡。

若作為啞變量處理袖订,參照類的系數(shù)為 0,其余啞變量的系數(shù)代表與參照類相比對因變量的影響多多少(高出的截距)嗅虏。它允許各類之間的影響存在差異洛姑,可以刻畫的情形更多,適用范圍更廣皮服。

高級計(jì)量經(jīng)濟(jì)學(xué)(陳強(qiáng)著 第2版).png

從模型上看楞艾,作為連續(xù)變量處理的模型為
y = \alpha +\beta _{1} X_{1}+ \beta _{2} edu+\epsilon
作為虛擬變量處理的模型為
y = \alpha +\gamma_{i} edu_{i} + \beta _{1} X_{1} +\epsilon
引入虛擬變量的本質(zhì)是對不同類別的子樣本使用不同的截距項(xiàng)(引入虛擬變量的交乘項(xiàng)則是使用不同斜率)。該式子等價(jià)于
y = \left\{ \begin{array}{**lr**} \alpha + \beta _{1} X_{1} +\epsilon, & edu_{1}=1 & \\ \alpha +\gamma_{2} + \beta _{1} X_{1} +\epsilon, & edu_{2}=1\\ \alpha +\gamma_{3} + \beta _{1} X_{1} +\epsilon, & edu_{3}=1\\ \alpha +\gamma_{4} + \beta _{1} X_{1} +\epsilon, & edu_{4}=1\\ \alpha +\gamma_{5} + \beta _{1} X_{1} +\epsilon, & edu_{5}=1\\ \alpha +\gamma_{6} + \beta _{1} X_{1} +\epsilon, & edu_{6}=1\\ \end{array} \right.

回到問題上龄广,在類別變量是有序的硫眯,且編碼間隔為 1, 且已知相鄰類別間對因變量的影響大致相等的情況下择同,作為連續(xù)變量處理的模型估計(jì)出來的系數(shù) \beta_{2} 是不是無偏的两入?此時(shí)的 \beta_{2}\gamma_{i} 有什么關(guān)系?

(親身實(shí)踐表明敲才,確實(shí)會有偏誤裹纳,系數(shù)和 t 統(tǒng)計(jì)量都會偏大(負(fù)數(shù)的話絕對值更小)紧武。在樣本量較小剃氧、類別變量較多的情況下,比如用子樣本回歸阻星,用連續(xù)變量處理會使不顯著的會變?yōu)轱@著她我。另一個(gè)問題是:當(dāng)模型中的啞變量太多,是否會降低系數(shù)的顯著性迫横?)

在通常情況下番舆,虛擬變量往往用作控制變量。如果不關(guān)心 \beta_{2} 的系數(shù)準(zhǔn)確性矾踱,這樣的模型設(shè)定會不會影響核心解釋變量的估計(jì)量 \beta_{1} 的準(zhǔn)確性恨狈?

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市呛讲,隨后出現(xiàn)的幾起案子禾怠,更是在濱河造成了極大的恐慌返奉,老刑警劉巖,帶你破解...
    沈念sama閱讀 212,542評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件吗氏,死亡現(xiàn)場離奇詭異芽偏,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)弦讽,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,596評論 3 385
  • 文/潘曉璐 我一進(jìn)店門污尉,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人往产,你說我怎么就攤上這事被碗。” “怎么了仿村?”我有些...
    開封第一講書人閱讀 158,021評論 0 348
  • 文/不壞的土叔 我叫張陵锐朴,是天一觀的道長。 經(jīng)常有香客問我蔼囊,道長焚志,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,682評論 1 284
  • 正文 為了忘掉前任畏鼓,我火速辦了婚禮娩嚼,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘滴肿。我一直安慰自己岳悟,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,792評論 6 386
  • 文/花漫 我一把揭開白布泼差。 她就那樣靜靜地躺著贵少,像睡著了一般。 火紅的嫁衣襯著肌膚如雪堆缘。 梳的紋絲不亂的頭發(fā)上滔灶,一...
    開封第一講書人閱讀 49,985評論 1 291
  • 那天,我揣著相機(jī)與錄音吼肥,去河邊找鬼录平。 笑死,一個(gè)胖子當(dāng)著我的面吹牛缀皱,可吹牛的內(nèi)容都是我干的斗这。 我是一名探鬼主播,決...
    沈念sama閱讀 39,107評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼啤斗,長吁一口氣:“原來是場噩夢啊……” “哼表箭!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起钮莲,我...
    開封第一講書人閱讀 37,845評論 0 268
  • 序言:老撾萬榮一對情侶失蹤免钻,失蹤者是張志新(化名)和其女友劉穎彼水,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體极舔,經(jīng)...
    沈念sama閱讀 44,299評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡凤覆,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,612評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了拆魏。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片盯桦。...
    茶點(diǎn)故事閱讀 38,747評論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖稽揭,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情肥卡,我是刑警寧澤溪掀,帶...
    沈念sama閱讀 34,441評論 4 333
  • 正文 年R本政府宣布,位于F島的核電站步鉴,受9級特大地震影響揪胃,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜氛琢,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,072評論 3 317
  • 文/蒙蒙 一喊递、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧阳似,春花似錦骚勘、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,828評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至畜吊,卻和暖如春泽疆,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背玲献。 一陣腳步聲響...
    開封第一講書人閱讀 32,069評論 1 267
  • 我被黑心中介騙來泰國打工殉疼, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人捌年。 一個(gè)月前我還...
    沈念sama閱讀 46,545評論 2 362
  • 正文 我出身青樓瓢娜,卻偏偏與公主長得像,于是被迫代替她去往敵國和親礼预。 傳聞我的和親對象是個(gè)殘疾皇子恋腕,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,658評論 2 350

推薦閱讀更多精彩內(nèi)容

  • 2019-02-22,星期五逆瑞,晴在構(gòu)建回歸模型時(shí)荠藤,如果自變量X為連續(xù)性變量伙单,回歸系數(shù)β可以解釋為:在其他自變量不變...
    醫(yī)博云天閱讀 1,752評論 0 2
  • 數(shù)據(jù)預(yù)處理一方面提高數(shù)據(jù)的質(zhì)量,另一方面是要讓數(shù)據(jù)更好的適應(yīng)特定的挖掘工具哈肖。統(tǒng)計(jì)發(fā)現(xiàn)吻育,在數(shù)據(jù)挖掘過程中,數(shù)據(jù)預(yù)處理...
    熊定坤閱讀 4,707評論 0 4
  • “數(shù)據(jù)科學(xué)競賽到底比的是什么宝踪?”這個(gè)問題,問10個(gè)大神碍扔,大概會有9個(gè)人告訴你“特征工程+模型融合”瘩燥。但是翻遍整個(gè)互...
    91160e77b9d6閱讀 757評論 0 1
  • 以前覺得人要經(jīng)常回憶不同, 因?yàn)榛貞浤茏屇悴恢劣谕涀约簭哪睦飦恚?直到遇見一些人厉膀,經(jīng)歷一些事, 改變了回憶二拐, 也改變...
    賤叔叔本尊閱讀 341評論 0 0
  • 你站蝠,當(dāng)你意識到你的存在時(shí),無盡的虛空向你涌來卓鹿。你是一個(gè)點(diǎn)菱魔,也許你是什么不可名狀的東西的造物。 現(xiàn)在你開始創(chuàng)造吟孙,你聽...
    瓏少爺April閱讀 63評論 0 1