2019-12-28

張靜瑤(浙江海洋大學(xué))歼指,E-mail 1132358871@qq.com


加入控制變量后我的變量符號(hào)變了


1 背景

1.1 問題的引入

兩小兒辯車

  • 王小兒:我發(fā)現(xiàn)車越長(zhǎng)越貴,比如,奧迪 A6L 就比 A4L 貴多;
  • 李小兒:那也未必奶甘,奧迪 R8 只有 4 米 4,但可以買兩輛 A6L了祭椰。 還有臭家,我二爸開的那個(gè)公交車,12 米方淤,才 30 萬钉赁!

在大家做實(shí)證分析的最初階段,經(jīng)常會(huì)有一個(gè)困擾:原本主效應(yīng)很符合預(yù)期目標(biāo)携茂,但加入了一個(gè)或幾個(gè)控制變量后你踩,主效應(yīng)要么符號(hào)變了,要么不顯著了讳苦〈ぃ可是,關(guān)鍵控制變量不加入的話鸳谜,審稿人必然會(huì)提出質(zhì)疑膝藕。這是怎么回事了?
要回答這個(gè)問題卿堂,讓我們先從條件期望說起束莫。

1.2 什么是條件期望

  • 舉例說明

春節(jié)臨近,如何應(yīng)對(duì)親戚的“問候殺”草描,是一個(gè)亟待解決的現(xiàn)實(shí)問題览绿。試想,舉國(guó)歡慶的日子穗慕,大家齊坐一堂饿敲,面對(duì)讀碩讀博歸家的你,七大姑問到:“大閨女逛绵,老大不小了怀各,該干點(diǎn)正事談個(gè)對(duì)象什么的呢,讀那么多書干嘛呀”术浪,你咽了咽口水“讀書好啊瓢对,以后可以多掙錢孝敬您老人家”,話音未落胰苏,八大姑道:“哎呀瞎說硕蛹,你看隔壁二狗子,高中沒讀完去做生意,現(xiàn)在賺老多錢了”….氣氛頓時(shí)尷尬了法焰,除了咽口水外秧荆,該怎么“杠”回去…

那就要了解條件期望的概念了:條件期望函數(shù)記為 E(Y_i|X_i),是關(guān)于 X_i 的函數(shù)埃仪,考慮到 X_i 是隨機(jī)的乙濒,所以條件期望函數(shù)也是隨機(jī)的。比如給定 X 為受教育水平的一個(gè)定值卵蛉,如 X=12颁股,那么 E(Y_i|X_i=12) 就是表示所有讀 12 年書的個(gè)體,其收入水平的期望值傻丝。

  • 用圖說明

圖中豌蟋,橫軸表示受教育水平,縱軸則為收入桑滩,在每一個(gè)給定的受教育水平下(如:受教育年限 12 年),收入服從一個(gè)近似正態(tài)的隨機(jī)分布允睹≡俗迹可以看到,由于存在著無法忽視的個(gè)體差異缭受,使得某些低教育者的收入要高于某些高教育者的收入胁澳,但通常而言,教育水平高的人賺的更多米者。

看到這里韭畸,學(xué)習(xí)過初級(jí)計(jì)量經(jīng)濟(jì)學(xué)的同學(xué)肯定會(huì)想到,對(duì)蔓搞,是“個(gè)人能力”的影響胰丁,是“個(gè)人能力”讓二狗子和大閨女產(chǎn)生了收入的差異。確實(shí)如此喂分,那么“個(gè)人能力”便是一個(gè)需要控制的重要變量锦庸。

2 Stata 實(shí)操

2.1 回到原例

讓我們回到“小兒辯車”的引子。調(diào)入官方自帶的汽車數(shù)據(jù)蒲祈,研究汽車長(zhǎng)度 length 對(duì)汽車價(jià)格 price 的影響甘萧。在多元回歸中,加入的控制變量分別為里程數(shù) mpg 和汽車重量 weight

  • 利用 reganat 命令對(duì)多元回歸模型進(jìn)行圖解檢驗(yàn)
. sysuse "auto.dta", clear
. cap eststo clear
. eststo: reg price length
. eststo: reg price length mpg weight
. esttab, nogap 
. reganat price length mpg weight, dis(length) ///
.              biscat biline scheme(s2color)  

虛線擬合線表示了不加入控制變量時(shí) length 的影響梆掸,而實(shí)線是加入控制變量之后的扬卷。由之初的右上傾斜變?yōu)橛蚁聝A斜,這是一個(gè)本質(zhì)性地改變酸钦。

  • 回歸結(jié)果
--------------------------------------------
                      (1)             (2)   
                    price           price   
--------------------------------------------
length              57.20***       -104.9** 
                   (4.06)         (-2.64)   
mpg                                -86.79   
                                  (-1.03)   
weight                              4.365***
                                   (3.74)   
_cons             -4584.9*        14542.4** 
                  (-1.72)          (2.47)   
--------------------------------------------
N                      74              74   
--------------------------------------------
t statistics in parentheses
* p<0.1, ** p<0.05, *** p<0.01

對(duì)比 length 的系數(shù)可見怪得,在一元回歸時(shí)該系數(shù)顯著為正(57.2),而加入控制變量后,系數(shù)為負(fù)(-104.9)并在 10% 的水平下顯著汇恤。

  • 原因分析

若真實(shí)的回歸模型為 Y_i=\alpha_1+\beta_1x_1+\beta_2x_2+\xi_1① 庞钢,若此時(shí)將 x_2 的“貢獻(xiàn)”剔除掉之后,得到的回歸模型是 Y_i=\alpha_2+\theta_1x_1+\xi_2② 因谎,此時(shí)的 \xi_2=\beta_2x_2+\xi_1 基括,因此 corr(x_1,\xi_2) \neq 0,出現(xiàn)了內(nèi)生性問題财岔。

此時(shí)风皿,若對(duì)②式進(jìn)行回歸,我們可以得到一個(gè) x_1 的系數(shù)值匠璧,但是再加入 x_2 后桐款,即再對(duì)①式進(jìn)行回歸,我們發(fā)現(xiàn)系數(shù) x_1 的系數(shù)值變了 夷恍,其原因就是出現(xiàn)了我們上述所討論的問題魔眨。

2.2 通過實(shí)例演示

先進(jìn)行正常的多元回歸,加入主效應(yīng)變量 length 和控制變量 mpg weight

  • sysuse auto.dta, clear
  • reg price length mpg weight
  • est store m1

接著酿雪,我們利用解構(gòu)回歸(regression anatomy)(參考《基本無害的計(jì)量經(jīng)濟(jì)學(xué)》)來“解讀”正常的多元回歸:1.先用 length 對(duì)控制變量 mpg weight 進(jìn)行回歸遏暴,然后可以得到一個(gè)殘差項(xiàng)。2. 再用被解釋變量對(duì)上一步的殘差項(xiàng)進(jìn)行回歸指黎。

. reg length mpg weight
. predict e, res
. reg price e
. est store m2
. esttab m1 m2 , nogap.  
  • 估計(jì)結(jié)果
--------------------------------------------
                      (1)             (2)   
                    price           price   
--------------------------------------------
length          -104.9***       
                 (-2.64)        
mpg              -86.79                 
                  (-1.03)   
weight            4.365***
                  (3.74)   
e                                     -104.9*
                                      (-2.22)  
_cons           14542.4*              6165.3***
                (2.47)                (18.46)   
--------------------------------------------
N                      74              74   
--------------------------------------------
t statistics in parentheses
* p<0.1, ** p<0.05, *** p<0.01

可以看到朋凉,最后得到的主效應(yīng)估計(jì)結(jié)果一致,均為 -104.9 醋安。在用 length 對(duì)控制變量 mpg weight 回歸后得到的殘差項(xiàng)杂彭,表示 length 剔除了其他解釋變量對(duì)自己的影響的“結(jié)果”,將其再與被解釋變量的回歸就是一個(gè)“凈”的效應(yīng)吓揪。

3 總結(jié)

可見亲怠,加入控制變量后,我們關(guān)心的估計(jì)系數(shù)是否會(huì)產(chǎn)生變化磺芭,取決于與控制變量之間的獨(dú)立性赁炎。

我們列出將會(huì)出現(xiàn)的四種情形

  • 與控制變量之間完全獨(dú)立,則加入控制變量對(duì)估計(jì)系數(shù)無影響(情形 1)
  • 與控制變量之間高度相關(guān)钾腺,則加入控制變量與的估計(jì)系數(shù)都不顯著(情形 2)
  • 與控制變量之間相關(guān)徙垫,且完全通過控制變量的“途徑”來影響被解釋變量,則估計(jì)系數(shù)不顯著(情形 3)
  • 與控制變量之間相關(guān)放棒,則加入控制變量后姻报,主要解釋變量的估計(jì)系數(shù)會(huì)出現(xiàn)大小和符號(hào)變化。具體變化取決于與控制變量間的正負(fù)相關(guān)性间螟。(情形4)
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末吴旋,一起剝皮案震驚了整個(gè)濱河市损肛,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌荣瑟,老刑警劉巖治拿,帶你破解...
    沈念sama閱讀 217,826評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異笆焰,居然都是意外死亡劫谅,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,968評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門嚷掠,熙熙樓的掌柜王于貴愁眉苦臉地迎上來捏检,“玉大人,你說我怎么就攤上這事不皆」岢牵” “怎么了?”我有些...
    開封第一講書人閱讀 164,234評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵霹娄,是天一觀的道長(zhǎng)能犯。 經(jīng)常有香客問我,道長(zhǎng)犬耻,這世上最難降的妖魔是什么悲雳? 我笑而不...
    開封第一講書人閱讀 58,562評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮香追,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘坦胶。我一直安慰自己透典,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,611評(píng)論 6 392
  • 文/花漫 我一把揭開白布顿苇。 她就那樣靜靜地躺著峭咒,像睡著了一般。 火紅的嫁衣襯著肌膚如雪纪岁。 梳的紋絲不亂的頭發(fā)上凑队,一...
    開封第一講書人閱讀 51,482評(píng)論 1 302
  • 那天,我揣著相機(jī)與錄音幔翰,去河邊找鬼漩氨。 笑死,一個(gè)胖子當(dāng)著我的面吹牛遗增,可吹牛的內(nèi)容都是我干的叫惊。 我是一名探鬼主播,決...
    沈念sama閱讀 40,271評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼做修,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼霍狰!你這毒婦竟也來了抡草?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,166評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤蔗坯,失蹤者是張志新(化名)和其女友劉穎康震,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體宾濒,經(jīng)...
    沈念sama閱讀 45,608評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡腿短,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,814評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了鼎兽。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片答姥。...
    茶點(diǎn)故事閱讀 39,926評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖谚咬,靈堂內(nèi)的尸體忽然破棺而出鹦付,到底是詐尸還是另有隱情,我是刑警寧澤择卦,帶...
    沈念sama閱讀 35,644評(píng)論 5 346
  • 正文 年R本政府宣布敲长,位于F島的核電站,受9級(jí)特大地震影響秉继,放射性物質(zhì)發(fā)生泄漏祈噪。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,249評(píng)論 3 329
  • 文/蒙蒙 一尚辑、第九天 我趴在偏房一處隱蔽的房頂上張望辑鲤。 院中可真熱鬧,春花似錦杠茬、人聲如沸月褥。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,866評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽宁赤。三九已至,卻和暖如春栓票,著一層夾襖步出監(jiān)牢的瞬間决左,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,991評(píng)論 1 269
  • 我被黑心中介騙來泰國(guó)打工走贪, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留佛猛,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,063評(píng)論 3 370
  • 正文 我出身青樓坠狡,卻偏偏與公主長(zhǎng)得像挚躯,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子擦秽,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,871評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容

  • 張靜瑤(浙江海洋大學(xué))码荔,1132358871@qq.com 加入控制變量后我的變量符號(hào)變了 1 背景 1.1 問題...
    張靜瑤a閱讀 1,219評(píng)論 0 0
  • 張靜瑤(浙江海洋大學(xué))漩勤,E-mail 1132358871@qq.com 加入控制變量后我的變量符號(hào)變了 1 背景...
    張靜瑤a閱讀 148評(píng)論 0 0
  • kafka安裝準(zhǔn)備工作 安裝java環(huán)境 搭建zookeeper集群 搭建kafka集群 1. 準(zhǔn)備工作 1.1 ...
    hcyaidi閱讀 170評(píng)論 0 0
  • 牢騷: 轉(zhuǎn)載記得注明出處哦:http://www.reibang.com/p/f289aea6f981 tcp在...
    zhbd閱讀 921評(píng)論 0 2