回歸模型中控制變量的多重共線性問題

1抠刺、什么是多重共線性

多重共線性(multicollinearity, 簡稱collinearity)意味著預(yù)測變量之間高相關(guān)哮肚,這會影響我們在回歸模型中觀察某個預(yù)測變量對結(jié)果變量的單獨(dú)影響害捕。

例如我們想看x1和x2對y的影響腰奋,但是x1和x2高相關(guān)院领,這時x1對y的作用會受到x2影響。

這里可以借用調(diào)節(jié)效應(yīng)來理解跺嗽。在做中介調(diào)節(jié)模型前,我們一般會做一個相關(guān)矩陣页藻,來看看哪些變量之間是高相關(guān)的桨嫁,畢竟只有彼此高相關(guān)的變量才有做調(diào)節(jié)效應(yīng)的價值。當(dāng)然調(diào)節(jié)效應(yīng)的研究假設(shè)和回歸分析不一樣份帐,不可理解為同一回事璃吧,這里只是從數(shù)據(jù)的層面類比了相關(guān)性的情況。

上述x1废境、x2畜挨、y的例子考慮的是數(shù)據(jù)中的多重共線性(data-based multicollinearity)。此外還有結(jié)構(gòu)多重共線性(structrual multicollinearity)彬坏,例如朦促,將x1、x1的平方作為預(yù)測變量栓始,很顯然x1和x1的平方是高相關(guān)的务冕。關(guān)于這一情況,請看references幻赚。

關(guān)于共線性的原理禀忆,Rawlings et al. (1998) 書里有詳細(xì)的描述。

2落恼、為什么會出現(xiàn)多重共線性箩退?

根據(jù)Rawlings et al. (1998, pp. 433-434),有四種可能:

1佳谦、變量的數(shù)學(xué)特性戴涝。例如對x1取平方,然后預(yù)測x1钻蔑、x1的平方對y的影響啥刻。很顯然此時x1、x1的平方是高相關(guān)的咪笑;
2可帽、變量在某一個系統(tǒng)中的屬性。例如某兩個變量在心理學(xué)中就是高相關(guān)的窗怒;
3映跟、糟糕的取樣蓄拣;
4、糟糕的實(shí)驗(yàn)設(shè)計努隙。

1和2對應(yīng)了上述的data-based and structrual collinearity球恤。

3、通過計算VIF來判斷多重共線性

判斷多重共線性的方法是計算每個預(yù)測變量的VIF(variance inflation factor)剃法。

VIF指的是某個變量的引入對模型的系數(shù)的變異(variance)的膨脹程度(inflation)碎捺。

一個變量和越多其它變量高相關(guān),則VIF越高贷洲。

計算方法是去掉第i個變量后收厨,將模型的R方代入公式:VIF_i = 1/(1 - Rsqaure_i)

可以跑一下模型然后按照上述公式手算,這樣能更好理解优构。

4诵叁、引入控制變量時,共線性問題的兩種情況

繼續(xù)用上述x1钦椭、x2拧额、y的例子。假設(shè)我們還有控制變量z1彪腔、z2侥锦、z3。其中德挣,z1的VIF高恭垦,此時可能意味著兩種情況:

(1)z1的高VIF值是因?yàn)閦1和z2、z3高相關(guān)格嗅,則問題不大(也就是控制變量之間的高相關(guān))番挺;

(2)如果z1不僅和z2、z3高相關(guān)屯掖,還和x1玄柏、x2高相關(guān),則會直接影響到x1贴铜、x2的系數(shù)的預(yù)測粪摘,問題比較大。

上述提到的(1)問題不大绍坝,只是相對于(2)而言徘意。但是(1)依然會影響模型中各種系數(shù)的標(biāo)準(zhǔn)誤,包括x1陷嘴、x2的系數(shù)的標(biāo)準(zhǔn)誤(或者說,使slopes的confidence intervals不再狹窄间坐、精確)灾挨,從而間接影響x1邑退、x2對y的效應(yīng)的顯著性。

5劳澄、解決方法

收集更多數(shù)據(jù)地技。

考慮合并變量(例如z1、z2秒拔、z3是父母教育情況莫矗、父母工資、父母社會地位砂缩,則可以考慮用PCA合并成單獨(dú)的變量作谚,叫家庭社會經(jīng)濟(jì)地位)。

考慮刪除部分VIF高的控制變量庵芭,并在文章中進(jìn)行說明妹懒。

如果只出現(xiàn)情況(1),且模型顯著双吆,那么應(yīng)該也可以接受(篇幅允許的話眨唬,可以在文章中進(jìn)行說明,例如討論共線性問題對于結(jié)果揭示的可能影響)好乐。

6匾竿、補(bǔ)充說明

以上的解決方法是我根據(jù)網(wǎng)絡(luò)上搜索的資料得到的。不過Rawlings et al. (1998, p. 457) 給出了更為寬松的策略:只要共線性反映的是變量本身的關(guān)系(但不能是取樣導(dǎo)致的)蔚万,就無所謂岭妖。

仔細(xì)想想,似乎也合理笛坦?如果人為地去處理共線性的問題区转,反倒可能影響了分析過程的客觀性。

References

----------2024.05.24更新----------
根據(jù)Applied Regression Analysis: A Research Tool (2rd edition)一書調(diào)整了內(nèi)容

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末版扩,一起剝皮案震驚了整個濱河市废离,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌礁芦,老刑警劉巖蜻韭,帶你破解...
    沈念sama閱讀 206,839評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異柿扣,居然都是意外死亡肖方,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評論 2 382
  • 文/潘曉璐 我一進(jìn)店門未状,熙熙樓的掌柜王于貴愁眉苦臉地迎上來俯画,“玉大人,你說我怎么就攤上這事司草〖璐梗” “怎么了泡仗?”我有些...
    開封第一講書人閱讀 153,116評論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長猜憎。 經(jīng)常有香客問我娩怎,道長,這世上最難降的妖魔是什么胰柑? 我笑而不...
    開封第一講書人閱讀 55,371評論 1 279
  • 正文 為了忘掉前任截亦,我火速辦了婚禮,結(jié)果婚禮上柬讨,老公的妹妹穿的比我還像新娘崩瓤。我一直安慰自己,他們只是感情好姐浮,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,384評論 5 374
  • 文/花漫 我一把揭開白布谷遂。 她就那樣靜靜地躺著,像睡著了一般卖鲤。 火紅的嫁衣襯著肌膚如雪肾扰。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,111評論 1 285
  • 那天蛋逾,我揣著相機(jī)與錄音集晚,去河邊找鬼。 笑死区匣,一個胖子當(dāng)著我的面吹牛偷拔,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播亏钩,決...
    沈念sama閱讀 38,416評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼莲绰,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了姑丑?” 一聲冷哼從身側(cè)響起蛤签,我...
    開封第一講書人閱讀 37,053評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎栅哀,沒想到半個月后震肮,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,558評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡留拾,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,007評論 2 325
  • 正文 我和宋清朗相戀三年戳晌,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片痴柔。...
    茶點(diǎn)故事閱讀 38,117評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡沦偎,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情豪嚎,我是刑警寧澤鸿捧,帶...
    沈念sama閱讀 33,756評論 4 324
  • 正文 年R本政府宣布,位于F島的核電站疙渣,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏堆巧。R本人自食惡果不足惜妄荔,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,324評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望谍肤。 院中可真熱鬧啦租,春花似錦、人聲如沸荒揣。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽系任。三九已至恳蹲,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間俩滥,已是汗流浹背嘉蕾。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留错忱,地道東北人。 一個月前我還...
    沈念sama閱讀 45,578評論 2 355
  • 正文 我出身青樓挂据,卻偏偏與公主長得像,于是被迫代替她去往敵國和親崎逃。 傳聞我的和親對象是個殘疾皇子掷倔,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,877評論 2 345

推薦閱讀更多精彩內(nèi)容