線性回歸中的共線性問題

轉(zhuǎn)自:知乎 https://zhuanlan.zhihu.com/p/22907932

突然想到蚌卤,在實際情況中实束,對于回歸模型

不難保證每維特征的獨立性,特征之間難免會存在共線性關(guān)系逊彭,而線性回歸中通常采用的最小二乘法是一種無偏估計咸灿,會對結(jié)果造成偏差

在消除多重共線性的問題的時候,可以利用相關(guān)系數(shù)矩陣和方差擴大因子來進行識別侮叮,可以使用主成分分析(pca)和嶺回歸(ridge)來對多重共線性的問題進行減弱或者消除避矢。

1. 多元回歸的基本假定:

第一:對于擾動項的假設(shè)為正態(tài)性,零均值囊榜,同方差审胸,相互獨立

第二:對自變量的假定,解釋變量是確定型變量卸勺,不存在線性相關(guān)關(guān)系

第三:自變量與擾動項不相關(guān)

2. 數(shù)據(jù)和多重共線性驗證

(一) 如果不存在共線性問題的話砂沛,只用普通的最小二乘法即可

這里需要注意的是,為了提高處理效率和準確率曙求,常常我們會將數(shù)據(jù)標準化處理

比如變成均值為0碍庵,標準差為1的序列,這樣能夠使每個因子得到平等對待


(二)相關(guān)性矩陣

如果各個因子之間存在比較低的正相關(guān)或者負相關(guān)系數(shù)悟狱,但不一定是多重共線性問題静浴,那么問題不嚴重

(三)多重共線

多重共線表示變量之間的線性相關(guān)關(guān)系,多重共線性一般采用反證法

共線性理論證明

(四)方差擴大因子

方差擴大因子其實類似于相關(guān)系數(shù)矩陣挤渐,通過相關(guān)系數(shù)矩陣苹享,我們只能大致看出存不存在多重共線性,但是通過方差擴大因子VIF可以度量多重共線性的嚴重程度挣菲。

經(jīng)驗表明富稻,當VIF>10掷邦,也就是R^2>0.9,就說明xi和其他變量之間有嚴重的多重共線性椭赋,且會影響最小二乘估計量抚岗。

三、解決多重共線性問題

(一)嶺回歸

最小二乘法對于參數(shù)的估計是無偏的哪怔,但是建立在很多基本假設(shè)之上宣蔚,如果我們可以放寬一些條件,對于參數(shù)估計是有偏的认境,那么多重共線性問題就沒有那么嚴重了胚委,損失了無偏性,但是帶來的是高的數(shù)值穩(wěn)定叉信。

當變量之間存在多重共線的時候亩冬,|X^TX|約定于0,矩陣的逆也及其不穩(wěn)定硼身,導(dǎo)致最小二乘法對參數(shù)的估計偏差非常大硅急,矩陣解決奇異性的成都就非常高。這時強制加上一個單位矩陣佳遂,那么矩陣就變得可逆了营袜。

加上懲罰項,正則化

(二)主成分分析

如果因變量的個數(shù)比較多丑罪,彼此很可能存在多重共線性問題荚板,觀測信息有一定程度上的信息重疊,這時希望用較少的幾個綜合變量來代替原來較多的變量吩屹,使得這幾個綜合變量之間彼此不相關(guān)跪另,但是盡可能地包含原有的信息。

pca---假設(shè)數(shù)據(jù)的數(shù)量為N祟峦,因子數(shù)量是n罚斗,首先求解幾個因子的協(xié)方差矩陣(n*n),對協(xié)方差矩陣求解特征值宅楞,特征向量,選出的特征向量最大的p個組成矩陣(n*p)袱吆,再和原本的數(shù)據(jù)做乘法(N*n)


利用調(diào)整后的數(shù)據(jù)進行回歸厌衙。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市绞绒,隨后出現(xiàn)的幾起案子婶希,更是在濱河造成了極大的恐慌,老刑警劉巖蓬衡,帶你破解...
    沈念sama閱讀 216,372評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件喻杈,死亡現(xiàn)場離奇詭異彤枢,居然都是意外死亡,警方通過查閱死者的電腦和手機筒饰,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評論 3 392
  • 文/潘曉璐 我一進店門缴啡,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人瓷们,你說我怎么就攤上這事业栅。” “怎么了谬晕?”我有些...
    開封第一講書人閱讀 162,415評論 0 353
  • 文/不壞的土叔 我叫張陵碘裕,是天一觀的道長。 經(jīng)常有香客問我攒钳,道長帮孔,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,157評論 1 292
  • 正文 為了忘掉前任不撑,我火速辦了婚禮文兢,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘燎孟。我一直安慰自己禽作,他們只是感情好,可當我...
    茶點故事閱讀 67,171評論 6 388
  • 文/花漫 我一把揭開白布揩页。 她就那樣靜靜地躺著旷偿,像睡著了一般。 火紅的嫁衣襯著肌膚如雪爆侣。 梳的紋絲不亂的頭發(fā)上萍程,一...
    開封第一講書人閱讀 51,125評論 1 297
  • 那天,我揣著相機與錄音兔仰,去河邊找鬼茫负。 笑死,一個胖子當著我的面吹牛乎赴,可吹牛的內(nèi)容都是我干的忍法。 我是一名探鬼主播,決...
    沈念sama閱讀 40,028評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼榕吼,長吁一口氣:“原來是場噩夢啊……” “哼饿序!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起羹蚣,我...
    開封第一講書人閱讀 38,887評論 0 274
  • 序言:老撾萬榮一對情侶失蹤原探,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體咽弦,經(jīng)...
    沈念sama閱讀 45,310評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡徒蟆,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,533評論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了型型。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片段审。...
    茶點故事閱讀 39,690評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖输莺,靈堂內(nèi)的尸體忽然破棺而出戚哎,到底是詐尸還是另有隱情,我是刑警寧澤嫂用,帶...
    沈念sama閱讀 35,411評論 5 343
  • 正文 年R本政府宣布型凳,位于F島的核電站,受9級特大地震影響嘱函,放射性物質(zhì)發(fā)生泄漏甘畅。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,004評論 3 325
  • 文/蒙蒙 一往弓、第九天 我趴在偏房一處隱蔽的房頂上張望疏唾。 院中可真熱鬧,春花似錦函似、人聲如沸槐脏。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽顿天。三九已至,卻和暖如春蔑担,著一層夾襖步出監(jiān)牢的瞬間牌废,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評論 1 268
  • 我被黑心中介騙來泰國打工啤握, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留鸟缕,地道東北人。 一個月前我還...
    沈念sama閱讀 47,693評論 2 368
  • 正文 我出身青樓排抬,卻偏偏與公主長得像懂从,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子蹲蒲,可洞房花燭夜當晚...
    茶點故事閱讀 44,577評論 2 353

推薦閱讀更多精彩內(nèi)容