擬合多重線性回歸模型

2019/3/24-星期日-陰晴天

好多天沒有看這本spss高級教程了盼理,今天大致看了一下回歸模型章節(jié)的第一部分裆甩。做一下相關(guān)的記錄姐叁。

一铺董、相關(guān)概念

多重線性回歸進(jìn)行統(tǒng)計(jì)分析時(shí)需要滿足以下條件:

①自變量與因變量之間存在線性關(guān)系,這個(gè)可以通過繪制“散點(diǎn)矩陣”反映棱貌。

②各觀測間相互獨(dú)立玖媚,即任意兩個(gè)觀測殘差的協(xié)方差為0;

③殘差e_{i} 服從正態(tài)分布N(0键畴,\sigma ^2 )最盅。其方差=\sigma ^2 = var(e_{i} )反映了回歸模型的精度突雪,\sigma 越小起惕,所得到的回歸模型預(yù)測y的精確度越高。

e_{i} 的大小不隨所有變量取值水平的變化而變化咏删。即方差齊次性惹想。

順便提一下總平方和、回歸平方和督函、殘差平方和的區(qū)別嘀粱。

二、實(shí)例問題

某專門面向年輕人制作肖像的公司計(jì)劃在國內(nèi)開設(shè)幾家分店辰狡,收集了目前已開設(shè)分店的銷售數(shù)據(jù)(y,萬元)及分店所在城市的16歲一下人數(shù)(x1,萬人)锋叨,人均可支配收入(x2,元)。數(shù)據(jù)reg.sav宛篇。鏈接:https://pan.baidu.com/s/12Vk-7HAyeqNbtMMfoDG0Rw 提取碼:o7hs娃磺。

1、對數(shù)據(jù)的初步分析叫倍,問題中可知有兩個(gè)自變量x1,x2以及一個(gè)反應(yīng)變量y偷卧。所以問題是如何同時(shí)考慮x1,x2多個(gè)因素對同一結(jié)果y的影響。

圖1


圖2
圖3
圖4

從結(jié)果給出了回歸模型的常數(shù)項(xiàng)吆倦、16歲一下年輕人人數(shù)听诸、人均可支配收入的偏回歸系數(shù),分別為-6.886蚕泽、1.455晌梨、0.009。

回歸模型y=-6.886+1.455x_{1}+0.009x_{2}

回歸模型的假設(shè)檢驗(yàn)

首先要考察模型中的自變量與因變量之間時(shí)是否存在線性關(guān)系须妻,也就是檢驗(yàn)各自變量的回歸系數(shù)是否均為0仔蝌,此處采用方差分析的基本思想進(jìn)行判斷。

建立假設(shè):

H_{0}:\beta _{1}=\beta_{2}=...=\beta_{p}=0

H_{1}:各\beta_{i}不等于0或不全等于0

反應(yīng)變量y的總變異為總平方和璧南,表示為SS_{total}=\sum\nolimits_{a}^b (y_{i}-\bar{y} ), 表示反應(yīng)變量所有的變異掌逛。它由下面兩部分組成。

①回歸平方和,SSR表示反應(yīng)變量的變異中由回歸模型中所包含的p個(gè)自變量所能解釋的部分司倚。

②誤差平方和SSE豆混,表示反因變量的變異中沒有被回歸模型中所包含的變量解釋部分篓像。

SS_{total}=SSR+SSE

圖5

上圖輸出的是對模型中所有自變量的回歸系數(shù)等于0的F檢驗(yàn)結(jié)果。F=99.103皿伺、P值<0.01,說明至少有一個(gè)自變量的回歸系數(shù)不為0员辩,所建立的回歸模型是有統(tǒng)計(jì)學(xué)意義的。

偏回歸系數(shù)的假設(shè)檢驗(yàn)

在得到整個(gè)回歸模型有統(tǒng)計(jì)學(xué)意義以后鸵鸥,還需要具體檢驗(yàn)?zāi)硞€(gè)自變量x_{i}與反應(yīng)變量之間是否存在線性關(guān)系奠滑,就是對其偏回歸系數(shù)b_{i}是否等于0進(jìn)行統(tǒng)計(jì)學(xué)檢驗(yàn)。通扯恃ǎ可以用t檢驗(yàn)來回答這個(gè)問題宋税。

t=((b_{i}-0)/s_{b_{i}})

b_{i}是第i個(gè)自變量x_{i}的偏回歸系數(shù),S_{bi}是其標(biāo)準(zhǔn)誤讼油。

下圖可以看出x1杰赛、x2的偏回歸系數(shù)是否等于0的t檢驗(yàn)結(jié)果,t值分別等于6.868(=1.455/0.212)和2.305(=0.009/0.004),P值<0.01矮台、P=0.33乏屯。按\alpha =0.05 水平,認(rèn)為\beta _{1}瘦赫、 \beta _{2} 全不為0辰晕。

圖6

標(biāo)準(zhǔn)化偏回歸系數(shù)

標(biāo)準(zhǔn)化回歸系數(shù)一般出自對模型中自變量(x_{1},x_{2},···,x_{p})對y的貢獻(xiàn)大小進(jìn)行比較,以消除原始變量單位不同及量綱不同的影響确虱。而實(shí)際上含友,計(jì)算標(biāo)準(zhǔn)偏回歸系數(shù)還可以減少在擬合回歸模型計(jì)算求解時(shí)的截?cái)嗾`差,從而提高模型的擬合精度蝉娜。首先對原始變量按一下公式進(jìn)行標(biāo)準(zhǔn)化唱较。

圖7

從圖中可以看出16歲一下年輕人人數(shù)的標(biāo)準(zhǔn)化偏回歸系數(shù)為0.748,支配收入的標(biāo)準(zhǔn)化偏回歸系數(shù)為0.251召川,年輕人人數(shù)對銷售收入的影響大南缓。

注意偏回歸系數(shù)大的自變量其標(biāo)準(zhǔn)化回歸系數(shù)可能大,也有可能小荧呐。

衡量多元線性回歸模型優(yōu)劣的標(biāo)準(zhǔn)

當(dāng)供建立回歸模型的自變量有p個(gè)時(shí)汉形,僅考慮各因素的主效應(yīng),可以建立2^p 個(gè)模型倍阐。如何來衡量這些模型的好壞概疆?常用有一下標(biāo)準(zhǔn):

圖8

1、復(fù)利相關(guān)系數(shù)R

表示模型中所有自變量與反應(yīng)變量之間線性回歸的密切程度大小峰搪,實(shí)際上它是y_{i}與其估計(jì)值的簡單相關(guān)系數(shù)岔冀。例子中R=0.957;但是需要注意的是多元相關(guān)系數(shù)R值多大才算好概耻,沒有一個(gè)統(tǒng)一的標(biāo)準(zhǔn)使套。

2罐呼、決定系數(shù)R^2

模型的決定系數(shù)等于復(fù)相關(guān)系數(shù)的平方。它表示反應(yīng)變量y的總變異中可由回歸模型中自變量解釋的部分所占的比例侦高,是衡量所建立模型效果好壞的指標(biāo)之一嫉柴。

圖9

3、校正的決定系數(shù)R_{adj}^2

由于用R^2評價(jià)擬合模型的好壞具有一定的局限性奉呛,即使是向模型中增加的變量沒有統(tǒng)計(jì)學(xué)意義计螺,R^2值仍會增大。因此需要校正瞧壮,從而形成校正的決定系數(shù):

圖10

4登馒、剩余標(biāo)準(zhǔn)差S_{y,x_{1},x_{2},x_{3}...,x_{p}}

Std它等于誤差均方MSE的算術(shù)平方根,就是殘差之標(biāo)準(zhǔn)差馁痴,其大小反應(yīng)了用建立的模型預(yù)測因變量時(shí)的精度谊娇。剩余標(biāo)準(zhǔn)差越小肺孤,建立的模型效果就越好罗晕。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市赠堵,隨后出現(xiàn)的幾起案子小渊,更是在濱河造成了極大的恐慌,老刑警劉巖茫叭,帶你破解...
    沈念sama閱讀 206,968評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件酬屉,死亡現(xiàn)場離奇詭異,居然都是意外死亡揍愁,警方通過查閱死者的電腦和手機(jī)呐萨,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,601評論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來莽囤,“玉大人谬擦,你說我怎么就攤上這事⌒喽校” “怎么了惨远?”我有些...
    開封第一講書人閱讀 153,220評論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長话肖。 經(jīng)常有香客問我北秽,道長,這世上最難降的妖魔是什么最筒? 我笑而不...
    開封第一講書人閱讀 55,416評論 1 279
  • 正文 為了忘掉前任贺氓,我火速辦了婚禮,結(jié)果婚禮上床蜘,老公的妹妹穿的比我還像新娘辙培。我一直安慰自己缅叠,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,425評論 5 374
  • 文/花漫 我一把揭開白布虏冻。 她就那樣靜靜地躺著肤粱,像睡著了一般。 火紅的嫁衣襯著肌膚如雪厨相。 梳的紋絲不亂的頭發(fā)上领曼,一...
    開封第一講書人閱讀 49,144評論 1 285
  • 那天,我揣著相機(jī)與錄音蛮穿,去河邊找鬼庶骄。 笑死,一個(gè)胖子當(dāng)著我的面吹牛践磅,可吹牛的內(nèi)容都是我干的单刁。 我是一名探鬼主播,決...
    沈念sama閱讀 38,432評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼府适,長吁一口氣:“原來是場噩夢啊……” “哼羔飞!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起檐春,我...
    開封第一講書人閱讀 37,088評論 0 261
  • 序言:老撾萬榮一對情侶失蹤逻淌,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后疟暖,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體卡儒,經(jīng)...
    沈念sama閱讀 43,586評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,028評論 2 325
  • 正文 我和宋清朗相戀三年俐巴,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了骨望。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,137評論 1 334
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡欣舵,死狀恐怖擎鸠,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情邻遏,我是刑警寧澤糠亩,帶...
    沈念sama閱讀 33,783評論 4 324
  • 正文 年R本政府宣布,位于F島的核電站准验,受9級特大地震影響赎线,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜糊饱,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,343評論 3 307
  • 文/蒙蒙 一垂寥、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦滞项、人聲如沸狭归。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,333評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽过椎。三九已至,卻和暖如春戏仓,著一層夾襖步出監(jiān)牢的瞬間疚宇,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,559評論 1 262
  • 我被黑心中介騙來泰國打工赏殃, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留敷待,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,595評論 2 355
  • 正文 我出身青樓仁热,卻偏偏與公主長得像榜揖,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子抗蠢,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,901評論 2 345