一疯趟、多重線性回歸分析簡介
簡單線性回歸分析:自變量X =1 個
多重線性回歸分析:自變量X >=2 個
多元線性回歸分析:因變量Y >=2 個
多重線性回歸模型:
Y=a+b1X1+b2X2+b3X3+b4X4+...+bnXn+E
Y:因變量
a:常數(shù)項炎辨,也就是截距
bn:第n個偏回歸系數(shù)
Xn:第n個自變量
E:隨機(jī)誤差
同樣使用最小二乘法
二返十、多重線性回歸分析的實踐
例子:研究“廣告費用”“客流量”兩個變量對銷售額的影響懈费。
第一步:根據(jù)預(yù)測目標(biāo),確定自變量和因變量
自變量:廣告費用畅厢、客流量
因變量:銷售額
第二步:繪制散點圖业崖,確定回歸模型類型
展示3個變量兩兩之間的是否存在線性關(guān)系,用“矩陣散點圖”
“廣告費用”和“客流量”兩個變量分別對“銷售額”都存在明顯的線性相關(guān)關(guān)系
且我們發(fā)現(xiàn)“廣告費用”和“客流量”之間也存在一定的線性關(guān)系呜师。
第三步:估計模型參數(shù)娶桦,建立線性回歸模型
【統(tǒng)計】
估算值:估計出回歸系數(shù)
模型擬合:輸出調(diào)整后的R方,判定模型擬合度
【選項】
勾選“在方程中包括常量”:輸出常數(shù)項,即截距a
輸入:強(qiáng)制將所選擇的變量納入至回歸模型
步進(jìn):將變量逐個引入模型中并進(jìn)行統(tǒng)計顯著性檢驗衷畦,顯著就留下栗涂,不顯著就剔除,直到?jīng)]有可以剔除的不顯著變量為止祈争。
除去:根據(jù)設(shè)定條件斤程,直接剔除一部分變量
后退:根據(jù)設(shè)定條件,每次剔除一個變量铛嘱,直到不能剔除為止
前進(jìn):根據(jù)設(shè)定條件暖释,每次納入一個自變量,直到無法繼續(xù)納入
最常用的是“輸入”和“步進(jìn)”兩種
第四步:對回歸模型進(jìn)行檢驗
這個表說的是:
自變量為“廣告費用”和“客流量”
因變量為銷售額
采用的方法是“輸入”
因為是“輸入”方法墨吓,強(qiáng)制將所有選擇的變量納入模型中球匕,所以就沒有剔除的變量。
多重線性回歸模型的擬合效果主要看調(diào)整后的R方帖烘,主要用于衡量在多重線性回歸模型建立過程中加入其他自變量后模型擬合效果的變化亮曹。
本例R方是0.691,也就是說“廣告費用”和“客流量”兩個變量合起來能解釋“銷售額“模型變化的69.1%秘症。
顯著性為0<0.01照卦,因此“廣告費用”“客流量”和“銷售額”建立起來的線性關(guān)系具有極其顯著的統(tǒng)計學(xué)意義。
Y=373.767+2.985X1+24.103X2
標(biāo)準(zhǔn)化系數(shù):用來測量自變量對因變量的重要性乡摹。
本例中“廣告費用”“客流量”的標(biāo)準(zhǔn)化系數(shù)分別是0.161和0.734役耕,所以“客流量”對銷售額的影響要大于“廣告費用”對銷售額的影響。
顯著性P:偏回歸系數(shù)b是否具有顯著性聪廉。
b1的P是0.186瞬痘,因此回歸系數(shù)b1具有顯著的統(tǒng)計學(xué)意義。
b2的p的0板熊,因此回歸系數(shù)b2極其顯著的統(tǒng)計學(xué)意義.
第五步:利用回歸模型進(jìn)行預(yù)測
數(shù)據(jù)少時手動
數(shù)據(jù)多時框全,勾選【保存】--預(yù)測值未標(biāo)準(zhǔn)化,生成PRE-1變量自動計算結(jié)果干签。