1.什么是模型
模型就是對數(shù)據(jù)進(jìn)行的高度概括
其作用是判別數(shù)據(jù)的合理性余素,并對數(shù)據(jù)做預(yù)測豹休。
2.回歸分析
確定兩種或兩種以上變量間相互依賴的定量關(guān)系的一種統(tǒng)計分析方法。
回歸:一組值向均值的回歸桨吊,也可用于一組值向預(yù)測值的回歸威根。
分類:
1)一元線性回歸:自變量為1個,且為直線模型擬合
2)多元線性回歸:自變量為N個视乐,但回歸方程仍為一次方程洛搀,擬合模型為一個平面或超平面
3)非線性回歸:擬合曲線非直線,有部分非線性回歸可以轉(zhuǎn)化為線性求解佑淀,模型成為廣義線性模型
3.線性回歸
自變量和因變量之間建立一個線性關(guān)系模型留美,結(jié)果變量Y為因變量,用來預(yù)測結(jié)果變量的X為自變量。
自變量:研究者主動操縱谎砾,從而引起因變量發(fā)生變化
因變量:被觀測或者記錄的量逢倍,會隨著自變量的變動而變動,因變量必須是一個連續(xù)變量景图。
4.線性回歸模型需滿足的條件
1)線性關(guān)系:自變量和因變量之間存在線性關(guān)系
2)多變量正態(tài)性:所有的變量都滿足正態(tài)分布
3)沒有较雕,或者有一點點多重共線性:自變量相互獨立,殘差的平均值要與其他的自變量獨立
4)沒有自相關(guān):數(shù)據(jù)中沒有或有一點點自相關(guān)
5)常數(shù)方差:同方差性
5.殘差
分析模型合理性的重要指標(biāo)
殘差應(yīng)滿足以下假設(shè)
1)殘差獨立同分布挚币,且無自相關(guān)性
2)殘差和自變量X不相關(guān)
3)殘差的均值為0亮蒋,方差為常數(shù)
6.模型的診斷
1)對假設(shè)的檢驗
殘差應(yīng)滿足:獨立同分布,和自變量X不相關(guān)妆毕,均值為0慎玖,方差為常數(shù)
2)顯著性檢驗
回歸方程顯著性F檢驗,看所有自變量X從整體上對隨機變量Y是否有明顯的影響笛粘。
若 P值<0.05,自變量全體對因變量產(chǎn)生線性影響趁怔。
回歸系數(shù)顯著性t檢驗:看單個自變量對Y是否有明顯影響。
若 P值<0.05,自變量和因變量有顯著的線性關(guān)系闰蛔。
對于一元線性回歸痕钢,以上兩種檢驗是等價的。
3)擬合優(yōu)度
用于檢驗回歸方程對樣本觀測值的擬合程度
樣本決定系數(shù)R2=SSR/SST=1-SSE/SST(R2屬于[0,1])
R2越接近1序六,表明回歸擬合的效果越好
R2越接近0任连,表明回歸擬合的效果越差
7.線性回歸分析步驟
1)根據(jù)預(yù)測目標(biāo),確定自變量和因變量
2)繪制散點圖例诀,確定回歸模型類型
3)估計模型參數(shù)随抠,建立回歸模型
4)對回歸模型進(jìn)行檢驗
5)利用回歸模型進(jìn)行預(yù)測