? 總結
The assumptions? of the linear regression
[喵喵] XanY exit linear relationship(看散點圖進行判斷)
[喵喵]X is not random , or X is uncorrelated with the Error term(x和y的協(xié)方差為0)
[喵喵]the expected value of the Error term? is 0, the variance is constant ( homoskedastic, 否則會有異方差性)
[喵喵]the Error term is uncorrelated across observation (相互之間是獨立的携龟,不然會存在序列相關性)
[喵喵]the Error? term is normal? distribution
? 多元的還要再加上不存在多重共線性
[二哈][二哈][二哈][二哈][二哈]
? measure of fit
R ^ 2和adjusted R ^ 2(多元)
R^ 2= explained sum of squares / total sum of squares ( 表示了自變量對因變量的解釋力度)
(一元回歸,還是相關系數Correlation? Coefficient )(R^ 2是Coefficient of Determination? )
the difference (相關系數衡量的是兩個變量之間的關系货葬,而R ^ 2不表示个束,且可以衡量多個變量)
[攤手]隨著回歸中的變量增加,R ^ 2會增加躬络,并不是因為建立的關系有多符合( the problem is often referred to as Overestimateing the regression )
[攤手]異方差性(heteroskedasticity)
可以分成條件異方差(Error term 隨自變量的變動而變動)和非條件異方差
條件異方差對回歸有影響尖奔,而非條件異方差則無影響
影響? 不影響b1(Coefficient estimates)
? ? ? ? 影響T 檢驗中的標準誤
? ? ? ? 變大? ? 更容易落盡拒絕域 更容易拒絕原假設(null hypothesis )
? ? ? ? ? 變小? ? 則相反
[攤手]serial Correlation (autocorrelation ) 序列相關性
? Error? term 之間相關
? 經常被發(fā)現in time series data
正的 正大大大? 負的? 正小小
[攤手]multicollinearity多重共線性
兩個或兩個以上的independent? variable? are highly correlated With each? others
In practice , a matter of degree rather than of absence or presence
檢驗的方法
假設檢驗? T 檢驗拒絕原假設(存在因變量的系數為0)
? ? ? ? F檢驗
相關系數矩陣? 任何兩個因變量的相關系數absolute? value都>0.7
糾正的方法
去掉多余自變量