模型的目標(biāo)是提供數(shù)據(jù)集的簡(jiǎn)單低維摘要撕蔼。 在本書(shū)的上下文中揉忘,我們將使用模型將數(shù)據(jù)劃分為模式和殘差。
關(guān)于殘差部分:http://www.reibang.com/p/c9022affd8b9
關(guān)于一元線性方程擬合:http://www.chinacpda.com/jishu/10692.html
關(guān)于多元線性方程擬合:http://www.reibang.com/p/5ae8abee63aa
模擬數(shù)據(jù)集sim1
> head(sim1)
# A tibble: 6 x 2
x y
<int> <dbl>
1 1 4.20
2 1 7.51
3 1 2.13
4 2 8.99
5 2 10.2
6 2 11.3
sim1
嚴(yán)謹(jǐn)版:這個(gè)數(shù)據(jù)存在一種模式,我們要使用模型來(lái)捕獲這種模式
通俗版:這數(shù)咋都集中在一條斜線附近啊骇扇,看著怎么那么像線性關(guān)系!那就用線性模型來(lái)檢驗(yàn)一下面粮!
coef(lm(y~x少孝,data=sim1))
ggplot(sim1,aes(x,y))+geom_point()+geom_abline(intercept =4.220822,slope = 2.05)
方程
y=ax+b a代表直線斜率 b代表直線截距 擬合就是找到一個(gè)殘差最小的直線
書(shū)中介紹了一種非常普遍的方法,也是講述的是找到最佳模型的過(guò)程熬苍。
閱讀在后邊預(yù)測(cè)的部分其實(shí)你就知道了 這條黑線是預(yù)測(cè)值所連接的一條直線稍走,那么黑點(diǎn)到達(dá)黑線之間的距離就叫做殘差〔竦祝可以使用殘差圖來(lái)表示