data(snake); //引入數(shù)據(jù)集
dim(snake);//查看數(shù)據(jù)集的維度
str(snake);//查看數(shù)據(jù)集詳情也物,head,tail,mean,max,min...
names(snake) <- c("content","yield");//為數(shù)據(jù)集的每列設(shè)置別名
attach(snake);//執(zhí)行后可直接使用數(shù)據(jù)集別名
cor(snake);//查看數(shù)據(jù)集每列的相關(guān)性系數(shù)
cov(snake);//查看數(shù)據(jù)集每列的協(xié)方差
plot(snake);//查看數(shù)據(jù)分布情況
yield.fit <- lm(yield~content);//執(zhí)行一元線性回歸
yield.fit;//查看線性回歸結(jié)果
plot(yield.fit);//查看線性回歸結(jié)果
summary(yield.fit);//查看線性回歸匯總
上圖中父泳,Intercept指截距笼踩,content指系數(shù)超全,即模型結(jié)果是yield=0.4981*content+0.7254
上面是線性回歸模型的匯總結(jié)果哩掺,重點(diǎn)關(guān)注劃線的幾個(gè)地方垄懂,解釋如下:
1.Residuals是指模型殘差虚汛,原則上應(yīng)該符合正態(tài)分布围来,1Q應(yīng)該與3Q差不多
2.Pr(>|t|用于描述系數(shù)顯著性跺涤,越小越好,一般應(yīng)小于0.05监透,約小說明模型系數(shù)越有效
3.Adjusted R-squared:說明模型擬合程度桶错,越大說明擬合的越好,原則上應(yīng)大于0.80
4.F統(tǒng)計(jì)的p-value也是描述模型顯著性胀蛮,越小越好院刁,應(yīng)低于0.05
同時(shí)滿足上面幾個(gè)條件可以說明,這個(gè)結(jié)論是可以接受的粪狼。