海藻竭讳!海藻创葡!—R實(shí)戰(zhàn)案例一(中)

上半部分:海藻!海藻绢慢!—R實(shí)戰(zhàn)案例一(上)
本案例的目的是預(yù)測140個水樣中7種海藻的出現(xiàn)頻率灿渴,這部分是用多元線性回歸模型和回歸樹模型分別進(jìn)行預(yù)測。
首先進(jìn)行多遠(yuǎn)線性回歸胰舆,該模型給出一個有關(guān)目標(biāo)變量骚露,和解釋變量關(guān)系的線性函數(shù)

#預(yù)測海藻a1出現(xiàn)的頻率,.代表數(shù)據(jù)框中除了a1外的變量缚窿。
lm.a1<-lm(a1~.,data=clean.algae[,1:12])
summary(lm.a1)

該模型解釋的方差比例(R-squared)表明模型與數(shù)據(jù)的吻合度棘幸。越接近于1越好。此處為0.322倦零,還不是很理想误续,所以需要精簡回歸模型。
首先用anova函數(shù)提供模型擬合的方差序貫分析扫茅。

anova(lm.a1)

從圖中可見女嘲,season對減少模型擬合誤差的貢獻(xiàn)最小,將其刪除诞帐。然后再做一次線性回歸模型欣尼。

lm2.a1<-update(lm.a1,.~.-season)
summary(lm2.a1)
anova(lm.a1,lm2.a1)

此處結(jié)果略,R平方是0.328停蕉,還是不理想愕鼓。所以繼續(xù)用anova對兩個模型進(jìn)行正式的比較,使用兩個模型作為參數(shù)慧起。

盡管誤差平方和減少了(-449)菇晃,但顯著性只有0.695,說明兩個模型不同的可能性為30%蚓挤,應(yīng)該再次消元磺送。使用step向后消元法驻子。

final.lm<-step(lm.a1)
summary(final.lm)
2.png

最后的R平方仍然不理想,說明在此案例估灿,應(yīng)用線性模型并不合適崇呵。


接下來運(yùn)用另一種模型算法:回歸樹來預(yù)測∠谠回歸樹是對某些解釋變量分層次的邏輯測試域慷,基于樹的模型自動篩選相關(guān)的變量。

library(rpart)
rt.a1<-rpart(a1~.,data=algae[,1:12])
rt.a1
prettyTree(rt.a1)

prettyTree主要是可視化汗销,圖形如下:


此外犹褒,可以用復(fù)雜度損失修剪的方法,估計(jì)樹節(jié)點(diǎn)的參數(shù)值cp弛针,以達(dá)到預(yù)測的準(zhǔn)確性和樹大小的折中叠骑。然后利用prune來剪枝。(這里我不是很理解削茁,先這么看著吧)

printcp(rt.a1)
rt2.a1<-prune(rt.a1,cp=0.08)
rt2.a1

rpartXse函數(shù)是可以自動運(yùn)行這個過程座云,但是得到的圖形很奇怪。(下右圖)

rt.a1<-rpartXse(a1~.,data=algae[,1:12])
用rpartXse做出的回歸樹

snip.rpart函數(shù)是交互的對樹進(jìn)行修剪(結(jié)果上左圖)

first.tree<-rpart(a1~.,data=algae[,1:12])
snip.rpart(first.tree,c(4,7))

或者采用直接點(diǎn)擊的方式修剪付材。(不過好像點(diǎn)擊了也沒有什么變化...)

prettyTree(first.tree)
snip.rpart(first.tree)

簡而言之朦拖,這部分主要講了線性和回歸樹,回歸樹那里常用的語句還是rpart厌衔¤档郏看其他案例,大多數(shù)也只用rpart富寿。雖然語句很簡單睬隶,也幾乎不用輸入?yún)?shù),但內(nèi)中含義很復(fù)雜啊页徐。
最后一部分講模型的評價和選擇~~~

第二部分完整代碼如下苏潜,不好用的語句我直接廢掉了:

#線性模型
lm.a1<-lm(a1~.,data=clean.algae[,1:12])
summary(lm.a1)
anova(lm.a1)

lm2.a1<-update(lm.a1,.~.-season)
summary(lm2.a1)
anova(lm.a1,lm2.a1)

final.lm<-step(lm.a1)
summary(final.lm)

#回歸樹
library(rpart)
rt.a1<-rpart(a1~.,data=algae[,1:12])
rt.a1
prettyTree(rt.a1)
printcp(rt.a1)

rt2.a1<-prune(rt.a1,cp=0.08)
rt2.a1

#rt.a1<-rpartXse(a1~.,data=algae[,1:12])

first.tree<-rpart(a1~.,data=algae[,1:12])
snip.rpart(first.tree,c(4,7))

#prettyTree(first.tree)
#snip.rpart(first.tree)
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市变勇,隨后出現(xiàn)的幾起案子恤左,更是在濱河造成了極大的恐慌,老刑警劉巖搀绣,帶你破解...
    沈念sama閱讀 212,454評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件飞袋,死亡現(xiàn)場離奇詭異,居然都是意外死亡链患,警方通過查閱死者的電腦和手機(jī)巧鸭,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,553評論 3 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來麻捻,“玉大人纲仍,你說我怎么就攤上這事呀袱。” “怎么了郑叠?”我有些...
    開封第一講書人閱讀 157,921評論 0 348
  • 文/不壞的土叔 我叫張陵夜赵,是天一觀的道長。 經(jīng)常有香客問我锻拘,道長,這世上最難降的妖魔是什么击蹲? 我笑而不...
    開封第一講書人閱讀 56,648評論 1 284
  • 正文 為了忘掉前任署拟,我火速辦了婚禮,結(jié)果婚禮上歌豺,老公的妹妹穿的比我還像新娘推穷。我一直安慰自己,他們只是感情好类咧,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,770評論 6 386
  • 文/花漫 我一把揭開白布馒铃。 她就那樣靜靜地躺著,像睡著了一般痕惋。 火紅的嫁衣襯著肌膚如雪区宇。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,950評論 1 291
  • 那天值戳,我揣著相機(jī)與錄音议谷,去河邊找鬼。 笑死堕虹,一個胖子當(dāng)著我的面吹牛卧晓,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播赴捞,決...
    沈念sama閱讀 39,090評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼逼裆,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了赦政?” 一聲冷哼從身側(cè)響起胜宇,我...
    開封第一講書人閱讀 37,817評論 0 268
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎恢着,沒想到半個月后掸屡,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,275評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡然评,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,592評論 2 327
  • 正文 我和宋清朗相戀三年仅财,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片碗淌。...
    茶點(diǎn)故事閱讀 38,724評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡盏求,死狀恐怖抖锥,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情碎罚,我是刑警寧澤磅废,帶...
    沈念sama閱讀 34,409評論 4 333
  • 正文 年R本政府宣布,位于F島的核電站荆烈,受9級特大地震影響拯勉,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜憔购,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,052評論 3 316
  • 文/蒙蒙 一宫峦、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧玫鸟,春花似錦导绷、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,815評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至钦购,卻和暖如春檐盟,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背押桃。 一陣腳步聲響...
    開封第一講書人閱讀 32,043評論 1 266
  • 我被黑心中介騙來泰國打工遵堵, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人怨规。 一個月前我還...
    沈念sama閱讀 46,503評論 2 361
  • 正文 我出身青樓陌宿,卻偏偏與公主長得像,于是被迫代替她去往敵國和親波丰。 傳聞我的和親對象是個殘疾皇子壳坪,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,627評論 2 350

推薦閱讀更多精彩內(nèi)容