2.1.2.5集成模型（回歸）

模型介紹：在“2.1.1.6集成模型（分類）”節(jié)中械馆，曾經探討過集成模型的大致類型和優(yōu)勢朴下。這一節(jié)除了繼續(xù)使用普通隨機森林和提升樹模型的回歸器版本之外，還要補充介紹隨機森林模型的另一個變種：極端隨機森林（Extremely Randomized Trees)洞辣。與普通的隨機森林（Random Forests)模型不同的是阎曹，極端隨機森林在每當構建一棵樹的分裂節(jié)點的時候，不會任意地選取特征纵东；而是先隨機收集一部分特征粘招，然后利用信息熵和基尼不純性等指標挑選最佳的節(jié)點特征。

初始

from sklearn.datasets import load_boston
#從讀取房價數(shù)據(jù)存儲在變量boston中偎球。
boston=load_boston()
#輸出數(shù)據(jù)描述
print(boston.DESCR)

from sklearn.cross_validation import train_test_split
import numpy as np
X=boston.data
y=boston.target
X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.25,random_state=33)

from sklearn.preprocessing import StandardScaler
#分別初始化對特征和目標值的標準化器
ss_X=StandardScaler()
ss_y=StandardScaler()

#分別對訓練和測試數(shù)據(jù)的特征以及目標值進行標準化處理
X_train=ss_X.fit_transform(X_train)
X_test=ss_X.fit_transform(X_test)
y_train=ss_y.fit_transform(y_train)
y_test=ss_y.fit_transform(y_test)

使用三種集成回歸模型對美國波士頓房價訓練數(shù)據(jù)進行學習洒扎，并對測試數(shù)據(jù)進行預測

from sklearn.ensemble import RandomForestRegressor,ExtraTreesRegressor,GradientBoostingRegressor

rfr=RandomForestRegressor()
rfr.fit(X_train,y_train)
rfr_y_predict=rfr.predict(X_test)

etr=ExtraTreesRegressor()
etr.fit(X_train,y_train)
etr_y_predict=etr.predict(X_test)

gbr=GradientBoostingRegressor()
gbr.fit(X_train,y_train)
gbr_y_predict=gbr.predict(X_test)

使用三種集成回歸模型對美國波士頓房價測試數(shù)據(jù)上的回歸預測性能進行評估

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

print('R-squared value of RandomForestRegressor:',rfr.score(X_test,y_test))
print('The mean squared error of RandomForestRegressor:',mean_squared_error(ss_y.inverse_transform(y_test),ss_y.inverse_transform(rfr_y_predict)))
print('The mean absolute error of RandomForestRegressor:',mean_absolute_error(ss_y.inverse_transform(y_test),ss_y.inverse_transform(rfr_y_predict)))

R-squared value of RandomForestRegressor: 0.684410600132
The mean squared error of RandomForestRegressor: 24.471210616
The mean absolute error of RandomForestRegressor: 3.20946957422

print('R-squared value of ExtraTreesRegressor:',etr.score(X_test,y_test))
print('The mean squared error of ExtraTreesRegressor:',mean_squared_error(ss_y.inverse_transform(y_test),ss_y.inverse_transform(etr_y_predict)))
print('The mean absolute error of ExtraTreesRegressor:',mean_absolute_error(ss_y.inverse_transform(y_test),ss_y.inverse_transform(etr_y_predict)))

R-squared value of ExtraTreesRegressor: 0.754540974486
The mean squared error of ExtraTreesRegressor: 19.0332106004
The mean absolute error of ExtraTreesRegressor: 3.01439924608

#利用訓練好的極端回歸森林模型，輸出每種特征對預測目標的貢獻度
print (np.sort(zip(etr.feature_importances_,boston.feature_names),axis=0))

ValueError: axis(=0) out of bounds(待解決)

print('R-squared value of GradientBoostingRegressor:',gbr.score(X_test,y_test))
print('The mean squared error of GradientBoostingRegressor:',mean_squared_error(ss_y.inverse_transform(y_test),ss_y.inverse_transform(gbr_y_predict)))
print('The mean absolute error of GradientBoostingRegressor:',mean_absolute_error(ss_y.inverse_transform(y_test),ss_y.inverse_transform(gbr_y_predict)))

R-squared value of GradientBoostingRegressor: 0.711319266042
The mean squared error of GradientBoostingRegressor: 22.3846778264
The mean absolute error of GradientBoostingRegressor: 2.9415078588

特點分析

許多在業(yè)界從事商業(yè)分析系統(tǒng)開發(fā)和搭建的工作者更加青睞集成模型衰絮，并且經常以這些模型的性能表現(xiàn)為基準袍冷，與新設計的其他模型性能進行比對。雖然這些集成模型在訓練過程中要耗費更多的時間猫牡，但是往往可以提供更高的表現(xiàn)性能和更好的穩(wěn)定性胡诗。

總結

若是對我們在“2.1.2回歸預測”節(jié)所有介紹過的模型在“美國波士頓房價預測”問題上的性能排序比較，也可以發(fā)現(xiàn)使用非線性回歸樹模型淌友，特別是集成模型煌恢，能夠取得更高的性能表現(xiàn)。

最后編輯于：2017.11.21 22:24:41

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者

人面猴
序言：七十年代末震庭，一起剝皮案震驚了整個濱河市瑰抵，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌器联，老刑警劉巖二汛，帶你破解...
沈念sama閱讀 217,509評論 6贊 504
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異拨拓，居然都是意外死亡肴颊，警方通過查閱死者的電腦和手機，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,806評論 3贊 394
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門渣磷，熙熙樓的掌柜王于貴愁眉苦臉地迎上來苫昌，“玉大人，你說我怎么就攤上這事∷钌恚” “怎么了奥务？”我有些...
開封第一講書人閱讀 163,875評論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長袜硫。經常有香客問我氯葬，道長，這世上最難降的妖魔是什么婉陷？我笑而不...
開封第一講書人閱讀 58,441評論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任帚称，我火速辦了婚禮，結果婚禮上秽澳，老公的妹妹穿的比我還像新娘闯睹。我一直安慰自己，他們只是感情好担神，可當我...
茶點故事閱讀 67,488評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布楼吃。她就那樣靜靜地躺著，像睡著了一般妄讯。火紅的嫁衣襯著肌膚如雪孩锡。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 51,365評論 1贊 302
城市分裂傳說
那天亥贸，我揣著相機與錄音躬窜，去河邊找鬼。笑死炕置，一個胖子當著我的面吹牛荣挨，可吹牛的內容都是我干的。我是一名探鬼主播朴摊，決...
沈念sama閱讀 40,190評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼垦沉，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了仍劈？” 一聲冷哼從身側響起，我...
開封第一講書人閱讀 39,062評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤寡壮，失蹤者是張志新（化名）和其女友劉穎贩疙，沒想到半個月后，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體况既，經...
沈念sama閱讀 45,500評論 1贊 314
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡这溅，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 37,706評論 3贊 335
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了棒仍。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片悲靴。...
茶點故事閱讀 39,834評論 1贊 347
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖莫其，靈堂內的尸體忽然破棺而出癞尚，到底是詐尸還是另有隱情耸三，我是刑警寧澤，帶...
沈念sama閱讀 35,559評論 5贊 345
?日本核電站爆炸內幕
正文年R本政府宣布浇揩，位于F島的核電站仪壮，受9級特大地震影響，放射性物質發(fā)生泄漏胳徽。R本人自食惡果不足惜积锅，卻給世界環(huán)境...
茶點故事閱讀 41,167評論 3贊 328
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望养盗。院中可真熱鬧缚陷，春花似錦、人聲如沸往核。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,779評論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽铆铆。三九已至蝶缀，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間薄货，已是汗流浹背翁都。一陣腳步聲響...
開封第一講書人閱讀 32,912評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留谅猾，地道東北人柄慰。一個月前我還...
沈念sama閱讀 47,958評論 2贊 370
代替公主和親
正文我出身青樓，卻偏偏與公主長得像税娜，于是被迫代替她去往敵國和親坐搔。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 44,779評論 2贊 354

2.1.2.5集成模型（回歸）

初始

使用三種集成回歸模型對美國波士頓房價訓練數(shù)據(jù)進行學習洒扎，并對測試數(shù)據(jù)進行預測

使用三種集成回歸模型對美國波士頓房價測試數(shù)據(jù)上的回歸預測性能進行評估

特點分析

總結

推薦閱讀更多精彩內容