2.1.2.5集成模型(回歸)

模型介紹:在“2.1.1.6集成模型(分類)”節(jié)中械馆,曾經探討過集成模型的大致類型和優(yōu)勢朴下。這一節(jié)除了繼續(xù)使用普通隨機森林和提升樹模型的回歸器版本之外,還要補充介紹隨機森林模型的另一個變種:極端隨機森林(Extremely Randomized Trees)洞辣。與普通的隨機森林(Random Forests)模型不同的是阎曹,極端隨機森林在每當構建一棵樹的分裂節(jié)點的時候,不會任意地選取特征纵东;而是先隨機收集一部分特征粘招,然后利用信息熵和基尼不純性等指標挑選最佳的節(jié)點特征。

初始
from sklearn.datasets import load_boston
#從讀取房價數(shù)據(jù)存儲在變量boston中偎球。
boston=load_boston()
#輸出數(shù)據(jù)描述
print(boston.DESCR)

from sklearn.cross_validation import train_test_split
import numpy as np
X=boston.data
y=boston.target
X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.25,random_state=33)

from sklearn.preprocessing import StandardScaler
#分別初始化對特征和目標值的標準化器
ss_X=StandardScaler()
ss_y=StandardScaler()

#分別對訓練和測試數(shù)據(jù)的特征以及目標值進行標準化處理
X_train=ss_X.fit_transform(X_train)
X_test=ss_X.fit_transform(X_test)
y_train=ss_y.fit_transform(y_train)
y_test=ss_y.fit_transform(y_test)
使用三種集成回歸模型對美國波士頓房價訓練數(shù)據(jù)進行學習洒扎,并對測試數(shù)據(jù)進行預測
from sklearn.ensemble import RandomForestRegressor,ExtraTreesRegressor,GradientBoostingRegressor

rfr=RandomForestRegressor()
rfr.fit(X_train,y_train)
rfr_y_predict=rfr.predict(X_test)

etr=ExtraTreesRegressor()
etr.fit(X_train,y_train)
etr_y_predict=etr.predict(X_test)

gbr=GradientBoostingRegressor()
gbr.fit(X_train,y_train)
gbr_y_predict=gbr.predict(X_test)
使用三種集成回歸模型對美國波士頓房價測試數(shù)據(jù)上的回歸預測性能進行評估
from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

print('R-squared value of RandomForestRegressor:',rfr.score(X_test,y_test))
print('The mean squared error of RandomForestRegressor:',mean_squared_error(ss_y.inverse_transform(y_test),ss_y.inverse_transform(rfr_y_predict)))
print('The mean absolute error of RandomForestRegressor:',mean_absolute_error(ss_y.inverse_transform(y_test),ss_y.inverse_transform(rfr_y_predict)))

R-squared value of RandomForestRegressor: 0.684410600132
The mean squared error of RandomForestRegressor: 24.471210616
The mean absolute error of RandomForestRegressor: 3.20946957422

print('R-squared value of ExtraTreesRegressor:',etr.score(X_test,y_test))
print('The mean squared error of ExtraTreesRegressor:',mean_squared_error(ss_y.inverse_transform(y_test),ss_y.inverse_transform(etr_y_predict)))
print('The mean absolute error of ExtraTreesRegressor:',mean_absolute_error(ss_y.inverse_transform(y_test),ss_y.inverse_transform(etr_y_predict)))

R-squared value of ExtraTreesRegressor: 0.754540974486
The mean squared error of ExtraTreesRegressor: 19.0332106004
The mean absolute error of ExtraTreesRegressor: 3.01439924608

#利用訓練好的極端回歸森林模型,輸出每種特征對預測目標的貢獻度
print (np.sort(zip(etr.feature_importances_,boston.feature_names),axis=0))

ValueError: axis(=0) out of bounds(待解決)

print('R-squared value of GradientBoostingRegressor:',gbr.score(X_test,y_test))
print('The mean squared error of GradientBoostingRegressor:',mean_squared_error(ss_y.inverse_transform(y_test),ss_y.inverse_transform(gbr_y_predict)))
print('The mean absolute error of GradientBoostingRegressor:',mean_absolute_error(ss_y.inverse_transform(y_test),ss_y.inverse_transform(gbr_y_predict)))

R-squared value of GradientBoostingRegressor: 0.711319266042
The mean squared error of GradientBoostingRegressor: 22.3846778264
The mean absolute error of GradientBoostingRegressor: 2.9415078588

特點分析

許多在業(yè)界從事商業(yè)分析系統(tǒng)開發(fā)和搭建的工作者更加青睞集成模型衰絮,并且經常以這些模型的性能表現(xiàn)為基準袍冷,與新設計的其他模型性能進行比對。雖然這些集成模型在訓練過程中要耗費更多的時間猫牡,但是往往可以提供更高的表現(xiàn)性能和更好的穩(wěn)定性胡诗。

總結

若是對我們在“2.1.2回歸預測”節(jié)所有介紹過的模型在“美國波士頓房價預測”問題上的性能排序比較,也可以發(fā)現(xiàn)使用非線性回歸樹模型淌友,特別是集成模型煌恢,能夠取得更高的性能表現(xiàn)。


最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末震庭,一起剝皮案震驚了整個濱河市瑰抵,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌器联,老刑警劉巖二汛,帶你破解...
    沈念sama閱讀 217,509評論 6 504
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異拨拓,居然都是意外死亡肴颊,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,806評論 3 394
  • 文/潘曉璐 我一進店門渣磷,熙熙樓的掌柜王于貴愁眉苦臉地迎上來苫昌,“玉大人,你說我怎么就攤上這事∷钌恚” “怎么了奥务?”我有些...
    開封第一講書人閱讀 163,875評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長袜硫。 經常有香客問我氯葬,道長,這世上最難降的妖魔是什么婉陷? 我笑而不...
    開封第一講書人閱讀 58,441評論 1 293
  • 正文 為了忘掉前任帚称,我火速辦了婚禮,結果婚禮上秽澳,老公的妹妹穿的比我還像新娘闯睹。我一直安慰自己,他們只是感情好担神,可當我...
    茶點故事閱讀 67,488評論 6 392
  • 文/花漫 我一把揭開白布楼吃。 她就那樣靜靜地躺著,像睡著了一般妄讯。 火紅的嫁衣襯著肌膚如雪孩锡。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,365評論 1 302
  • 那天亥贸,我揣著相機與錄音躬窜,去河邊找鬼。 笑死炕置,一個胖子當著我的面吹牛荣挨,可吹牛的內容都是我干的。 我是一名探鬼主播朴摊,決...
    沈念sama閱讀 40,190評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼垦沉,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了仍劈?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 39,062評論 0 276
  • 序言:老撾萬榮一對情侶失蹤寡壮,失蹤者是張志新(化名)和其女友劉穎贩疙,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體况既,經...
    沈念sama閱讀 45,500評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡这溅,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,706評論 3 335
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了棒仍。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片悲靴。...
    茶點故事閱讀 39,834評論 1 347
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖莫其,靈堂內的尸體忽然破棺而出癞尚,到底是詐尸還是另有隱情耸三,我是刑警寧澤,帶...
    沈念sama閱讀 35,559評論 5 345
  • 正文 年R本政府宣布浇揩,位于F島的核電站仪壮,受9級特大地震影響,放射性物質發(fā)生泄漏胳徽。R本人自食惡果不足惜积锅,卻給世界環(huán)境...
    茶點故事閱讀 41,167評論 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望养盗。 院中可真熱鬧缚陷,春花似錦、人聲如沸往核。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,779評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽铆铆。三九已至蝶缀,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間薄货,已是汗流浹背翁都。 一陣腳步聲響...
    開封第一講書人閱讀 32,912評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留谅猾,地道東北人柄慰。 一個月前我還...
    沈念sama閱讀 47,958評論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像税娜,于是被迫代替她去往敵國和親坐搔。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,779評論 2 354

推薦閱讀更多精彩內容