ML 監(jiān)督學(xué)習(xí) 回歸 樹回歸

Scikit-Learn用分裂回歸樹(Classification And Regression Tree脉让,簡(jiǎn)稱 CART)算法訓(xùn)練決策樹。 在 sklean.tree 包中實(shí)現(xiàn)了 CART 模型匿乃,分別用 DecisionTreeClassifier 和DecisionTreeRegressor 實(shí)現(xiàn)了分類樹和回歸樹确封。

首先使用單個(gè)特征和閾值 (例如,“花瓣長度 ≤2.45cm ”)將訓(xùn)練集分成兩個(gè)子集當(dāng)它成功的將訓(xùn)練集分成兩部分之后巧号,它將會(huì)繼續(xù)使用相同的遞歸式邏輯繼續(xù)的分割子集含衔, 然后是子集的子集煎娇。

通常,算法使用Gini 不純度來進(jìn)行檢測(cè)

CART算法是一種貪婪算法:它貪婪地搜索最高級(jí)別的最佳分割方 式贪染,然后在每個(gè)深度重復(fù)該過程缓呛。 它不檢查分割是否能夠在幾個(gè)級(jí)別中的全部分割可能 中找到最佳方法。貪婪算法通常會(huì)產(chǎn)生一個(gè)相當(dāng)好的解決方法杭隙,但它不保證這是全局中 的最佳解決方案哟绊。

Regression

CART算法使用后剪枝法。有些樣本集由于樣本數(shù)太少而不能分出獨(dú)立的測(cè)試樣本集痰憎,CART算法采用一種稱為交叉確定(crossvalidation)的剪枝方法票髓。該方法解決了在小樣本集上挖掘決策樹由于沒有獨(dú)立測(cè)試樣本集而造成的過度擬合問題。不過CART算法最初建立的樹也有錯(cuò)誤率铣耘,因?yàn)橛行┤~子節(jié)點(diǎn)并不是純的洽沟。

回歸樹不再以最小化不 純度的方式分割訓(xùn)練集,而是試圖以最小化MSE 的方式分割訓(xùn)練集涡拘。

Cost Function
###### Regression #####
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn import datasets
from sklearn.metrics import mean_squared_error

from sklearn.tree import DecisionTreeRegressor

# Load data
boston = datasets.load_boston()
print(boston.data.shape, boston.target.shape)
print(boston.feature_names)

data = pd.DataFrame(boston.data,columns=boston.feature_names)
data = pd.concat([data,pd.Series(boston.target,name='MEDV')],axis=1)
data.head()

X = data.iloc[:,:-1]
y = data.iloc[:,-1]

x_training_set, x_test_set, y_training_set, y_test_set = train_test_split(X,y,test_size=0.10,random_state=40)

# Fit regression model
model =  DecisionTreeRegressor(max_depth=5,random_state=0)
model.fit(x_training_set, y_training_set)

from sklearn.metrics import mean_squared_error, r2_score
model_score = model.score(x_training_set,y_training_set)

print('coefficient of determination R^2 of the prediction.: ',model_score)
y_predicted = model.predict(x_test_set)

# The mean squared error
print("Mean squared error: %.2f"% mean_squared_error(y_test_set, y_predicted))
# Explained variance score: 1 is perfect prediction
print('Test Variance score: %.2f' % r2_score(y_test_set, y_predicted))

from sklearn.model_selection import cross_val_predict

fig, ax = plt.subplots()
ax.scatter(y_test_set, y_predicted, edgecolors=(0, 0, 0))
ax.plot([y_test_set.min(), y_test_set.max()], [y_test_set.min(), y_test_set.max()], 'k--', lw=4)
ax.set_xlabel('Actual')
ax.set_ylabel('Predicted')
ax.set_title("Ground Truth vs Predicted")
plt.show()

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末玲躯,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子鳄乏,更是在濱河造成了極大的恐慌,老刑警劉巖棘利,帶你破解...
    沈念sama閱讀 212,884評(píng)論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件橱野,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡善玫,警方通過查閱死者的電腦和手機(jī)水援,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,755評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門密强,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人蜗元,你說我怎么就攤上這事或渤。” “怎么了奕扣?”我有些...
    開封第一講書人閱讀 158,369評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵薪鹦,是天一觀的道長。 經(jīng)常有香客問我惯豆,道長池磁,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,799評(píng)論 1 285
  • 正文 為了忘掉前任楷兽,我火速辦了婚禮地熄,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘芯杀。我一直安慰自己端考,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,910評(píng)論 6 386
  • 文/花漫 我一把揭開白布揭厚。 她就那樣靜靜地躺著跛梗,像睡著了一般。 火紅的嫁衣襯著肌膚如雪棋弥。 梳的紋絲不亂的頭發(fā)上核偿,一...
    開封第一講書人閱讀 50,096評(píng)論 1 291
  • 那天,我揣著相機(jī)與錄音顽染,去河邊找鬼漾岳。 笑死,一個(gè)胖子當(dāng)著我的面吹牛粉寞,可吹牛的內(nèi)容都是我干的尼荆。 我是一名探鬼主播,決...
    沈念sama閱讀 39,159評(píng)論 3 411
  • 文/蒼蘭香墨 我猛地睜開眼唧垦,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼捅儒!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起振亮,我...
    開封第一講書人閱讀 37,917評(píng)論 0 268
  • 序言:老撾萬榮一對(duì)情侶失蹤巧还,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后坊秸,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體麸祷,經(jīng)...
    沈念sama閱讀 44,360評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,673評(píng)論 2 327
  • 正文 我和宋清朗相戀三年褒搔,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了阶牍。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片喷面。...
    茶點(diǎn)故事閱讀 38,814評(píng)論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖走孽,靈堂內(nèi)的尸體忽然破棺而出惧辈,到底是詐尸還是另有隱情,我是刑警寧澤磕瓷,帶...
    沈念sama閱讀 34,509評(píng)論 4 334
  • 正文 年R本政府宣布盒齿,位于F島的核電站,受9級(jí)特大地震影響生宛,放射性物質(zhì)發(fā)生泄漏县昂。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,156評(píng)論 3 317
  • 文/蒙蒙 一陷舅、第九天 我趴在偏房一處隱蔽的房頂上張望倒彰。 院中可真熱鬧,春花似錦莱睁、人聲如沸待讳。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,882評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽创淡。三九已至,卻和暖如春南吮,著一層夾襖步出監(jiān)牢的瞬間琳彩,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,123評(píng)論 1 267
  • 我被黑心中介騙來泰國打工部凑, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留露乏,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,641評(píng)論 2 362
  • 正文 我出身青樓涂邀,卻偏偏與公主長得像瘟仿,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子比勉,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,728評(píng)論 2 351

推薦閱讀更多精彩內(nèi)容