用SKlearn 建立一棵看得見的決策樹

這里采用的數(shù)據(jù)集是SKlearn中的紅酒數(shù)據(jù)集鸟顺。

1 導(dǎo)入需要的算法庫和模塊

from sklearn import tree                                 #導(dǎo)入tree模塊
from sklearn.datasets import load_wine                   #導(dǎo)入紅酒數(shù)據(jù)集
from sklearn.model_selection import train_test_split     #導(dǎo)入訓(xùn)練集和測試集切分包

2 探索數(shù)據(jù)

wine = load_wine()  
wine.data
wine.data.shape
wine.target
wine.target.shape

運(yùn)行的結(jié)果是這樣子的:


紅酒數(shù)據(jù)集data

data就是該數(shù)據(jù)集的特征矩陣信不,從運(yùn)行結(jié)果可以看出蛉腌,該紅酒數(shù)據(jù)集一共有178條記錄偿荷,13個(gè)特征檐春。

紅酒數(shù)據(jù)集target

特征矩陣中有178條記錄顽聂,相對(duì)應(yīng)的標(biāo)簽Y就有178個(gè)數(shù)據(jù)肥惭。

如果wine是一張表盯仪,應(yīng)該長這樣:

import pandas as pd
pd.concat([pd.DataFrame(wine.data),pd.DataFrame(wine.target)],axis=1)
DF_wine

這是數(shù)據(jù)集特征列名和標(biāo)簽分類

wine.feature_names
wine.target_names
wine列名和標(biāo)簽

3 分訓(xùn)練集和測試集

這里選取30%作為測試集。切分好之后蜜葱,訓(xùn)練集有124條數(shù)據(jù)全景,測試集有54條數(shù)據(jù)。

Xtrain, Xtest, Ytrain, Ytest = train_test_split(wine.data,wine.target,test_size=0.3)
Xtrain.shape
Xtest.shape

4 建立模型

clf = tree.DecisionTreeClassifier(criterion="entropy") #初始化樹模型
clf = clf.fit(Xtrain, Ytrain)                          #實(shí)例化訓(xùn)練集
score = clf.score(Xtest, Ytest)                        #返回預(yù)測的準(zhǔn)確度

score
wine-score

5 畫出一棵樹吧

feature_name = ['酒精','蘋果酸','灰','灰的堿性','鎂','總酚','類黃酮','非黃烷類酚類','花青素','顏色強(qiáng)度','色調(diào)','od280/od315稀釋葡萄酒','脯氨酸']

import graphviz
dot_data = tree.export_graphviz(clf
                                ,out_file=None
                                ,feature_names= feature_name
                                ,class_names=["琴酒","雪莉","貝爾摩德"]
                                ,filled=True
                                ,rounded=True
                               )
graph = graphviz.Source(dot_data)
graph
決策樹

6 探索決策樹

#特征重要性
clf.feature_importances_

[*zip(feature_name,clf.feature_importances_)]
探索決策樹

到現(xiàn)在為止牵囤,我們已經(jīng)學(xué)會(huì)建立一棵完整的決策樹了爸黄。有興趣的話,動(dòng)手建立一棵屬于自己的決策樹吧~

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末揭鳞,一起剝皮案震驚了整個(gè)濱河市炕贵,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌野崇,老刑警劉巖称开,帶你破解...
    沈念sama閱讀 216,372評(píng)論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異乓梨,居然都是意外死亡鳖轰,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門扶镀,熙熙樓的掌柜王于貴愁眉苦臉地迎上來脆霎,“玉大人,你說我怎么就攤上這事狈惫。” “怎么了鹦马?”我有些...
    開封第一講書人閱讀 162,415評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵胧谈,是天一觀的道長。 經(jīng)常有香客問我荸频,道長菱肖,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,157評(píng)論 1 292
  • 正文 為了忘掉前任旭从,我火速辦了婚禮稳强,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘和悦。我一直安慰自己退疫,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,171評(píng)論 6 388
  • 文/花漫 我一把揭開白布鸽素。 她就那樣靜靜地躺著褒繁,像睡著了一般。 火紅的嫁衣襯著肌膚如雪馍忽。 梳的紋絲不亂的頭發(fā)上棒坏,一...
    開封第一講書人閱讀 51,125評(píng)論 1 297
  • 那天燕差,我揣著相機(jī)與錄音,去河邊找鬼坝冕。 笑死徒探,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的喂窟。 我是一名探鬼主播测暗,決...
    沈念sama閱讀 40,028評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢(mèng)啊……” “哼谎替!你這毒婦竟也來了偷溺?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,887評(píng)論 0 274
  • 序言:老撾萬榮一對(duì)情侶失蹤钱贯,失蹤者是張志新(化名)和其女友劉穎挫掏,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體秩命,經(jīng)...
    沈念sama閱讀 45,310評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡尉共,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,533評(píng)論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了弃锐。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片袄友。...
    茶點(diǎn)故事閱讀 39,690評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖霹菊,靈堂內(nèi)的尸體忽然破棺而出剧蚣,到底是詐尸還是另有隱情,我是刑警寧澤旋廷,帶...
    沈念sama閱讀 35,411評(píng)論 5 343
  • 正文 年R本政府宣布鸠按,位于F島的核電站,受9級(jí)特大地震影響饶碘,放射性物質(zhì)發(fā)生泄漏目尖。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,004評(píng)論 3 325
  • 文/蒙蒙 一扎运、第九天 我趴在偏房一處隱蔽的房頂上張望瑟曲。 院中可真熱鬧,春花似錦豪治、人聲如沸洞拨。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽扣甲。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間琉挖,已是汗流浹背启泣。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評(píng)論 1 268
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留示辈,地道東北人寥茫。 一個(gè)月前我還...
    沈念sama閱讀 47,693評(píng)論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像矾麻,于是被迫代替她去往敵國和親纱耻。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,577評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容

  • 1险耀、模型原理 (一)原理 1弄喘、原理:引入信息熵(不確定程度)的概念,通過計(jì)算各屬性下的信息增益程度(信息增益越大甩牺,...
    Python_Franklin閱讀 12,346評(píng)論 0 17
  • 觀今宜鑒古蘑志,無古不成今。 近水知魚性贬派,近山識(shí)鳥音急但。 運(yùn)去金成鐵,時(shí)來鐵似金搞乏。 錢財(cái)如糞土波桩,仁義值千金! 相見易得好...
    漢唐雄風(fēng)閱讀 511評(píng)論 0 0
  • 2018年8月11號(hào) 星期六 晴 今天帶孩子去國貿(mào)的游樂園玩请敦,孩子可高興了镐躲,可是玩了一會(huì)就不愿...
    璇璇他爹閱讀 148評(píng)論 0 1
  • 那個(gè)坐在空蕩蕩的祠堂里的女人,披著大紅蓋頭侍筛,通身穿著紅色的旗袍匀油,雙手緊捏著放在膝蓋上,筆直的端坐在一把木凳子上面勾笆。...
    herensi閱讀 223評(píng)論 0 0
  • 文/羽蒙 白晝 在白晝的陰影里逝去夜幕 在夜幕的光明里尋覓 一雙隱形的手掌如何托起繁星的思緒從此 所有的心事...
    羽蒙1閱讀 697評(píng)論 6 25