機(jī)器學(xué)習(xí)算法——決策樹

1.決策樹簡單描述

決策樹是一種基于特征對實(shí)例進(jìn)行分類的樹形結(jié)構(gòu)噪馏∪祝可以轉(zhuǎn)換成一個if-then規(guī)則的集合蚕苇,也可以看作是定義在特征空間劃分上的類的條件概率分布内狸。


Snip20170922_20.png

2.決策樹學(xué)習(xí)算法

決策樹學(xué)習(xí)旨在構(gòu)建一個與訓(xùn)練數(shù)據(jù)擬合很好检眯,并且復(fù)雜度小的決策樹。


Snip20170922_21.png

1.決策樹學(xué)習(xí)的算法通常是一個遞歸地選擇最優(yōu)特征昆淡,并根據(jù)該特征對訓(xùn)練數(shù)據(jù)進(jìn)行分割锰瘸,使得對各個子數(shù)據(jù)集有一個最好的分類的過程,這一過程對應(yīng)著對特征空間的劃分昂灵,也對應(yīng)著決策樹的構(gòu)建避凝。開始,構(gòu)建根結(jié)點(diǎn)眨补,將所有訓(xùn)練數(shù)據(jù)都放在根結(jié)點(diǎn)管削,選擇一個最優(yōu)特征,按照這一特征將訓(xùn)練數(shù)據(jù)集分割成子集撑螺,使得各個子集有一個在當(dāng)前條件下最好的分類含思。如果這些子集已經(jīng)能夠被基本正確分類,那么構(gòu)建葉結(jié)點(diǎn)甘晤,并將這些子集分到所對應(yīng)的葉結(jié)點(diǎn)中去含潘;如果還有子集不能被基本正確分類,那么就對這些子集選擇新的最優(yōu)特征线婚,繼續(xù)對其進(jìn)行分割遏弱,構(gòu)建相應(yīng)的結(jié)點(diǎn)。如此遞歸地進(jìn)行下去塞弊,直至所有訓(xùn)練數(shù)據(jù)子集被基本正確分類腾窝,或者沒有合適的特征為止缀踪。最后每個子集都被分到葉結(jié)點(diǎn),即都有了明確的類虹脯。這就生成了一顆決策樹。

2.以上方法生成的決策樹可能對訓(xùn)練數(shù)據(jù)有很好的分類能力奏候,但對未知的測試數(shù)據(jù)卻未必有很好的分類能力循集,即可能發(fā)生過擬合現(xiàn)象。我們需要對已生成的樹自下而上進(jìn)行剪枝蔗草,將樹變得更簡單咒彤,從而使它具有更好的泛化能力。具體地咒精,就是去掉過于細(xì)分的葉結(jié)點(diǎn)镶柱,使其回退到父結(jié)點(diǎn),甚至更高的結(jié)點(diǎn)模叙,然后將父結(jié)點(diǎn)或更高的結(jié)點(diǎn)改為新的葉結(jié)點(diǎn)歇拆。

3.如果特征數(shù)量很多,也可以在決策樹學(xué)習(xí)開始的時候范咨,對特征進(jìn)行選擇故觅,只留下對訓(xùn)練數(shù)據(jù)有足夠分類能力的特征。

2.1 特征選擇

特征選擇在于選取對訓(xùn)練數(shù)據(jù)具有分類能力的特征渠啊,這樣可以提高決策樹學(xué)習(xí)的效率输吏。通常特征選擇的準(zhǔn)則是信息增益信息增益比

2.2 決策樹的生成
2.3 決策樹的剪枝
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末替蛉,一起剝皮案震驚了整個濱河市贯溅,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌躲查,老刑警劉巖它浅,帶你破解...
    沈念sama閱讀 206,378評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異熙含,居然都是意外死亡罚缕,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,356評論 2 382
  • 文/潘曉璐 我一進(jìn)店門怎静,熙熙樓的掌柜王于貴愁眉苦臉地迎上來邮弹,“玉大人,你說我怎么就攤上這事蚓聘‰缦纾” “怎么了?”我有些...
    開封第一講書人閱讀 152,702評論 0 342
  • 文/不壞的土叔 我叫張陵夜牡,是天一觀的道長与纽。 經(jīng)常有香客問我侣签,道長,這世上最難降的妖魔是什么急迂? 我笑而不...
    開封第一講書人閱讀 55,259評論 1 279
  • 正文 為了忘掉前任影所,我火速辦了婚禮,結(jié)果婚禮上僚碎,老公的妹妹穿的比我還像新娘猴娩。我一直安慰自己,他們只是感情好勺阐,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,263評論 5 371
  • 文/花漫 我一把揭開白布卷中。 她就那樣靜靜地躺著,像睡著了一般渊抽。 火紅的嫁衣襯著肌膚如雪蟆豫。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,036評論 1 285
  • 那天懒闷,我揣著相機(jī)與錄音十减,去河邊找鬼。 笑死毛雇,一個胖子當(dāng)著我的面吹牛嫉称,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播灵疮,決...
    沈念sama閱讀 38,349評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼织阅,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了震捣?” 一聲冷哼從身側(cè)響起荔棉,我...
    開封第一講書人閱讀 36,979評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎蒿赢,沒想到半個月后润樱,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,469評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡羡棵,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,938評論 2 323
  • 正文 我和宋清朗相戀三年壹若,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片皂冰。...
    茶點(diǎn)故事閱讀 38,059評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡店展,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出秃流,到底是詐尸還是另有隱情赂蕴,我是刑警寧澤,帶...
    沈念sama閱讀 33,703評論 4 323
  • 正文 年R本政府宣布舶胀,位于F島的核電站概说,受9級特大地震影響碧注,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜糖赔,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,257評論 3 307
  • 文/蒙蒙 一萍丐、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧放典,春花似錦碉纺、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,262評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽耿导。三九已至声怔,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間舱呻,已是汗流浹背醋火。 一陣腳步聲響...
    開封第一講書人閱讀 31,485評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留箱吕,地道東北人芥驳。 一個月前我還...
    沈念sama閱讀 45,501評論 2 354
  • 正文 我出身青樓,卻偏偏與公主長得像茬高,于是被迫代替她去往敵國和親兆旬。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,792評論 2 345

推薦閱讀更多精彩內(nèi)容