《機(jī)器學(xué)習(xí)實戰(zhàn)》第三章 決策樹算法

機(jī)器學(xué)習(xí)個人認(rèn)為的重點在于三個方面:一是理解能力,即理解知識或是問題的本質(zhì);二是抽象能力盔沫,如何將問題特征進(jìn)行抽象,并應(yīng)用數(shù)學(xué)知識對具體問題的抽象結(jié)果進(jìn)行建模枫匾;三是編碼能力架诞,能用代碼流暢地表達(dá)建立的模型。

決策樹是什么:
決策樹(Decision Tree)是另一種簡單但是廣泛使用的分類器干茉。通過訓(xùn)練數(shù)據(jù)來構(gòu)建決策樹侈贷,并利用所構(gòu)建的決策樹對待分類數(shù)據(jù)進(jìn)行高效的分類。

決策樹作為一種比 k – 近鄰算法更加高效的分類器等脂,同樣是根據(jù)屬性來進(jìn)行分類俏蛮。那高效的地方在于何處?簡單說就是上遥,如果說k – 近鄰算法需要比較待分類數(shù)據(jù)與訓(xùn)練樣本的所有特征值的差距搏屑。那決策樹可能僅依據(jù)一個或幾個比較有特點的屬性就能將待分類數(shù)據(jù)進(jìn)行分類。

回憶第一章里相親網(wǎng)站的例子粉楚,如果A女士是一個反對抽煙的人辣恋,而在我們訓(xùn)練樣本的屬性中添加一個生活習(xí)慣的屬性,其屬性的值包括抽煙和非抽煙兩個模软。則當(dāng)遇到一個新的需要分類的人(B先生)時伟骨,如果B先生活習(xí)慣屬性的特征值是抽煙,則在分類時燃异,我們不需要計算其他特征值的差距携狭,就可以很容易地將B先生歸為A女士不喜歡的一類中。

(圖為判斷貸款人是否具有償還貸款能力的簡單決策樹)


2017-02-06_083844.jpg

高效性在于回俐,一次性構(gòu)建決策樹就可以反復(fù)使用逛腿,并且每一次分類的最大計算次數(shù)不超過決策樹的深度稀并,并且數(shù)據(jù)形式非常容易理解。

決策樹的優(yōu)缺點:
優(yōu)點: 計算復(fù)雜度不高单默, 輸出結(jié)果易于理解碘举, 對中間值的缺失不敏感,可以處理不相關(guān)特征數(shù)據(jù)搁廓。
缺點: 可能會產(chǎn)生過度匹配問題引颈。
適用數(shù)據(jù)類型: 數(shù)值型和標(biāo)稱型

如何構(gòu)建決策樹:
還是以此圖為例,

leaf.jpg

用訓(xùn)練樣本的屬性作節(jié)點(葉節(jié)點除外)境蜕,比如:“擁有房產(chǎn)”线欲;用對應(yīng)樣本屬性的特征值作分支,比如“是”或“否”汽摹;用分類的標(biāo)簽做葉節(jié)點李丰,比如“可以償還”或“無法償還”。

根節(jié)點:根節(jié)點在數(shù)據(jù)分類時起了關(guān)鍵作用逼泣,它是決策樹算法匯聚所有數(shù)據(jù)的地方趴泌,為了劃分出最好的結(jié)果,我們需要找到?jīng)Q定性的特征作為第一個根節(jié)點拉庶。

非子葉節(jié)點:非子葉節(jié)點也是屬性之一嗜憔,每一個非子葉節(jié)點都是一個決定性屬性,幫助流入數(shù)據(jù)分出最好的分類結(jié)果氏仗。

分支:分支是給對應(yīng)節(jié)點屬性的特征值吉捶,滿足分支上特征值條件的數(shù)據(jù)將會被分入對應(yīng)的下一個節(jié)點。

葉節(jié)點:葉節(jié)點是分類的標(biāo)簽皆尔,也就是分類的類別呐舔。

我自己的博客地址為:謝雨熹的學(xué)習(xí)博客歡迎大家來交流!
Talk is cheap, show me your code!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末慷蠕,一起剝皮案震驚了整個濱河市珊拼,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌流炕,老刑警劉巖澎现,帶你破解...
    沈念sama閱讀 206,378評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異每辟,居然都是意外死亡剑辫,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,356評論 2 382
  • 文/潘曉璐 我一進(jìn)店門渠欺,熙熙樓的掌柜王于貴愁眉苦臉地迎上來妹蔽,“玉大人,你說我怎么就攤上這事《锟” “怎么了盅视?”我有些...
    開封第一講書人閱讀 152,702評論 0 342
  • 文/不壞的土叔 我叫張陵捐名,是天一觀的道長旦万。 經(jīng)常有香客問我,道長镶蹋,這世上最難降的妖魔是什么成艘? 我笑而不...
    開封第一講書人閱讀 55,259評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮贺归,結(jié)果婚禮上淆两,老公的妹妹穿的比我還像新娘。我一直安慰自己拂酣,他們只是感情好秋冰,可當(dāng)我...
    茶點故事閱讀 64,263評論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著婶熬,像睡著了一般剑勾。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上赵颅,一...
    開封第一講書人閱讀 49,036評論 1 285
  • 那天虽另,我揣著相機(jī)與錄音,去河邊找鬼饺谬。 笑死捂刺,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的募寨。 我是一名探鬼主播族展,決...
    沈念sama閱讀 38,349評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼拔鹰!你這毒婦竟也來了苛谷?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,979評論 0 259
  • 序言:老撾萬榮一對情侶失蹤格郁,失蹤者是張志新(化名)和其女友劉穎腹殿,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體例书,經(jīng)...
    沈念sama閱讀 43,469評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡锣尉,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,938評論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了决采。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片自沧。...
    茶點故事閱讀 38,059評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出拇厢,到底是詐尸還是另有隱情爱谁,我是刑警寧澤,帶...
    沈念sama閱讀 33,703評論 4 323
  • 正文 年R本政府宣布孝偎,位于F島的核電站访敌,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏衣盾。R本人自食惡果不足惜寺旺,卻給世界環(huán)境...
    茶點故事閱讀 39,257評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望势决。 院中可真熱鬧阻塑,春花似錦、人聲如沸果复。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,262評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽虽抄。三九已至走搁,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間极颓,已是汗流浹背朱盐。 一陣腳步聲響...
    開封第一講書人閱讀 31,485評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留菠隆,地道東北人兵琳。 一個月前我還...
    沈念sama閱讀 45,501評論 2 354
  • 正文 我出身青樓,卻偏偏與公主長得像骇径,于是被迫代替她去往敵國和親躯肌。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,792評論 2 345

推薦閱讀更多精彩內(nèi)容