決策樹算法

參見:http://blog.csdn.net/qunxingvip/article/details/51501541 說的比較詳細(xì)

下面缺失部分有錯(cuò)誤阶祭,已經(jīng)刪除

決策樹 是一種監(jiān)督學(xué)習(xí)算法搔确,可用于分類問題也可以用到回歸問題弥激。

決策樹的構(gòu)造:根據(jù)某種規(guī)則選取一個(gè)屬性,瞪浸;利用該屬性的值把數(shù)據(jù)分成不同的分支莫鸭,每個(gè)分支再遞歸的調(diào)用上面進(jìn)行分支的方法谚咬,當(dāng)該屬性對(duì)應(yīng)的數(shù)據(jù)都是同一類數(shù)據(jù)的時(shí)候停止進(jìn)行。

對(duì)不同選擇屬性的方法,對(duì)應(yīng)不同的決策樹算法攘残。

利用信息增益最大化的是ID3算法

利用信息增益率最大化的是C45算法

在R語言中拙友,rpart中分類或者回歸的算法是利用CART算法實(shí)現(xiàn)的。

信息熵:反映了數(shù)據(jù)的昏亂程度歼郭,信息熵越大 數(shù)據(jù)的昏亂程度越高遗契。?

信息增益:反應(yīng)信息的減少程度,根結(jié)點(diǎn)信息熵 -- 分類后的條件熵

決策樹的剪枝:

1病曾,首先構(gòu)造出完整的決策樹牍蜂,根據(jù)葉子結(jié)點(diǎn)所在鄰近父結(jié)點(diǎn),計(jì)算父結(jié)點(diǎn)的信息熵 與分類后的條件熵的差泰涂,大于0的時(shí)候進(jìn)行剪枝鲫竞。對(duì)其他結(jié)點(diǎn)進(jìn)行同樣的操作(后剪枝)

2,在決策樹構(gòu)造結(jié)點(diǎn)的時(shí)候逼蒙,計(jì)算兩者的差進(jìn)行剪枝(先剪枝)

3从绘,構(gòu)造好決策樹, 第一次利用1去除幾個(gè)結(jié)點(diǎn)形成一個(gè)樹T1是牢,第二次在T1的基礎(chǔ)上剪枝后形成T2僵井,,驳棱,批什,一直到只有一個(gè)結(jié)點(diǎn)Tn。利用測(cè)試集社搅,在T1 到Tn中選出分類或者擬合效率最好的那個(gè)樹驻债。

決策樹的優(yōu)點(diǎn)

1.對(duì)特征敏感

2.當(dāng)特征是連續(xù)值得時(shí)候,選取某個(gè)閾值對(duì)屬性進(jìn)行切分形葬。

決策樹的缺點(diǎn)

1.容易過擬合

其他:

1.熵合呐,基尼系數(shù)有利于具有大量不同值得屬性。

2.cart算法笙以,對(duì)每個(gè)屬性只進(jìn)行二元?jiǎng)澐?/b>

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末合砂,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子源织,更是在濱河造成了極大的恐慌,老刑警劉巖微猖,帶你破解...
    沈念sama閱讀 219,188評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件谈息,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡凛剥,警方通過查閱死者的電腦和手機(jī)侠仇,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,464評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人逻炊,你說我怎么就攤上這事互亮。” “怎么了余素?”我有些...
    開封第一講書人閱讀 165,562評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵豹休,是天一觀的道長。 經(jīng)常有香客問我桨吊,道長威根,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,893評(píng)論 1 295
  • 正文 為了忘掉前任视乐,我火速辦了婚禮洛搀,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘佑淀。我一直安慰自己留美,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,917評(píng)論 6 392
  • 文/花漫 我一把揭開白布伸刃。 她就那樣靜靜地躺著谎砾,像睡著了一般。 火紅的嫁衣襯著肌膚如雪奕枝。 梳的紋絲不亂的頭發(fā)上棺榔,一...
    開封第一講書人閱讀 51,708評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音隘道,去河邊找鬼症歇。 笑死,一個(gè)胖子當(dāng)著我的面吹牛谭梗,可吹牛的內(nèi)容都是我干的忘晤。 我是一名探鬼主播,決...
    沈念sama閱讀 40,430評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼激捏,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼设塔!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起远舅,我...
    開封第一講書人閱讀 39,342評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤闰蛔,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后图柏,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體序六,經(jīng)...
    沈念sama閱讀 45,801評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,976評(píng)論 3 337
  • 正文 我和宋清朗相戀三年蚤吹,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了例诀。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片随抠。...
    茶點(diǎn)故事閱讀 40,115評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖繁涂,靈堂內(nèi)的尸體忽然破棺而出拱她,到底是詐尸還是另有隱情,我是刑警寧澤扔罪,帶...
    沈念sama閱讀 35,804評(píng)論 5 346
  • 正文 年R本政府宣布秉沼,位于F島的核電站,受9級(jí)特大地震影響步势,放射性物質(zhì)發(fā)生泄漏氧猬。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,458評(píng)論 3 331
  • 文/蒙蒙 一坏瘩、第九天 我趴在偏房一處隱蔽的房頂上張望盅抚。 院中可真熱鬧,春花似錦倔矾、人聲如沸妄均。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,008評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽丰包。三九已至,卻和暖如春壤巷,著一層夾襖步出監(jiān)牢的瞬間邑彪,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,135評(píng)論 1 272
  • 我被黑心中介騙來泰國打工胧华, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留寄症,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,365評(píng)論 3 373
  • 正文 我出身青樓矩动,卻偏偏與公主長得像有巧,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子悲没,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,055評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • 決策樹理論在決策樹理論中篮迎,有這樣一句話,“用較少的東西示姿,照樣可以做很好的事情甜橱。越是小的決策樹,越優(yōu)于大的決策樹”栈戳。...
    制杖灶灶閱讀 5,851評(píng)論 0 25
  • 分類與預(yù)測(cè) 餐飲企業(yè)經(jīng)常會(huì)碰到下面的問題: 如何預(yù)測(cè)未來一段時(shí)間內(nèi)渗鬼,哪些顧客會(huì)流失,哪些顧客最有可能成為VIP客戶...
    Skye_kh閱讀 6,306評(píng)論 3 15
  • 0x01 概述 決策樹是附加概率結(jié)果的一個(gè)樹狀的決策圖荧琼,是直觀的運(yùn)用統(tǒng)計(jì)概率分析的圖法。機(jī)器學(xué)習(xí)中決策樹是一個(gè)預(yù)測(cè)...
    Pino_HD閱讀 1,461評(píng)論 0 0
  • 曾在我還是單身的時(shí)候就被人問過:愛情是追到手的嗎? 答案當(dāng)然不是堰乔,因?yàn)檎嬲母星楦静恍枰返摹?我所期待的一段愛...
    白丁蘇客閱讀 596評(píng)論 1 5
  • 投射 今天有好事情發(fā)生,都是我感興趣的事脐恩。放松镐侯,信任一切。今天有不一樣的內(nèi)容驶冒。發(fā)現(xiàn)女兒更多的優(yōu)點(diǎn)苟翻。 今天中午美美地...
    媽媽隨筆閱讀 208評(píng)論 4 2