決策樹

決策樹:分類決策樹模型使一種對(duì)實(shí)例進(jìn)行分類的樹形結(jié)構(gòu)掏觉。決策樹由節(jié)點(diǎn)和有向邊組成繁堡,節(jié)點(diǎn)有兩種類型:內(nèi)部節(jié)點(diǎn)和葉節(jié)點(diǎn)。內(nèi)部節(jié)點(diǎn)表示一個(gè)特征和屬性口叙,葉節(jié)點(diǎn)表示一個(gè)類炼绘。
特征選擇:特征選擇在于選取對(duì)訓(xùn)練數(shù)據(jù)具有分類能力的特征。通常特征選擇的準(zhǔn)則是信息增益或信息增益比妄田。
信息熵:熵是表示隨機(jī)變量不確定性的度量俺亮。由定義可知,熵只依賴于X的分布疟呐,而與X的取值無關(guān)脚曾。熵越大,隨機(jī)變量的不確定性越大启具。

信息熵.png

條件熵:條件熵H(Y|X)表示在已知隨機(jī)變量X的條件下隨機(jī)變量Y的不確定性本讥。
條件熵.png

信息增益:
信息增益.png

信息增益比:信息增益值的大小是相對(duì)于訓(xùn)練數(shù)據(jù)集而言的,沒有絕對(duì)意義鲁冯。在分類問題困難時(shí)拷沸,也就是說訓(xùn)練數(shù)據(jù)集的經(jīng)驗(yàn)熵大的時(shí)候,信息增益值就會(huì)偏大薯演。反之撞芍,則偏小。使用信息增益比跨扮,可以對(duì)這一問題進(jìn)行校正序无。
信息增益比.png

決策樹的生成

  • ID3算法:在決策樹各個(gè)節(jié)點(diǎn)上應(yīng)用信息增益準(zhǔn)則選擇特征验毡,遞歸構(gòu)建決策樹。該算法只有決策樹的生成帝嗡,所以該算法生成的樹容易產(chǎn)生過擬合米罚。
  • C4.5算法:與ID3相似,在生成決策數(shù)的過程中丈探,用信息增益比來選擇特征录择。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市碗降,隨后出現(xiàn)的幾起案子隘竭,更是在濱河造成了極大的恐慌,老刑警劉巖讼渊,帶你破解...
    沈念sama閱讀 211,194評(píng)論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件动看,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡爪幻,警方通過查閱死者的電腦和手機(jī)菱皆,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,058評(píng)論 2 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來挨稿,“玉大人仇轻,你說我怎么就攤上這事∧谈剩” “怎么了篷店?”我有些...
    開封第一講書人閱讀 156,780評(píng)論 0 346
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)臭家。 經(jīng)常有香客問我疲陕,道長(zhǎng),這世上最難降的妖魔是什么钉赁? 我笑而不...
    開封第一講書人閱讀 56,388評(píng)論 1 283
  • 正文 為了忘掉前任蹄殃,我火速辦了婚禮,結(jié)果婚禮上你踩,老公的妹妹穿的比我還像新娘诅岩。我一直安慰自己,他們只是感情好姓蜂,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,430評(píng)論 5 384
  • 文/花漫 我一把揭開白布按厘。 她就那樣靜靜地躺著,像睡著了一般钱慢。 火紅的嫁衣襯著肌膚如雪逮京。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,764評(píng)論 1 290
  • 那天束莫,我揣著相機(jī)與錄音懒棉,去河邊找鬼草描。 笑死,一個(gè)胖子當(dāng)著我的面吹牛策严,可吹牛的內(nèi)容都是我干的穗慕。 我是一名探鬼主播,決...
    沈念sama閱讀 38,907評(píng)論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼妻导,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼逛绵!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起倔韭,我...
    開封第一講書人閱讀 37,679評(píng)論 0 266
  • 序言:老撾萬榮一對(duì)情侶失蹤术浪,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后寿酌,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體胰苏,經(jīng)...
    沈念sama閱讀 44,122評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,459評(píng)論 2 325
  • 正文 我和宋清朗相戀三年醇疼,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了硕并。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,605評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡秧荆,死狀恐怖倔毙,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情辰如,我是刑警寧澤普监,帶...
    沈念sama閱讀 34,270評(píng)論 4 329
  • 正文 年R本政府宣布,位于F島的核電站琉兜,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏毙玻。R本人自食惡果不足惜豌蟋,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,867評(píng)論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望桑滩。 院中可真熱鬧梧疲,春花似錦、人聲如沸运准。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,734評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)胁澳。三九已至该互,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間韭畸,已是汗流浹背宇智。 一陣腳步聲響...
    開封第一講書人閱讀 31,961評(píng)論 1 265
  • 我被黑心中介騙來泰國(guó)打工蔓搞, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人随橘。 一個(gè)月前我還...
    沈念sama閱讀 46,297評(píng)論 2 360
  • 正文 我出身青樓喂分,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親机蔗。 傳聞我的和親對(duì)象是個(gè)殘疾皇子蒲祈,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,472評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容

  • ??決策樹(Decision Tree)是一種基本的分類與回歸方法,其模型呈樹狀結(jié)構(gòu)萝嘁,在分類問題中讳嘱,表示基于特征對(duì)...
    殉道者之花火閱讀 4,514評(píng)論 2 2
  • 運(yùn)行平臺(tái):Windows Python版本:Python3.x IDE:pycharm 一、決策樹 決策樹是什么酿愧?...
    ghostdogss閱讀 1,869評(píng)論 0 1
  • 1 前言 在了解樹模型之前拔恰,自然想到樹模型和線性模型颜懊,他們有什么區(qū)別呢河爹? 樹形模型是一個(gè)一個(gè)特征進(jìn)行處理,之前線性...
    高永峰_GYF閱讀 1,377評(píng)論 0 1
  • 前言: 通過第前面的學(xué)習(xí)介紹了機(jī)器學(xué)習(xí)回歸模型創(chuàng)建的流程,并且知道了機(jī)器學(xué)習(xí)要做的事情是找到目標(biāo)函數(shù)侄刽,優(yōu)化它朋凉,通過...
    飄涯閱讀 6,373評(píng)論 4 83
  • find . -name ".m" -or -name ".h" -or -name ".xib" -or -na...
    繁華落盡2018閱讀 179評(píng)論 0 0