基于決策樹的分類預(yù)測(cè) 2020-08-21

一 決策樹的介紹

1.決策樹的介紹

決策樹是一種常見的分類模型核行,在金融分控精算、醫(yī)療輔助診斷等諸多行業(yè)具有較為廣泛的應(yīng)用伯病。決策樹的核心思想是基于樹結(jié)構(gòu)對(duì)數(shù)據(jù)進(jìn)行劃分线欲,這種思想是人類處理問題時(shí)的本能方法明场。例如在婚戀市場(chǎng)中,女方通常會(huì)先看男方是否有房產(chǎn)李丰,如果有房產(chǎn)再看是否有車產(chǎn)苦锨,如果有車產(chǎn)再看是否有穩(wěn)定工作……最后得出是否要深入了解的判斷。

決策樹的主要優(yōu)點(diǎn):

a 具有很好的解釋性趴泌,模型可以生成可以理解的規(guī)則舟舒。

b 可以發(fā)現(xiàn)特征的重要程度。

c 模型的計(jì)算復(fù)雜度較低嗜憔。

決策樹的主要缺點(diǎn):

a 模型容易過擬合秃励,需要采用減枝技術(shù)處理。

b 不能很好利用連續(xù)型特征吉捶。

c 預(yù)測(cè)能力有限夺鲜,無法達(dá)到其他強(qiáng)監(jiān)督模型效果。

d 方差較高呐舔,數(shù)據(jù)分布的輕微改變很容易造成樹結(jié)構(gòu)完全不同币励。

2.決策樹的應(yīng)用

由于決策樹模型中自變量與因變量的非線性關(guān)系以及決策樹簡(jiǎn)單的計(jì)算方法,使得它成為集成學(xué)習(xí)中最為廣泛使用的基模型珊拼。梯度提升樹(GBDT)食呻,XGBoost以及LightGBM等先進(jìn)的集成模型都采用了決策樹作為基模型,在廣告計(jì)算杆麸、CTR預(yù)估搁进、金融風(fēng)控等領(lǐng)域大放異彩,成為當(dāng)今與神經(jīng)網(wǎng)絡(luò)相提并論的復(fù)雜模型昔头,更是數(shù)據(jù)挖掘比賽中的潮剩客。在新的研究中揭斧,南京大學(xué)周志華老師提出一種多粒度級(jí)聯(lián)森林模型莱革,創(chuàng)造了一種全新的基于決策樹的深度集成方法,為我們提供了決策樹發(fā)展的另一種可能讹开。

同時(shí)決策樹在一些需要明確可解釋甚至提取分類規(guī)則的場(chǎng)景中被廣泛應(yīng)用盅视,而其他機(jī)器學(xué)習(xí)模型在這一點(diǎn)很難做到。例如在醫(yī)療輔助系統(tǒng)中旦万,為了方便專業(yè)人員發(fā)現(xiàn)錯(cuò)誤闹击,常常將決策樹算法用于輔助病癥檢測(cè)。例如在一個(gè)預(yù)測(cè)哮喘患者的模型中成艘,醫(yī)生發(fā)現(xiàn)測(cè)試的許多高級(jí)模型的效果非常差赏半。所以他們?cè)跀?shù)據(jù)上運(yùn)行了一個(gè)決策樹的模型贺归,發(fā)現(xiàn)算法認(rèn)為劇烈咳嗽的病人患哮喘的風(fēng)險(xiǎn)很小。但醫(yī)生非常清楚劇烈咳嗽一般都會(huì)被立刻檢查治療断箫,這意味著患有劇烈咳嗽的哮喘病人都會(huì)馬上得到收治拂酣。用于建模的數(shù)據(jù)認(rèn)為這類病人風(fēng)險(xiǎn)很小,是因?yàn)樗羞@類病人都得到了及時(shí)治療仲义,所以極少有人在此之后患病或死亡婶熬。



?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市埃撵,隨后出現(xiàn)的幾起案子赵颅,更是在濱河造成了極大的恐慌,老刑警劉巖盯另,帶你破解...
    沈念sama閱讀 218,640評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件性含,死亡現(xiàn)場(chǎng)離奇詭異洲赵,居然都是意外死亡鸳惯,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,254評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門叠萍,熙熙樓的掌柜王于貴愁眉苦臉地迎上來芝发,“玉大人,你說我怎么就攤上這事苛谷「ňǎ” “怎么了?”我有些...
    開封第一講書人閱讀 165,011評(píng)論 0 355
  • 文/不壞的土叔 我叫張陵腹殿,是天一觀的道長(zhǎng)独悴。 經(jīng)常有香客問我,道長(zhǎng)锣尉,這世上最難降的妖魔是什么刻炒? 我笑而不...
    開封第一講書人閱讀 58,755評(píng)論 1 294
  • 正文 為了忘掉前任,我火速辦了婚禮自沧,結(jié)果婚禮上坟奥,老公的妹妹穿的比我還像新娘。我一直安慰自己拇厢,他們只是感情好爱谁,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,774評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著孝偎,像睡著了一般访敌。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上衣盾,一...
    開封第一講書人閱讀 51,610評(píng)論 1 305
  • 那天寺旺,我揣著相機(jī)與錄音荡陷,去河邊找鬼。 笑死迅涮,一個(gè)胖子當(dāng)著我的面吹牛废赞,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播叮姑,決...
    沈念sama閱讀 40,352評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼唉地,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了传透?” 一聲冷哼從身側(cè)響起耘沼,我...
    開封第一講書人閱讀 39,257評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎朱盐,沒想到半個(gè)月后群嗤,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,717評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡兵琳,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,894評(píng)論 3 336
  • 正文 我和宋清朗相戀三年狂秘,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片躯肌。...
    茶點(diǎn)故事閱讀 40,021評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡者春,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出清女,到底是詐尸還是另有隱情钱烟,我是刑警寧澤,帶...
    沈念sama閱讀 35,735評(píng)論 5 346
  • 正文 年R本政府宣布嫡丙,位于F島的核電站拴袭,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏曙博。R本人自食惡果不足惜拥刻,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,354評(píng)論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望羊瘩。 院中可真熱鬧泰佳,春花似錦、人聲如沸尘吗。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,936評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽睬捶。三九已至黔宛,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間擒贸,已是汗流浹背臀晃。 一陣腳步聲響...
    開封第一講書人閱讀 33,054評(píng)論 1 270
  • 我被黑心中介騙來泰國(guó)打工觉渴, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留侧到,地道東北人淳蔼。 一個(gè)月前我還...
    沈念sama閱讀 48,224評(píng)論 3 371
  • 正文 我出身青樓嗦董,卻偏偏與公主長(zhǎng)得像物延,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子玉雾,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,974評(píng)論 2 355