第八章 數(shù)據(jù)決策分析算法——基于隨機(jī)森林的決策分類

8.4 基于隨機(jī)森林的決策分類

隨機(jī)森林是一種一個(gè)包含多個(gè)決策樹的分類器,是用隨機(jī)的方法建立一個(gè)森林矛紫,森林里面由很多的決策樹組成牌里,且這些決策樹之間沒有連續(xù)。隨機(jī)森林的算法是由Leo Breiman和Adele Cutle發(fā)展推論出的喳篇。

隨機(jī)森林就是通過集成學(xué)習(xí)的思路將多棵樹集成的一種算法态辛,它的基本單元是決策樹,而它的本質(zhì)是屬于機(jī)器學(xué)習(xí)的一大分支——集成學(xué)習(xí)奏黑。

8.4.1 隨機(jī)森林的特點(diǎn)

1熟史、當(dāng)分類資料集合具有很多資料時(shí),可以產(chǎn)生高準(zhǔn)確度的分類器以故。

2、當(dāng)分類資料集為不平衡的資料集時(shí),隨機(jī)森林可以平衡誤差踪区。

3吊骤、隨機(jī)森林可以計(jì)算出各例中的親近度,在數(shù)據(jù)挖掘白粉、偵測(cè)偏離者及將資料視覺化方面有著重要的作用鸭巴。

4、在大數(shù)據(jù)集上表現(xiàn)良好鹃祖。

5、能夠評(píng)估在分類問題上的各個(gè)特征的重要程度校读。

8.4.2 隨機(jī)森林的構(gòu)造方法

隨機(jī)樹建立由兩部分組成:隨機(jī)采樣和完全分裂祖能。

每棵樹的構(gòu)造方法:

1、用N表示訓(xùn)練例子的個(gè)數(shù)端考,M表示變量的數(shù)目揭厚。

2、用m來表示當(dāng)在一個(gè)結(jié)點(diǎn)上做決定時(shí)會(huì)用到的變量的數(shù)目筛圆。

3裂明、從N個(gè)訓(xùn)練案例中采用可重復(fù)取樣的方式,取樣N次太援,形成一組訓(xùn)練集闽晦,并使用這棵樹來對(duì)剩余變量預(yù)測(cè)其類別,并對(duì)誤差進(jìn)行分析提岔。

4仙蛉、對(duì)于每個(gè)結(jié)點(diǎn),隨機(jī)選擇m個(gè)基于此點(diǎn)上的變量碱蒙。根據(jù)這m個(gè)變量荠瘪,計(jì)算器最佳的分割方式夯巷。

5、對(duì)于森林中的每棵樹都用不采用剪枝技術(shù)哀墓,每棵樹都能完整生長(zhǎng)趁餐。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市后雷,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌吠各,老刑警劉巖臀突,帶你破解...
    沈念sama閱讀 216,324評(píng)論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異贾漏,居然都是意外死亡候学,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,356評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門磕瓷,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人念逞,你說我怎么就攤上這事困食。” “怎么了翎承?”我有些...
    開封第一講書人閱讀 162,328評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵硕盹,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我叨咖,道長(zhǎng)瘩例,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,147評(píng)論 1 292
  • 正文 為了忘掉前任甸各,我火速辦了婚禮垛贤,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘趣倾。我一直安慰自己聘惦,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,160評(píng)論 6 388
  • 文/花漫 我一把揭開白布儒恋。 她就那樣靜靜地躺著善绎,像睡著了一般。 火紅的嫁衣襯著肌膚如雪诫尽。 梳的紋絲不亂的頭發(fā)上禀酱,一...
    開封第一講書人閱讀 51,115評(píng)論 1 296
  • 那天,我揣著相機(jī)與錄音牧嫉,去河邊找鬼剂跟。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的浩聋。 我是一名探鬼主播观蜗,決...
    沈念sama閱讀 40,025評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼衣洁!你這毒婦竟也來了墓捻?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,867評(píng)論 0 274
  • 序言:老撾萬榮一對(duì)情侶失蹤坊夫,失蹤者是張志新(化名)和其女友劉穎砖第,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體环凿,經(jīng)...
    沈念sama閱讀 45,307評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡梧兼,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,528評(píng)論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了智听。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片羽杰。...
    茶點(diǎn)故事閱讀 39,688評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖到推,靈堂內(nèi)的尸體忽然破棺而出考赛,到底是詐尸還是另有隱情,我是刑警寧澤莉测,帶...
    沈念sama閱讀 35,409評(píng)論 5 343
  • 正文 年R本政府宣布颜骤,位于F島的核電站,受9級(jí)特大地震影響捣卤,放射性物質(zhì)發(fā)生泄漏忍抽。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,001評(píng)論 3 325
  • 文/蒙蒙 一董朝、第九天 我趴在偏房一處隱蔽的房頂上張望鸠项。 院中可真熱鬧,春花似錦子姜、人聲如沸锈锤。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,657評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽久免。三九已至,卻和暖如春扭弧,著一層夾襖步出監(jiān)牢的瞬間阎姥,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,811評(píng)論 1 268
  • 我被黑心中介騙來泰國(guó)打工鸽捻, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留呼巴,地道東北人泽腮。 一個(gè)月前我還...
    沈念sama閱讀 47,685評(píng)論 2 368
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像衣赶,于是被迫代替她去往敵國(guó)和親诊赊。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,573評(píng)論 2 353