Bagging和Boosting 概念及區(qū)別

Bagging和Boosting都是將已有的分類或回歸算法通過(guò)一定方式組合起來(lái)囚聚,形成一個(gè)性能更加強(qiáng)大的分類器俯渤,更準(zhǔn)確的說(shuō)這是一種分類算法的組裝方法歧杏。即將弱分類器組裝成強(qiáng)分類器的方法砰碴。

首先介紹Bootstraping九榔,即自助法:它是一種有放回的抽樣方法(可能抽到重復(fù)的樣本)兽埃。

1侥钳、Bagging (bootstrap aggregating)

Bagging即套袋法,其算法過(guò)程如下:

A)從原始樣本集中抽取訓(xùn)練集柄错。每輪從原始樣本集中使用Bootstraping的方法抽取n個(gè)訓(xùn)練樣本(在訓(xùn)練集中舷夺,有些樣本可能被多次抽取到苦酱,而有些樣本可能一次都沒(méi)有被抽中)。共進(jìn)行k輪抽取给猾,得到k個(gè)訓(xùn)練集疫萤。(k個(gè)訓(xùn)練集之間是相互獨(dú)立的)

B)每次使用一個(gè)訓(xùn)練集得到一個(gè)模型,k個(gè)訓(xùn)練集共得到k個(gè)模型敢伸。(注:這里并沒(méi)有具體的分類算法或回歸方法扯饶,我們可以根據(jù)具體問(wèn)題采用不同的分類或回歸方法,如決策樹(shù)池颈、感知器等)

C)對(duì)分類問(wèn)題:將上步得到的k個(gè)模型采用投票的方式得到分類結(jié)果尾序;對(duì)回歸問(wèn)題,計(jì)算上述模型的均值作為最后的結(jié)果躯砰。(所有模型的重要性相同)

2每币、Boosting

其主要思想是將弱分類器組裝成一個(gè)強(qiáng)分類器。在PAC(概率近似正確)學(xué)習(xí)框架下琢歇,則一定可以將弱分類器組裝成一個(gè)強(qiáng)分類器兰怠。

關(guān)于Boosting的兩個(gè)核心問(wèn)題:

1)在每一輪如何改變訓(xùn)練數(shù)據(jù)的權(quán)值或概率分布?

通過(guò)提高那些在前一輪被弱分類器分錯(cuò)樣例的權(quán)值李茫,減小前一輪分對(duì)樣例的權(quán)值痕慢,來(lái)使得分類器對(duì)誤分的數(shù)據(jù)有較好的效果。

2)通過(guò)什么方式來(lái)組合弱分類器涌矢?

通過(guò)加法模型將弱分類器進(jìn)行線性組合掖举,比如AdaBoost通過(guò)加權(quán)多數(shù)表決的方式,即增大錯(cuò)誤率小的分類器的權(quán)值娜庇,同時(shí)減小錯(cuò)誤率較大的分類器的權(quán)值塔次。

而提升樹(shù)通過(guò)擬合殘差的方式逐步減小殘差,將每一步生成的模型疊加得到最終模型名秀。

3励负、Bagging,Boosting二者之間的區(qū)別

Bagging和Boosting的區(qū)別:

1)樣本選擇上:

Bagging:訓(xùn)練集是在原始集中有放回選取的匕得,從原始集中選出的各輪訓(xùn)練集之間是獨(dú)立的继榆。

Boosting:每一輪的訓(xùn)練集不變,只是訓(xùn)練集中每個(gè)樣例在分類器中的權(quán)重發(fā)生變化汁掠。而權(quán)值是根據(jù)上一輪的分類結(jié)果進(jìn)行調(diào)整略吨。

2)樣例權(quán)重:

Bagging:使用均勻取樣,每個(gè)樣例的權(quán)重相等

Boosting:根據(jù)錯(cuò)誤率不斷調(diào)整樣例的權(quán)值考阱,錯(cuò)誤率越大則權(quán)重越大翠忠。

3)預(yù)測(cè)函數(shù):

Bagging:所有預(yù)測(cè)函數(shù)的權(quán)重相等。

Boosting:每個(gè)弱分類器都有相應(yīng)的權(quán)重乞榨,對(duì)于分類誤差小的分類器會(huì)有更大的權(quán)重秽之。

4)并行計(jì)算:

Bagging:各個(gè)預(yù)測(cè)函數(shù)可以并行生成

Boosting:各個(gè)預(yù)測(cè)函數(shù)只能順序生成当娱,因?yàn)楹笠粋€(gè)模型參數(shù)需要前一輪模型的結(jié)果。

4考榨、總結(jié)

這兩種方法都是把若干個(gè)分類器整合為一個(gè)分類器的方法跨细,只是整合的方式不一樣,最終得到不一樣的效果河质,將不同的分類算法套入到此類算法框架中一定程度上會(huì)提高了原單一分類器的分類效果冀惭,但是也增大了計(jì)算量。

下面是將決策樹(shù)與這些算法框架進(jìn)行結(jié)合所得到的新的算法:

1)Bagging + 決策樹(shù) = 隨機(jī)森林

2)AdaBoost + 決策樹(shù) = 提升樹(shù)

3)Gradient Boosting + 決策樹(shù) = GBDT

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末愤诱,一起剝皮案震驚了整個(gè)濱河市云头,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌淫半,老刑警劉巖溃槐,帶你破解...
    沈念sama閱讀 221,695評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異科吭,居然都是意外死亡昏滴,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,569評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門对人,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)谣殊,“玉大人,你說(shuō)我怎么就攤上這事牺弄∫黾福” “怎么了?”我有些...
    開(kāi)封第一講書人閱讀 168,130評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵势告,是天一觀的道長(zhǎng)蛇捌。 經(jīng)常有香客問(wèn)我,道長(zhǎng)咱台,這世上最難降的妖魔是什么络拌? 我笑而不...
    開(kāi)封第一講書人閱讀 59,648評(píng)論 1 297
  • 正文 為了忘掉前任,我火速辦了婚禮回溺,結(jié)果婚禮上春贸,老公的妹妹穿的比我還像新娘。我一直安慰自己遗遵,他們只是感情好萍恕,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,655評(píng)論 6 397
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著瓮恭,像睡著了一般雄坪。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上屯蹦,一...
    開(kāi)封第一講書人閱讀 52,268評(píng)論 1 309
  • 那天维哈,我揣著相機(jī)與錄音,去河邊找鬼登澜。 笑死阔挠,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的脑蠕。 我是一名探鬼主播购撼,決...
    沈念sama閱讀 40,835評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼谴仙!你這毒婦竟也來(lái)了迂求?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書人閱讀 39,740評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤晃跺,失蹤者是張志新(化名)和其女友劉穎揩局,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體掀虎,經(jīng)...
    沈念sama閱讀 46,286評(píng)論 1 318
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡凌盯,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,375評(píng)論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了烹玉。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片驰怎。...
    茶點(diǎn)故事閱讀 40,505評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖二打,靈堂內(nèi)的尸體忽然破棺而出县忌,到底是詐尸還是另有隱情,我是刑警寧澤继效,帶...
    沈念sama閱讀 36,185評(píng)論 5 350
  • 正文 年R本政府宣布症杏,位于F島的核電站,受9級(jí)特大地震影響莲趣,放射性物質(zhì)發(fā)生泄漏鸳慈。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,873評(píng)論 3 333
  • 文/蒙蒙 一喧伞、第九天 我趴在偏房一處隱蔽的房頂上張望走芋。 院中可真熱鬧,春花似錦潘鲫、人聲如沸翁逞。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 32,357評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)挖函。三九已至,卻和暖如春浊竟,著一層夾襖步出監(jiān)牢的瞬間怨喘,已是汗流浹背津畸。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 33,466評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留必怜,地道東北人肉拓。 一個(gè)月前我還...
    沈念sama閱讀 48,921評(píng)論 3 376
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像梳庆,于是被迫代替她去往敵國(guó)和親暖途。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,515評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容