Adaboost算法筆記

背后的思想：對(duì)于一個(gè)復(fù)雜的任務(wù)，講多個(gè)專家的判定進(jìn)行適當(dāng)?shù)木C合得出的判斷性芬，要比其中任何一個(gè)專家單獨(dú)的判斷好峡眶。(三個(gè)臭皮匠賽過諸葛亮)

再概率近似正確學(xué)習(xí)的框架中：

強(qiáng)可學(xué)習(xí)：存在一個(gè)多項(xiàng)式的學(xué)習(xí)算法，并且它的正確率很高
弱可學(xué)習(xí)：存在一個(gè)多項(xiàng)式的學(xué)習(xí)算法植锉，它的正確率比隨機(jī)猜想好
強(qiáng)可學(xué)習(xí)和弱可學(xué)習(xí)等價(jià)

找到弱可學(xué)習(xí)的方法比較容易辫樱，最出名的就是 Adaboost算法。

對(duì)于提示算法處理分類問題：

每一輪如何改變數(shù)據(jù)的權(quán)值或者概率分布
如何將弱分類器組合成一個(gè)強(qiáng)分類器

Adaboost的套路是：1. 訓(xùn)練的時(shí)候提高弱分類器錯(cuò)誤分類樣本的權(quán)值俊庇，這樣可以更加關(guān)注沒有正確分類的數(shù)據(jù)狮暑；2. 采取加權(quán)多數(shù)表決的方法，加大分類錯(cuò)誤率小的弱分類器的權(quán)值暇赤，使其再表決中起較大的作用。

算法流程：

image.png

AdaBoost 算法的解釋：AdaBoost算法的模型是加法模型宵凌、損失函數(shù)為指數(shù)函數(shù)鞋囊、學(xué)習(xí)算法為前進(jìn)分步算法時(shí)的二類分類學(xué)習(xí)方法。

提升樹算法---以分類樹或者回歸樹為基本分類器的提升方法瞎惫，其被認(rèn)為是統(tǒng)計(jì)學(xué)習(xí)中性能最好的方法之一溜腐。 [加法模型(基函數(shù)的線性組合) + 前向分布算法]

image.png

以決策樹為基函數(shù)的提升方法稱為提升樹(boosting tree). 對(duì)分類問題決策樹是二叉樹译株，對(duì)于回歸問題決策樹是二叉回歸樹。

算法簡(jiǎn)介

首先確定初始提升書f₀(x)=0, 第m步模型為：

image.png

梯度提升算法

Freidman提出了梯度提升算法(Gradient Boosting)挺益，其關(guān)鍵是利用損失函數(shù)的負(fù)梯度再當(dāng)前模型的值作為回歸問題提升樹算法中的殘差的近似值歉糜，擬合一個(gè)回歸樹。

image.png

未完待續(xù)...

最后編輯于：2017.12.10 05:08:32

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末望众，一起剝皮案震驚了整個(gè)濱河市匪补，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌烂翰，老刑警劉巖夯缺，帶你破解...
沈念sama閱讀 218,451評(píng)論 6贊 506
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異甘耿，居然都是意外死亡踊兜，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,172評(píng)論 3贊 394
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門佳恬，熙熙樓的掌柜王于貴愁眉苦臉地迎上來捏境，“玉大人，你說我怎么就攤上這事毁葱〉嫜裕” “怎么了？”我有些...
開封第一講書人閱讀 164,782評(píng)論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵头谜，是天一觀的道長(zhǎng)骏掀。經(jīng)常有香客問我，道長(zhǎng)柱告，這世上最難降的妖魔是什么截驮？我笑而不...
開封第一講書人閱讀 58,709評(píng)論 1贊 294
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮际度，結(jié)果婚禮上葵袭，老公的妹妹穿的比我還像新娘。我一直安慰自己乖菱，他們只是感情好坡锡，可當(dāng)我...
茶點(diǎn)故事閱讀 67,733評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著窒所，像睡著了一般鹉勒。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上吵取，一...
開封第一講書人閱讀 51,578評(píng)論 1贊 305
城市分裂傳說
那天禽额，我揣著相機(jī)與錄音，去河邊找鬼。笑死脯倒，一個(gè)胖子當(dāng)著我的面吹牛实辑，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播藻丢，決...
沈念sama閱讀 40,320評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼剪撬，長(zhǎng)吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來了悠反？” 一聲冷哼從身側(cè)響起残黑，我...
開封第一講書人閱讀 39,241評(píng)論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎问慎，沒想到半個(gè)月后萍摊，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,686評(píng)論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡如叼，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,878評(píng)論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年冰木，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片笼恰。...
茶點(diǎn)故事閱讀 39,992評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡踊沸，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出社证，到底是詐尸還是另有隱情逼龟，我是刑警寧澤，帶...
沈念sama閱讀 35,715評(píng)論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布追葡，位于F島的核電站腺律，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏宜肉。R本人自食惡果不足惜匀钧，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,336評(píng)論 3贊 330
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望谬返。院中可真熱鬧之斯，春花似錦、人聲如沸遣铝。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,912評(píng)論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽酿炸。三九已至瘫絮，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間填硕，已是汗流浹背麦萤。一陣腳步聲響...
開封第一講書人閱讀 33,040評(píng)論 1贊 270
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人频鉴。一個(gè)月前我還...
沈念sama閱讀 48,173評(píng)論 3贊 370
代替公主和親
正文我出身青樓，卻偏偏與公主長(zhǎng)得像恋拍，于是被迫代替她去往敵國和親垛孔。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,947評(píng)論 2贊 355

Adaboost算法筆記

背后的思想：對(duì)于一個(gè)復(fù)雜的任務(wù)，講多個(gè)專家的判定進(jìn)行適當(dāng)?shù)木C合得出的判斷性芬，要比其中任何一個(gè)專家單獨(dú)的判斷好峡眶。(三個(gè)臭皮匠賽過諸葛亮)

再概率近似正確學(xué)習(xí)的框架中：

找到弱可學(xué)習(xí)的方法比較容易辫樱，最出名的就是 Adaboost算法。

對(duì)于提示算法處理分類問題：

算法流程：

AdaBoost 算法的解釋：AdaBoost算法的模型是加法模型宵凌、損失函數(shù)為指數(shù)函數(shù)鞋囊、學(xué)習(xí)算法為前進(jìn)分步算法時(shí)的二類分類學(xué)習(xí)方法。

提升樹算法---以分類樹或者回歸樹為基本分類器的提升方法瞎惫，其被認(rèn)為是統(tǒng)計(jì)學(xué)習(xí)中性能最好的方法之一溜腐。 [加法模型(基函數(shù)的線性組合) + 前向分布算法]

以決策樹為基函數(shù)的提升方法稱為提升樹(boosting tree). 對(duì)分類問題決策樹是二叉樹译株，對(duì)于回歸問題決策樹是二叉回歸樹。

算法簡(jiǎn)介

首先確定初始提升書f0(x)=0, 第m步模型為：

梯度提升算法

Freidman提出了梯度提升算法(Gradient Boosting)挺益， 其關(guān)鍵是利用損失函數(shù)的負(fù)梯度再當(dāng)前模型的值作為回歸問題提升樹算法中的殘差的近似值歉糜，擬合一個(gè)回歸樹。

未完待續(xù)...

推薦閱讀更多精彩內(nèi)容

首先確定初始提升書f₀(x)=0, 第m步模型為：

Freidman提出了梯度提升算法(Gradient Boosting)挺益，其關(guān)鍵是利用損失函數(shù)的負(fù)梯度再當(dāng)前模型的值作為回歸問題提升樹算法中的殘差的近似值歉糜，擬合一個(gè)回歸樹。