機器學(xué)習(xí)—提升和自適應(yīng)增強(Boosting和AdaBoost)

boosting是一種集成技術(shù),試圖從多個弱分類器中創(chuàng)建強分類器废菱。通過從訓(xùn)練數(shù)據(jù)構(gòu)建一個模型咖刃,然后創(chuàng)建第二個模型試圖糾正第一個模型中的錯誤。不斷添加模型拗军,直到訓(xùn)練集被完美地預(yù)測或者添加到最大數(shù)量。
AdaBoost是第一個為二分類開發(fā)的真正成功的提升算法》⑶郑現(xiàn)代boosting方法建立在AdaBoost上交掏,最著名的是隨機梯度提升機(stochastic gradient boosting machines)刃鳄。


提升和自適應(yīng)增強(Boosting和AdaBoost)

AdaBoost用于短決策樹盅弛。創(chuàng)建第一棵樹之后叔锐,使用樹在每個訓(xùn)練實例上的性能來得到一個權(quán)重挪鹏,決定下一棵樹對每個訓(xùn)練實例的注意力。
難以預(yù)測的訓(xùn)練數(shù)據(jù)被賦予更多權(quán)重愉烙,而易于預(yù)測的實例被賦予更少的權(quán)重讨盒。模型是一個接一個地順序創(chuàng)建的,每個模型更新訓(xùn)練實例上的權(quán)重返顺,這些權(quán)重影響序列中下一個樹所執(zhí)行的學(xué)習(xí)禀苦。構(gòu)建完所有樹之后创南,將對新數(shù)據(jù)進行預(yù)測伦忠。
因為著重于修正算法的錯誤,所以重要的是提前清洗好數(shù)據(jù)稿辙,去掉異常值昆码。

Adaboost是一種迭代算法,其核心思想是針對同一個訓(xùn)練集訓(xùn)練不同的分類器(弱分類器)邻储,然后把這些弱分類器集合起來赋咽,構(gòu)成一個更強的最終分類器(強分類器)吨娜。

算法簡介

Adaboost是一種迭代算法脓匿,其核心思想是針對同一個訓(xùn)練集訓(xùn)練不同的分類器(弱分類器)宦赠,然后把這些弱分類器集合起來陪毡,構(gòu)成一個更強的最終分類器(強分類器)勾扭。其算法本身是通過改變數(shù)據(jù)分布來實現(xiàn)的毡琉,它根據(jù)每次訓(xùn)練集之中每個樣本的分類是否正確妙色,以及上次的總體分類的準(zhǔn)確率桅滋,來確定每個樣本的權(quán)值身辨。將修改過權(quán)值的新數(shù)據(jù)集送給下層分類器進行訓(xùn)練丐谋,最后將每次訓(xùn)練得到的分類器最后融合起來,作為最后的決策分類器号俐。使用adaboost分類器可以排除一些不必要的訓(xùn)練數(shù)據(jù)特征,并放在關(guān)鍵的訓(xùn)練數(shù)據(jù)上面定庵。

算法應(yīng)用

對adaBoost算法的研究以及應(yīng)用大多集中于分類問題,同時也出現(xiàn)了一些在回歸問題上的應(yīng)用洗贰。就其應(yīng)用adaBoost系列主要解決了: 兩類問題陨倡、多類單標(biāo)簽問題敛滋、多類多標(biāo)簽問題兴革、大類單標(biāo)簽問題绎晃、回歸問題。它用全部的訓(xùn)練樣本進行學(xué)習(xí)庶艾。

應(yīng)用示例

adaboost 是 bosting 的方法之一袁余,bosting就是把若干個分類效果并不好的分類器綜合起來考慮咱揍,會得到一個效果比較好的分類器颖榜。
下圖煤裙,左右兩個決策樹掩完,單個看是效果不怎么好的硼砰,但是把同樣的數(shù)據(jù)投入進去且蓬,把兩個結(jié)果加起來考慮题翰,就會增加可信度恶阴。



adaboost 的栗子豹障,手寫識別中冯事,在畫板上可以抓取到很多 features沼填,例如 始點的方向桅咆,始點和終點的距離等等坞笙。



training 的時候岩饼,會得到每個 feature 的 weight薛夜,例如 2 和 3 的開頭部分很像籍茧,這個 feature 對分類起到的作用很小梯澜,它的權(quán)重也就會較小寞冯。

而這個 alpha 角 就具有很強的識別性晚伙,這個 feature 的權(quán)重就會較大吮龄,最后的預(yù)測結(jié)果是綜合考慮這些 feature 的結(jié)果咆疗。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末漓帚,一起剝皮案震驚了整個濱河市午磁,隨后出現(xiàn)的幾起案子尝抖,更是在濱河造成了極大的恐慌,老刑警劉巖昧辽,帶你破解...
    沈念sama閱讀 216,591評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異搅荞,居然都是意外死亡红氯,警方通過查閱死者的電腦和手機取具,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,448評論 3 392
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來暇检,“玉大人产阱,你說我怎么就攤上這事块仆」沟牛” “怎么了悔据?”我有些...
    開封第一講書人閱讀 162,823評論 0 353
  • 文/不壞的土叔 我叫張陵庄敛,是天一觀的道長科汗。 經(jīng)常有香客問我藻烤,道長,這世上最難降的妖魔是什么怖亭? 我笑而不...
    開封第一講書人閱讀 58,204評論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮坤检,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘早歇。我一直安慰自己,他們只是感情好箭跳,可當(dāng)我...
    茶點故事閱讀 67,228評論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著谱姓,像睡著了一般拯刁。 火紅的嫁衣襯著肌膚如雪逝段。 梳的紋絲不亂的頭發(fā)上垛玻,一...
    開封第一講書人閱讀 51,190評論 1 299
  • 那天奶躯,我揣著相機與錄音帚桩,去河邊找鬼。 笑死账嚎,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的儡蔓。 我是一名探鬼主播,決...
    沈念sama閱讀 40,078評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼喂江,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了获询?” 一聲冷哼從身側(cè)響起涨岁,我...
    開封第一講書人閱讀 38,923評論 0 274
  • 序言:老撾萬榮一對情侶失蹤吉嚣,失蹤者是張志新(化名)和其女友劉穎梢薪,沒想到半個月后尝哆,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體秉撇,經(jīng)...
    沈念sama閱讀 45,334評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡秋泄,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,550評論 2 333
  • 正文 我和宋清朗相戀三年琐馆,在試婚紗的時候發(fā)現(xiàn)自己被綠了印衔。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片啡捶。...
    茶點故事閱讀 39,727評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡奸焙,死狀恐怖瞎暑,靈堂內(nèi)的尸體忽然破棺而出与帆,到底是詐尸還是另有隱情了赌,我是刑警寧澤,帶...
    沈念sama閱讀 35,428評論 5 343
  • 正文 年R本政府宣布勿她,位于F島的核電站,受9級特大地震影響阵翎,放射性物質(zhì)發(fā)生泄漏之剧。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,022評論 3 326
  • 文/蒙蒙 一砍聊、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧玻蝌,春花似錦蟹肘、人聲如沸俯树。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,672評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽阳欲。三九已至,卻和暖如春胸完,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背翘贮。 一陣腳步聲響...
    開封第一講書人閱讀 32,826評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留狸页,地道東北人锨能。 一個月前我還...
    沈念sama閱讀 47,734評論 2 368
  • 正文 我出身青樓芍耘,卻偏偏與公主長得像址遇,于是被迫代替她去往敵國和親斋竞。 傳聞我的和親對象是個殘疾皇子倔约,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,619評論 2 354