集成學習

本次以及后續(xù)幾次博客將陸續(xù)記錄關于集成學習模型的相關知識點。

Ensemble概述

集成學習 就是構造若干模型并用它們的(加權預測/投票)值用于對新樣本的預測。類似于多個決策者進行同一個決策责循。通常來說集成的效果要好于單個模型,當特征,數(shù)據(jù)陨溅,單個模型做到瓶頸時,多模型帶來的提升很明顯绍在。

衡量集成學習效果的指標為:
 1)準確性
    每個基學習器需要有一定的學習能力门扇,也就是其準確性要有所保證,一般在0.5以上
 2)多樣性
    基學習器之間需要有一定的差異偿渡,這樣集成的效果才會好

類別

目前集成學習大致分為4種:
1)bagging
基學習器之間不存在強依賴性臼寄,通過有放回地重采樣得到多組訓練集,然后在不同訓練集上訓練得到一個基學習器
2)boosting
基學習器之間存在強依賴性溜宽,通過對上一個基學習器在數(shù)據(jù)集上表現(xiàn)來修改樣本權重吉拳,使得下一個基學習器更加關注被錯分的樣本。
3)Stacking
通過K-floder訓練不同的基模型适揉,以基模型的預測輸出作為新的特征留攒,重復多倫
4)Blending
與stacking有點相似,不同在于blending中選取一個固定的驗證集嫉嘀,我們事先在訓練集上訓練n個基模型炼邀,然后同時對驗證集驗證,再投票或加權平均最終確定其預測值為多少剪侮。


集成學習為何有效

首先我們需要回歸到學習問題的本質:假設樣本從分布p(x, y)中采樣得到拭宁,我們的目標是從所有可能的函數(shù)空間 H 中找到最佳的假設函數(shù)h(x),來使得我們的損失函數(shù)的期望值最小。
那么從誤差減少這一本質來看集成學習杰标,可以從一下三個方面進行解釋:

  1. 模型誤差
    ○ 由于我們通常在子空間搜索兵怯,而不是整個空間H中搜索,因此會存在模型誤差在旱。
    ○ 因為假設空間是人為規(guī)定的摇零,而實際中很多時候我們的實際目標假設不在原始的假設空間中,那么如果我們?nèi)藶榈刂付◣讉€假設空間桶蝎,并通過模型將其進行集成驻仅,一定程度上可以緩解模型誤差。
  2. 統(tǒng)計誤差
    ○ 對于一般的訓練任務而言登渣,都是通過樣本采樣來極小化誤差噪服,往往需要搜索很大的假設空間,但是訓練集的樣本數(shù)不足以支撐模型能夠精確地學習到目標假設胜茧,這個時候學習到的就是僅僅是滿足訓練集的假設粘优,也就是所謂的過擬合,因此呻顽,通過將多個學習器學習到的假設進行結合雹顺,一定程度上可以緩解統(tǒng)計誤差。
  3. 優(yōu)化誤差
    ○ 一般來說廊遍,學習到一個最優(yōu)的NN模型或是DT模型已經(jīng)被證明是一個NP-hard問題嬉愧,因為優(yōu)化過程往往會陷入局部最優(yōu)解,因此喉前,多模型集成一定程度上更加逼近真實解没酣。

轉載注明:http://www.reibang.com/p/7cd64d304500

最后編輯于
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市卵迂,隨后出現(xiàn)的幾起案子裕便,更是在濱河造成了極大的恐慌,老刑警劉巖见咒,帶你破解...
    沈念sama閱讀 219,490評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件偿衰,死亡現(xiàn)場離奇詭異,居然都是意外死亡改览,警方通過查閱死者的電腦和手機哎垦,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,581評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來恃疯,“玉大人漏设,你說我怎么就攤上這事〗裢” “怎么了郑口?”我有些...
    開封第一講書人閱讀 165,830評論 0 356
  • 文/不壞的土叔 我叫張陵鸳碧,是天一觀的道長。 經(jīng)常有香客問我犬性,道長瞻离,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,957評論 1 295
  • 正文 為了忘掉前任乒裆,我火速辦了婚禮套利,結果婚禮上,老公的妹妹穿的比我還像新娘鹤耍。我一直安慰自己肉迫,他們只是感情好,可當我...
    茶點故事閱讀 67,974評論 6 393
  • 文/花漫 我一把揭開白布稿黄。 她就那樣靜靜地躺著喊衫,像睡著了一般。 火紅的嫁衣襯著肌膚如雪杆怕。 梳的紋絲不亂的頭發(fā)上族购,一...
    開封第一講書人閱讀 51,754評論 1 307
  • 那天,我揣著相機與錄音陵珍,去河邊找鬼寝杖。 笑死,一個胖子當著我的面吹牛互纯,可吹牛的內(nèi)容都是我干的瑟幕。 我是一名探鬼主播,決...
    沈念sama閱讀 40,464評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼伟姐,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了亿卤?” 一聲冷哼從身側響起愤兵,我...
    開封第一講書人閱讀 39,357評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎排吴,沒想到半個月后秆乳,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,847評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡钻哩,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,995評論 3 338
  • 正文 我和宋清朗相戀三年屹堰,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片街氢。...
    茶點故事閱讀 40,137評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡扯键,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出珊肃,到底是詐尸還是另有隱情荣刑,我是刑警寧澤馅笙,帶...
    沈念sama閱讀 35,819評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站厉亏,受9級特大地震影響董习,放射性物質發(fā)生泄漏。R本人自食惡果不足惜爱只,卻給世界環(huán)境...
    茶點故事閱讀 41,482評論 3 331
  • 文/蒙蒙 一皿淋、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧恬试,春花似錦窝趣、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,023評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至畦粮,卻和暖如春散址,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背宣赔。 一陣腳步聲響...
    開封第一講書人閱讀 33,149評論 1 272
  • 我被黑心中介騙來泰國打工预麸, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人儒将。 一個月前我還...
    沈念sama閱讀 48,409評論 3 373
  • 正文 我出身青樓吏祸,卻偏偏與公主長得像,于是被迫代替她去往敵國和親钩蚊。 傳聞我的和親對象是個殘疾皇子贡翘,可洞房花燭夜當晚...
    茶點故事閱讀 45,086評論 2 355