Python3機(jī)器學(xué)習(xí)實踐:集成學(xué)習(xí)

Ensemble.png
這個時代,如果你覺得自己不夠強(qiáng)椿猎,那就找?guī)讉€人聯(lián)合起來。集成學(xué)習(xí)亦如此刹孔。 
image

集成學(xué)習(xí)是一種將幾種機(jī)器學(xué)習(xí)模型組合成一個模型的元算法(meta-algorithm)泳秀,以減小方差(例如:Bagging)迅栅,偏差(例如:Boosting)殊校,或者改進(jìn)預(yù)測(例如:Stacking、Blending)读存。

  • 集成方法分類
  1. 串行集成方法:多個模型順序生成为流。此方法是利用模型之間的依賴關(guān)系。算法可以通過提高被分錯樣本的權(quán)重來提高性能让簿。具體參見Boosting敬察。

  2. 并行集成方法:多個模型并行生成。此方法是利用模型之間的獨立性尔当,因為可以通過平均來降低誤差莲祸。具體參見Bagging。

  3. 樹行集成方法:這種方法可分多層椭迎,每一層可包括多種模型锐帜,下層的訓(xùn)練數(shù)據(jù)集為上一層的訓(xùn)練結(jié)果,類似于樹畜号。具體參見Stacking缴阎、Blending。

image

一简软、Bagging

Bagging:也就是自舉匯聚法(Bootstrap Aggregating)蛮拔,步驟如下:

  1. 在包含N個樣本的數(shù)據(jù)集中采用有放回的抽樣方式隨機(jī)抽取一定數(shù)量(可以為N)的樣本,構(gòu)成一個數(shù)據(jù)集痹升;

  2. 按照步驟1中的方式得到M個數(shù)據(jù)集建炫;

  3. 利用機(jī)器學(xué)習(xí)的方法(例如:SVM,決策樹疼蛾,神經(jīng)網(wǎng)絡(luò)……)對得到的M個數(shù)據(jù)集肛跌,訓(xùn)練出M個弱模型(比隨機(jī)模型效果好);

  4. 集成M個弱模型的結(jié)果作為最終結(jié)果察郁;

Bagging就是通過M個弱模型的結(jié)果衍慎,通過并行集成的方式來獲得最終結(jié)果。因為M個數(shù)據(jù)集是相互獨立的绳锅,因此這M個弱模型之間也是相互獨立的西饵,在最終的集成結(jié)果時,每個模型的權(quán)重是一樣的鳞芙。這是和下文的Boosting所不同的眷柔。

  • Bagging集成方式

  • 回歸問題
    M個模型結(jié)果的均值;

  • 分類問題
    對M個模型的結(jié)果進(jìn)行投票決定原朝,票數(shù)多的作為結(jié)果驯嘱;票數(shù)一樣,隨機(jī)決定喳坠;

  • 代表方法
    隨機(jī)森林(Random Forest)

image

二鞠评、Boosting
Boosting步驟如下:

  1. 每一次都根據(jù)上一次訓(xùn)練得到的模型結(jié)果,調(diào)整數(shù)據(jù)集樣本分布壕鹉,然后再生成下一個模型剃幌;
  2. 直到生成M個模型;
  3. 根據(jù)M個模型的結(jié)果集成得到最終的結(jié)果聋涨;
  • Boosting集成方式
    每個模型的重要度作為每個模型結(jié)果的權(quán)重,然后加權(quán)計算得出結(jié)果负乡‰拱祝可以看出Boosting中生成多個模型的方式并不是和Bagging一樣并行生成,而是串行生成抖棘,因此也決定了多個模型結(jié)果的集成是串行集成,也就是每個模型的結(jié)果權(quán)重并不是一樣的茂腥。如何來調(diào)整樣本分布以及計算模型的重要度,不同方法有不同的定義切省,詳情參見具體方法最岗。

  • 代表方法
    AdaBoost
    GBDT
    XGBoost
    LightGBM
    CatBoost

image

三、Stacking
Stacking步驟如下:
將訓(xùn)練好的所有基模型對整個訓(xùn)練集進(jìn)行預(yù)測朝捆,第j個基模型對第i個訓(xùn)練樣本的預(yù)測值將作為新的訓(xùn)練集中第i個樣本的第j個特征值般渡,最后基于新的訓(xùn)練集進(jìn)行訓(xùn)練。同理右蹦,預(yù)測的過程也要先經(jīng)過所有基模型的預(yù)測形成新的測試集诊杆,最后再對測試集進(jìn)行預(yù)測。

image

四何陆、Blending
Blending步驟如下:
原始訓(xùn)練數(shù)據(jù)集劃分為訓(xùn)練數(shù)據(jù)集和驗證數(shù)據(jù)集晨汹,針對訓(xùn)練數(shù)據(jù)集訓(xùn)練多個模型,每個模型針對驗證數(shù)據(jù)集的結(jié)果構(gòu)成新的訓(xùn)練數(shù)據(jù)集贷盲,每個模型針對預(yù)測數(shù)據(jù)集的結(jié)果構(gòu)成新的預(yù)測數(shù)據(jù)集淘这。然后針對新的訓(xùn)練數(shù)據(jù)集訓(xùn)練模型,訓(xùn)練完成后巩剖,得到的模型對新的預(yù)測數(shù)據(jù)集的結(jié)果作為最終的結(jié)果铝穷。

image

方法介紹、實例佳魔、代碼隨機(jī)森林曙聂、AdaBoost、GBDT鞠鲜、XGBoost宁脊、LightGBM,CatBoost贤姆,Stacking榆苞,Blending。掃描下方二維碼或者微信公眾號直接搜索”Python范兒“霞捡,關(guān)注微信公眾號pythonfan坐漏, 獲取更多實例和代碼。

pythonfan.jpg

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市赊琳,隨后出現(xiàn)的幾起案子街夭,更是在濱河造成了極大的恐慌,老刑警劉巖慨畸,帶你破解...
    沈念sama閱讀 221,430評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件莱坎,死亡現(xiàn)場離奇詭異衣式,居然都是意外死亡寸士,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,406評論 3 398
  • 文/潘曉璐 我一進(jìn)店門碴卧,熙熙樓的掌柜王于貴愁眉苦臉地迎上來弱卡,“玉大人,你說我怎么就攤上這事住册∩舨” “怎么了?”我有些...
    開封第一講書人閱讀 167,834評論 0 360
  • 文/不壞的土叔 我叫張陵荧飞,是天一觀的道長凡人。 經(jīng)常有香客問我,道長叹阔,這世上最難降的妖魔是什么挠轴? 我笑而不...
    開封第一講書人閱讀 59,543評論 1 296
  • 正文 為了忘掉前任,我火速辦了婚禮耳幢,結(jié)果婚禮上岸晦,老公的妹妹穿的比我還像新娘。我一直安慰自己睛藻,他們只是感情好启上,可當(dāng)我...
    茶點故事閱讀 68,547評論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著店印,像睡著了一般冈在。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上按摘,一...
    開封第一講書人閱讀 52,196評論 1 308
  • 那天包券,我揣著相機(jī)與錄音,去河邊找鬼院峡。 笑死兴使,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的照激。 我是一名探鬼主播发魄,決...
    沈念sama閱讀 40,776評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了励幼?” 一聲冷哼從身側(cè)響起汰寓,我...
    開封第一講書人閱讀 39,671評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎苹粟,沒想到半個月后有滑,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,221評論 1 320
  • 正文 獨居荒郊野嶺守林人離奇死亡嵌削,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,303評論 3 340
  • 正文 我和宋清朗相戀三年毛好,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片苛秕。...
    茶點故事閱讀 40,444評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡肌访,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出艇劫,到底是詐尸還是另有隱情吼驶,我是刑警寧澤,帶...
    沈念sama閱讀 36,134評論 5 350
  • 正文 年R本政府宣布店煞,位于F島的核電站蟹演,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏顷蟀。R本人自食惡果不足惜酒请,卻給世界環(huán)境...
    茶點故事閱讀 41,810評論 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望衩椒。 院中可真熱鬧蚌父,春花似錦、人聲如沸毛萌。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,285評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽阁将。三九已至膏秫,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間做盅,已是汗流浹背缤削。 一陣腳步聲響...
    開封第一講書人閱讀 33,399評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留吹榴,地道東北人亭敢。 一個月前我還...
    沈念sama閱讀 48,837評論 3 376
  • 正文 我出身青樓,卻偏偏與公主長得像图筹,于是被迫代替她去往敵國和親帅刀。 傳聞我的和親對象是個殘疾皇子让腹,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,455評論 2 359

推薦閱讀更多精彩內(nèi)容