Python3機(jī)器學(xué)習(xí)實踐：集成學(xué)習(xí)

Ensemble.png

這個時代，如果你覺得自己不夠強(qiáng)椿猎，那就找?guī)讉€人聯(lián)合起來。集成學(xué)習(xí)亦如此刹孔。

image

集成學(xué)習(xí)是一種將幾種機(jī)器學(xué)習(xí)模型組合成一個模型的元算法(meta-algorithm)泳秀，以減小方差(例如：Bagging)迅栅，偏差(例如：Boosting)殊校，或者改進(jìn)預(yù)測(例如：Stacking、Blending)读存。

集成方法分類

串行集成方法：多個模型順序生成为流。此方法是利用模型之間的依賴關(guān)系。算法可以通過提高被分錯樣本的權(quán)重來提高性能让簿。具體參見Boosting敬察。
并行集成方法：多個模型并行生成。此方法是利用模型之間的獨立性尔当，因為可以通過平均來降低誤差莲祸。具體參見Bagging。
樹行集成方法：這種方法可分多層椭迎，每一層可包括多種模型锐帜，下層的訓(xùn)練數(shù)據(jù)集為上一層的訓(xùn)練結(jié)果，類似于樹畜号。具體參見Stacking缴阎、Blending。

image

一简软、Bagging

Bagging：也就是自舉匯聚法(Bootstrap Aggregating)蛮拔，步驟如下：

在包含N個樣本的數(shù)據(jù)集中采用有放回的抽樣方式隨機(jī)抽取一定數(shù)量(可以為N)的樣本，構(gòu)成一個數(shù)據(jù)集痹升；
按照步驟1中的方式得到M個數(shù)據(jù)集建炫；
利用機(jī)器學(xué)習(xí)的方法(例如：SVM，決策樹疼蛾，神經(jīng)網(wǎng)絡(luò)……)對得到的M個數(shù)據(jù)集肛跌，訓(xùn)練出M個弱模型(比隨機(jī)模型效果好)；
集成M個弱模型的結(jié)果作為最終結(jié)果察郁；

Bagging就是通過M個弱模型的結(jié)果衍慎，通過并行集成的方式來獲得最終結(jié)果。因為M個數(shù)據(jù)集是相互獨立的绳锅，因此這M個弱模型之間也是相互獨立的西饵，在最終的集成結(jié)果時，每個模型的權(quán)重是一樣的鳞芙。這是和下文的Boosting所不同的眷柔。

Bagging集成方式
回歸問題
M個模型結(jié)果的均值；
分類問題
對M個模型的結(jié)果進(jìn)行投票決定原朝，票數(shù)多的作為結(jié)果驯嘱；票數(shù)一樣，隨機(jī)決定喳坠；
代表方法
隨機(jī)森林(Random Forest)

image

二鞠评、Boosting
Boosting步驟如下：

每一次都根據(jù)上一次訓(xùn)練得到的模型結(jié)果，調(diào)整數(shù)據(jù)集樣本分布壕鹉，然后再生成下一個模型剃幌；
直到生成Ｍ個模型;
根據(jù)Ｍ個模型的結(jié)果集成得到最終的結(jié)果聋涨；

Boosting集成方式
每個模型的重要度作為每個模型結(jié)果的權(quán)重，然后加權(quán)計算得出結(jié)果负乡‰拱祝可以看出Boosting中生成多個模型的方式并不是和Bagging一樣并行生成，而是串行生成抖棘，因此也決定了多個模型結(jié)果的集成是串行集成,也就是每個模型的結(jié)果權(quán)重并不是一樣的茂腥。如何來調(diào)整樣本分布以及計算模型的重要度，不同方法有不同的定義切省，詳情參見具體方法最岗。
代表方法
AdaBoost
GBDT
XGBoost
LightGBM
CatBoost

image

三、Stacking
Stacking步驟如下：
將訓(xùn)練好的所有基模型對整個訓(xùn)練集進(jìn)行預(yù)測朝捆，第j個基模型對第i個訓(xùn)練樣本的預(yù)測值將作為新的訓(xùn)練集中第i個樣本的第j個特征值般渡，最后基于新的訓(xùn)練集進(jìn)行訓(xùn)練。同理右蹦，預(yù)測的過程也要先經(jīng)過所有基模型的預(yù)測形成新的測試集诊杆，最后再對測試集進(jìn)行預(yù)測。

代表方法
Stacking

image

四何陆、Blending
Blending步驟如下：
原始訓(xùn)練數(shù)據(jù)集劃分為訓(xùn)練數(shù)據(jù)集和驗證數(shù)據(jù)集晨汹，針對訓(xùn)練數(shù)據(jù)集訓(xùn)練多個模型，每個模型針對驗證數(shù)據(jù)集的結(jié)果構(gòu)成新的訓(xùn)練數(shù)據(jù)集贷盲，每個模型針對預(yù)測數(shù)據(jù)集的結(jié)果構(gòu)成新的預(yù)測數(shù)據(jù)集淘这。然后針對新的訓(xùn)練數(shù)據(jù)集訓(xùn)練模型，訓(xùn)練完成后巩剖，得到的模型對新的預(yù)測數(shù)據(jù)集的結(jié)果作為最終的結(jié)果铝穷。

代表方法
Blending

image

方法介紹、實例佳魔、代碼：隨機(jī)森林曙聂、AdaBoost、GBDT鞠鲜、XGBoost宁脊、LightGBM，CatBoost贤姆，Stacking榆苞，Blending。掃描下方二維碼或者微信公眾號直接搜索”Python范兒“霞捡，關(guān)注微信公眾號pythonfan坐漏，獲取更多實例和代碼。

pythonfan.jpg

最后編輯于：2018.12.30 21:38:22

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市赊琳，隨后出現(xiàn)的幾起案子街夭，更是在濱河造成了極大的恐慌，老刑警劉巖慨畸，帶你破解...
沈念sama閱讀 221,430評論 6贊 515
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件莱坎，死亡現(xiàn)場離奇詭異衣式，居然都是意外死亡寸士，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 94,406評論 3贊 398
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門碴卧，熙熙樓的掌柜王于貴愁眉苦臉地迎上來弱卡，“玉大人，你說我怎么就攤上這事住册∩舨” “怎么了？”我有些...
開封第一講書人閱讀 167,834評論 0贊 360
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵荧飞，是天一觀的道長凡人。經(jīng)常有香客問我，道長叹阔，這世上最難降的妖魔是什么挠轴？我笑而不...
開封第一講書人閱讀 59,543評論 1贊 296
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮耳幢，結(jié)果婚禮上岸晦，老公的妹妹穿的比我還像新娘。我一直安慰自己睛藻，他們只是感情好启上，可當(dāng)我...
茶點故事閱讀 68,547評論 6贊 397
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著店印，像睡著了一般冈在。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上按摘，一...
開封第一講書人閱讀 52,196評論 1贊 308
城市分裂傳說
那天包券，我揣著相機(jī)與錄音，去河邊找鬼院峡。笑死兴使，一個胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的照激。我是一名探鬼主播发魄，決...
沈念sama閱讀 40,776評論 3贊 421
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了励幼？” 一聲冷哼從身側(cè)響起汰寓，我...
開封第一講書人閱讀 39,671評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎苹粟，沒想到半個月后有滑，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 46,221評論 1贊 320
?護(hù)林員之死
正文獨居荒郊野嶺守林人離奇死亡嵌削，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 38,303評論 3贊 340
?白月光啟示錄
正文我和宋清朗相戀三年毛好，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片苛秕。...
茶點故事閱讀 40,444評論 1贊 352
活死人
序言：一個原本活蹦亂跳的男人離奇死亡肌访，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出艇劫，到底是詐尸還是另有隱情吼驶，我是刑警寧澤，帶...
沈念sama閱讀 36,134評論 5贊 350
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布店煞，位于F島的核電站蟹演，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏顷蟀。R本人自食惡果不足惜酒请，卻給世界環(huán)境...
茶點故事閱讀 41,810評論 3贊 333
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望衩椒。院中可真熱鬧蚌父，春花似錦、人聲如沸毛萌。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,285評論 0贊 24
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽阁将。三九已至膏秫，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間做盅，已是汗流浹背缤削。一陣腳步聲響...
開封第一講書人閱讀 33,399評論 1贊 272
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留吹榴，地道東北人亭敢。一個月前我還...
沈念sama閱讀 48,837評論 3贊 376
代替公主和親
正文我出身青樓，卻偏偏與公主長得像图筹，于是被迫代替她去往敵國和親帅刀。傳聞我的和親對象是個殘疾皇子让腹，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 45,455評論 2贊 359

Python3機(jī)器學(xué)習(xí)實踐：集成學(xué)習(xí)

推薦閱讀更多精彩內(nèi)容