1/12Ensemble Methods

Why Would We Want to Ensemble Learners Together?

There are two competing variables in finding a well fitting machine learning model:?Bias?and?Variance.?

Bias: When a model has high bias, this means that means it doesn't do a good job of bending to the data.?

Variance: When a model has high variance, this means that it changes drastically to meet the needs of every point in our dataset.

1谊却、機器學習算法中兩個非常重要的影響因素：偏差和方差

高偏差機器學習算法會忽略訓練數(shù)據(jù)，不能很好的擬合數(shù)據(jù)。

高方差的機器學習算法會對數(shù)據(jù)高度敏感，只能復(fù)現(xiàn)曾經(jīng)見過的的東西，對于之前從未見過的情況今妄，它的反應(yīng)非常差。（因為沒有適當?shù)钠钭屗夯碌臇|西）

真正想要的算法是兩者折中，也就是所謂的偏差--方差權(quán)衡婴噩。希望算法具有一定的泛化能力，但仍然對訓練數(shù)據(jù)開放羽德，能根據(jù)數(shù)據(jù)來調(diào)整模型几莽。

Introducing Randomness Into Ensembles

Another method that is used to improve ensemble methods is to introduce randomness into high variance algorithms before they are ensembled together. The introduction of randomness combats the tendency of these algorithms to overfit (or fit directly to the data available). There are two main ways that randomness is introduced:

Bootstrap the data?- that is, sampling the data with replacement and fitting your algorithm and fitting your algorithm to the sampled data.

Subset the features?- in each split of a decision tree or with each algorithm used an ensemble only a subset of the total possible features are used.

2、隨機森林算法：

隨機從數(shù)據(jù)中挑選幾列宅静，并根據(jù)這些列構(gòu)建決策樹章蚣，然后隨機選取其他的幾列，再次構(gòu)建決策樹姨夹，然后讓決策樹進行選擇纤垂。就只需讓所有的決策樹做出預(yù)測，并選取結(jié)果中顯示最多的磷账。

3峭沦、Bagging

4、Adaboost

5逃糟、Adaboost in sklearn

>>> from sklearn.ensemble import AdaBoostClassifier

>>> model = AdaBoostClassifier()

>>> model.fit(x_train, y_train)

>>> model.predict(x_test)

高參數(shù)

base_estimator：The model utilized for the weak learners (Warning:?Don't forget to import the model that you decide to use for the weak learner).

n_estimators：The maximum number of weak learners used.

>>> from sklearn.tree import DecisionTreeClassifier

>>> model = AdaBoostClassifier(base_estimator = DecisionTreeClassifier(max_depth=2), n_estimators =4)

回顧：

在這節(jié)課學習了集成方法吼鱼，兩個權(quán)衡變量：偏差和方差。高偏差低方差的模型對數(shù)據(jù)擬合不夠好绰咽，靈活性很低菇肃；低偏差高方差的模型會導(dǎo)致過擬合，靈活性太高了剃诅。

為了權(quán)衡偏差和方差巷送，集成方法是一種普遍使用的方法。

有兩種隨機化技術(shù)來對抗過擬合：

1矛辕、Bootstrap the data?- that is, sampling the data with replacement and fitting your algorithm and fitting your algorithm to the sampled data.

2笑跛、Subset the features?- in each split of a decision tree or with each algorithm used an ensemble only a subset of the total possible features are used.

技術(shù)方法：

1付魔、BaggingClassifier

2、RandomForestClassifier

3飞蹂、AdaBoostClassifier

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末几苍，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子陈哑，更是在濱河造成了極大的恐慌妻坝，老刑警劉巖，帶你破解...
沈念sama閱讀 219,366評論 6贊 508
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件惊窖，死亡現(xiàn)場離奇詭異刽宪，居然都是意外死亡，警方通過查閱死者的電腦和手機界酒，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,521評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門圣拄，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人毁欣，你說我怎么就攤上這事庇谆。” “怎么了凭疮？”我有些...
開封第一講書人閱讀 165,689評論 0贊 356
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵饭耳，是天一觀的道長。經(jīng)常有香客問我执解，道長寞肖，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,925評論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任材鹦，我火速辦了婚禮逝淹，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘桶唐。我一直安慰自己栅葡，他們只是感情好，可當我...
茶點故事閱讀 67,942評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布尤泽。她就那樣靜靜地躺著欣簇，像睡著了一般。火紅的嫁衣襯著肌膚如雪坯约。梳的紋絲不亂的頭發(fā)上熊咽，一...
開封第一講書人閱讀 51,727評論 1贊 305
城市分裂傳說
那天，我揣著相機與錄音闹丐，去河邊找鬼横殴。笑死，一個胖子當著我的面吹牛，可吹牛的內(nèi)容都是我干的衫仑。我是一名探鬼主播梨与，決...
沈念sama閱讀 40,447評論 3贊 420
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼文狱！你這毒婦竟也來了粥鞋？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 39,349評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤瞄崇，失蹤者是張志新（化名）和其女友劉穎呻粹，沒想到半個月后，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體苏研，經(jīng)...
沈念sama閱讀 45,820評論 1贊 317
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡等浊，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,990評論 3贊 337
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了楣富。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片凿掂。...
茶點故事閱讀 40,127評論 1贊 351
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖纹蝴，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情踪少，我是刑警寧澤塘安，帶...
沈念sama閱讀 35,812評論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站援奢，受9級特大地震影響兼犯，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜集漾，卻給世界環(huán)境...
茶點故事閱讀 41,471評論 3贊 331
男人毒藥：我在死后第九天來索命
文/蒙蒙一切黔、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧具篇，春花似錦纬霞、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,017評論 0贊 22
一樁弒父案诗芜，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至埃疫，卻和暖如春伏恐，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背栓霜。一陣腳步聲響...
開封第一講書人閱讀 33,142評論 1贊 272
情欲美人皮
我被黑心中介騙來泰國打工翠桦，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人胳蛮。一個月前我還...
沈念sama閱讀 48,388評論 3贊 373
代替公主和親
正文我出身青樓销凑，卻偏偏與公主長得像愁铺，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子闻鉴，可洞房花燭夜當晚...
茶點故事閱讀 45,066評論 2贊 355

1/12Ensemble Methods

高參數(shù)

推薦閱讀更多精彩內(nèi)容