1/12Ensemble Methods

Why Would We Want to Ensemble Learners Together?

There are two competing variables in finding a well fitting machine learning model:?Bias?and?Variance.?

Bias: When a model has high bias, this means that means it doesn't do a good job of bending to the data.?

Variance: When a model has high variance, this means that it changes drastically to meet the needs of every point in our dataset.

1谊却、機器學習算法中兩個非常重要的影響因素:偏差和方差

高偏差機器學習算法會忽略訓練數(shù)據(jù),不能很好的擬合數(shù)據(jù)。

高方差的機器學習算法會對數(shù)據(jù)高度敏感,只能復(fù)現(xiàn)曾經(jīng)見過的的東西,對于之前從未見過的情況今妄,它的反應(yīng)非常差。(因為沒有適當?shù)钠钭屗夯碌臇|西)

真正想要的算法是兩者折中,也就是所謂的偏差--方差權(quán)衡婴噩。希望算法具有一定的泛化能力,但仍然對訓練數(shù)據(jù)開放羽德,能根據(jù)數(shù)據(jù)來調(diào)整模型几莽。

Introducing Randomness Into Ensembles

Another method that is used to improve ensemble methods is to introduce randomness into high variance algorithms before they are ensembled together. The introduction of randomness combats the tendency of these algorithms to overfit (or fit directly to the data available). There are two main ways that randomness is introduced:

Bootstrap the data?- that is, sampling the data with replacement and fitting your algorithm and fitting your algorithm to the sampled data.

Subset the features?- in each split of a decision tree or with each algorithm used an ensemble only a subset of the total possible features are used.

2、隨機森林算法:

隨機從數(shù)據(jù)中挑選幾列宅静,并根據(jù)這些列構(gòu)建決策樹章蚣,然后隨機選取其他的幾列,再次構(gòu)建決策樹姨夹,然后讓決策樹進行選擇纤垂。就只需讓所有的決策樹做出預(yù)測,并選取結(jié)果中顯示最多的磷账。

3峭沦、Bagging

4、Adaboost

5逃糟、Adaboost in sklearn

>>> from sklearn.ensemble import AdaBoostClassifier

>>> model = AdaBoostClassifier()

>>> model.fit(x_train, y_train)

>>> model.predict(x_test)

高參數(shù)

base_estimator:The model utilized for the weak learners (Warning:?Don't forget to import the model that you decide to use for the weak learner).

n_estimators:The maximum number of weak learners used.

>>> from sklearn.tree import DecisionTreeClassifier

>>> model = AdaBoostClassifier(base_estimator = DecisionTreeClassifier(max_depth=2), n_estimators =4)

回顧:

在這節(jié)課學習了集成方法吼鱼,兩個權(quán)衡變量:偏差和方差。高偏差低方差的模型對數(shù)據(jù)擬合不夠好绰咽,靈活性很低菇肃;低偏差高方差的模型會導(dǎo)致過擬合,靈活性太高了剃诅。

為了權(quán)衡偏差和方差巷送,集成方法是一種普遍使用的方法。

有兩種隨機化技術(shù)來對抗過擬合:

1矛辕、Bootstrap the data?- that is, sampling the data with replacement and fitting your algorithm and fitting your algorithm to the sampled data.

2笑跛、Subset the features?- in each split of a decision tree or with each algorithm used an ensemble only a subset of the total possible features are used.

技術(shù)方法:

1付魔、BaggingClassifier

2、RandomForestClassifier

3飞蹂、AdaBoostClassifier

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末几苍,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子陈哑,更是在濱河造成了極大的恐慌妻坝,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,366評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件惊窖,死亡現(xiàn)場離奇詭異刽宪,居然都是意外死亡,警方通過查閱死者的電腦和手機界酒,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,521評論 3 395
  • 文/潘曉璐 我一進店門圣拄,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人毁欣,你說我怎么就攤上這事庇谆。” “怎么了凭疮?”我有些...
    開封第一講書人閱讀 165,689評論 0 356
  • 文/不壞的土叔 我叫張陵饭耳,是天一觀的道長。 經(jīng)常有香客問我执解,道長寞肖,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,925評論 1 295
  • 正文 為了忘掉前任材鹦,我火速辦了婚禮逝淹,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘桶唐。我一直安慰自己栅葡,他們只是感情好,可當我...
    茶點故事閱讀 67,942評論 6 392
  • 文/花漫 我一把揭開白布尤泽。 她就那樣靜靜地躺著欣簇,像睡著了一般。 火紅的嫁衣襯著肌膚如雪坯约。 梳的紋絲不亂的頭發(fā)上熊咽,一...
    開封第一講書人閱讀 51,727評論 1 305
  • 那天,我揣著相機與錄音闹丐,去河邊找鬼横殴。 笑死,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的衫仑。 我是一名探鬼主播梨与,決...
    沈念sama閱讀 40,447評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼文狱!你這毒婦竟也來了粥鞋?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,349評論 0 276
  • 序言:老撾萬榮一對情侶失蹤瞄崇,失蹤者是張志新(化名)和其女友劉穎呻粹,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體苏研,經(jīng)...
    沈念sama閱讀 45,820評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡等浊,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,990評論 3 337
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了楣富。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片凿掂。...
    茶點故事閱讀 40,127評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖纹蝴,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情踪少,我是刑警寧澤塘安,帶...
    沈念sama閱讀 35,812評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站援奢,受9級特大地震影響兼犯,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜集漾,卻給世界環(huán)境...
    茶點故事閱讀 41,471評論 3 331
  • 文/蒙蒙 一切黔、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧具篇,春花似錦纬霞、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,017評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至埃疫,卻和暖如春伏恐,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背栓霜。 一陣腳步聲響...
    開封第一講書人閱讀 33,142評論 1 272
  • 我被黑心中介騙來泰國打工翠桦, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人胳蛮。 一個月前我還...
    沈念sama閱讀 48,388評論 3 373
  • 正文 我出身青樓销凑,卻偏偏與公主長得像愁铺,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子闻鉴,可洞房花燭夜當晚...
    茶點故事閱讀 45,066評論 2 355

推薦閱讀更多精彩內(nèi)容

  • 上完商業(yè)教練包班課程茵乱,我發(fā)現(xiàn)我有多了很多可以用在家庭教育課程里的工具。昨天中午我就親自實踐孟岛,用覺察日記為女兒做了一...
    易小信閱讀 504評論 2 4
  • 凡人的道路上平淡不驚渠羞,從信誓旦旦立下誓言到周而復(fù)始重復(fù)著雞血和頹廢之間的轉(zhuǎn)換斤贰,時而想一路高歌猛進,時而想停下沉默不...
    彩鉛彩畫閱讀 243評論 0 0
  • 1.objc_class 的chache找 2.在對象的方法列表里找 3.去父類指針指向的對象中去執(zhí)行 1.2 4...
    Jonnyking閱讀 139評論 0 0
  • 我一直以為中考是我隨隨便便就能考上好的學校在于我的先天頭腦發(fā)達的優(yōu)勢次询,高考的失敗讓我知道荧恍,我對于這個優(yōu)勢的解讀不太...
    整容游戲閱讀 267評論 0 0
  • 摘要: 1、我們太容易說“是”了屯吊! 很多朋友說送巡,他們說的最多的口頭禪:無所謂,沒關(guān)系盒卸,都可以骗爆,都行,ok蔽介。摘投。。 2...
    半天云閱讀 266評論 0 0