list:
bagging和boosting的區(qū)別
決策樹
Bagging和Boosting 概念及區(qū)別
1)樣本選擇上:
Bagging:訓練集是在原始集中有放回選取的痊夭,從原始集中選出的各輪訓練集之間是獨立的抽莱。
Boosting:每一輪的訓練集不變兄世,只是訓練集中每個樣例在分類器中的權(quán)重發(fā)生變化鲸郊。而權(quán)值是根據(jù)上一輪的分類結(jié)果進行調(diào)整榨汤。
2)樣例權(quán)重:
Bagging:使用均勻取樣惶楼,每個樣例的權(quán)重相等
Boosting:根據(jù)錯誤率不斷調(diào)整樣例的權(quán)值,錯誤率越大則權(quán)重越大疼燥。
3)預(yù)測函數(shù):
Bagging:所有預(yù)測函數(shù)的權(quán)重相等沧卢。
Boosting:每個弱分類器都有相應(yīng)的權(quán)重,對于分類誤差小的分類器會有更大的權(quán)重醉者。
4)并行計算:
Bagging:各個預(yù)測函數(shù)可以并行生成
Boosting:各個預(yù)測函數(shù)只能順序生成,因為后一個模型參數(shù)需要前一輪模型的結(jié)果披诗。
決策樹(Decision Tree)
算法:http://blog.csdn.net/sinat_35512245/article/details/54927178