1招驴、 在當(dāng)前的很多數(shù)據(jù)集上,相對(duì)其他算法有著很大的優(yōu)勢(shì)枷畏,表現(xiàn)良好
2别厘、它能夠處理很高維度的數(shù)據(jù),并且不用做特征選擇拥诡,因?yàn)樘卣髯蛹请S機(jī)選擇的
3触趴、在訓(xùn)練完后氮发,它能夠得出特征重要性
4、在創(chuàng)建隨機(jī)森林的時(shí)候冗懦,對(duì)generlization error使用的是無(wú)偏估計(jì)爽冕,模型泛化能力強(qiáng)
5、隨機(jī)森林有oob披蕉,不需要單獨(dú)換分交叉驗(yàn)證集
6颈畸、訓(xùn)練時(shí)樹與樹之間是相互獨(dú)立的,訓(xùn)練速度快没讲,容易做成并行化方法
7眯娱、對(duì)缺失值不敏感,如果有很大一部分的特征遺失爬凑,仍可以維持準(zhǔn)確度徙缴。
缺點(diǎn):
1、隨機(jī)森林在某些噪音較大的分類或回歸問(wèn)題上會(huì)過(guò)擬合
2嘁信、對(duì)于有不同取值的屬性的數(shù)據(jù)于样,取值劃分較多的屬性會(huì)對(duì)隨機(jī)森林產(chǎn)生更大的影響