隨機(jī)森林由多顆決策樹構(gòu)成
問題1:如何構(gòu)建森林中決策樹想括?
設(shè)數(shù)據(jù)集中存在14條數(shù)據(jù), 基于已有的數(shù)據(jù)集,構(gòu)建新的數(shù)據(jù)集烙博,在新的數(shù)據(jù)集基礎(chǔ)上創(chuàng)建一棵樹瑟蜈;再基于已有的數(shù)據(jù)集烟逊,構(gòu)建新的數(shù)據(jù)集,在新的數(shù)據(jù)集基礎(chǔ)上創(chuàng)建一棵樹
有放回采樣:隨機(jī)從數(shù)據(jù)集中采樣一條數(shù)據(jù)铺根,得到新的數(shù)據(jù)集中一條數(shù)據(jù)宪躯,需要將這條數(shù)據(jù)放回到原有數(shù)據(jù)集,再次從原有的數(shù)據(jù)集位迂,隨機(jī)采樣一條數(shù)據(jù)访雪。操作14次,這樣得到一個新的數(shù)據(jù)集
構(gòu)建決策樹時:特征隨機(jī)抽取
兩個隨機(jī)性的引入對隨機(jī)森林的分類性能至關(guān)重要掂林。由于它們的引入臣缀,使得隨機(jī)森林不容易陷入過擬合,并且具有很好得抗噪能力
問題2:每顆決策樹有自己一個預(yù)測結(jié)果泻帮,如何得到整個森林的預(yù)測結(jié)果精置?
每顆決策樹有自己一個預(yù)測結(jié)果,大家投票決定,少數(shù)服從多數(shù)原則锣杂,判定整個森林的結(jié)果