? 首先樹模型根據(jù)根據(jù)基于決策樹和回歸樹可分為分類模型和回歸模型窥岩。
? 對(duì)于分類和回歸問題來說甲献,不同的地方在于,對(duì)回歸樹來說可以不單單是取葉子節(jié)點(diǎn)的均值作為預(yù)測(cè)值颂翼,也可以取葉子節(jié)點(diǎn)的中位數(shù)或者別的一些合理的統(tǒng)計(jì)值來作為預(yù)測(cè)值晃洒。(自己想的)
? ? 樹模型是基于特征進(jìn)行特征空間的劃分(基于信息熵之類的)慨灭,然后對(duì)劃分好的葉子節(jié)點(diǎn)進(jìn)行賦值。不會(huì)超過已有的最大值也不會(huì)低于已有的最小值球及。對(duì)于預(yù)測(cè)趨勢(shì)的問題來說(例如天池競(jìng)賽阿里流行音樂預(yù)測(cè))氧骤,并不能很好的代表趨勢(shì)走項(xiàng),最多是在已有的值區(qū)間內(nèi)進(jìn)行波動(dòng)吃引。
? ?接下來說說隨機(jī)森林的隨機(jī)性筹陵,第一是在選擇特征的時(shí)候進(jìn)行無放回的提取,二是在進(jìn)行樣本取樣的時(shí)候進(jìn)行有放回的抽樣(在抽樣次數(shù)趨于無窮時(shí)只能抽取0.63左右的原始樣本)镊尺。這在一定程度上增強(qiáng)了抗干擾能力朦佩,但在樣本不均衡的情況下還是會(huì)產(chǎn)生過擬合的情況,此時(shí)就要調(diào)整樣本權(quán)重或者對(duì)數(shù)據(jù)進(jìn)行重采樣庐氮。
總而言之语稠,樹模型就是一系列的規(guī)則,不過是機(jī)器依據(jù)一些目標(biāo)選取的最優(yōu)或者局部最優(yōu)的規(guī)則而已弄砍。