機器學(xué)習(xí)算法實現(xiàn)(六):CART

CART算法R語言實踐

第一步:數(shù)據(jù)集劃分訓(xùn)練集和測試烧栋,比例是2:1

set.seed(1234)

index <-sample(1:nrow(iris),100)

iris.train <-iris[index,]

iris.test <-iris[-index,]


第二步:加載包含CART算法的R包

library(rpart)


第三步:構(gòu)建CART模型

model.CART <-rpart(Species~.,data=iris.train)


第四步:模型應(yīng)用到測試集

results.CART<-predict(model.CART,newdata=iris.test, type='class')


第五步:生成混淆矩陣

table(results.CART, iris.test$Species)

result.KNN/? setosa? versicolor? virginica

setosa? ? ? ? 12? ? ? 0? ? ? ? ? ? 0

versicolor? ? 0? ? ? ? 21? ? ? ? ? 3

virginica? ? 0? ? ? ? 0? ? ? ? ? ? 14


CART算法原理

1分類回歸樹(CART,ClassificationAnd

Regression Tree)也屬于一種決策樹,分類回歸樹是一棵二叉樹讹挎,且每個非葉子節(jié)點都有兩個孩子。

2決策樹生長的核心是確定決策樹的分枝準(zhǔn)則刺洒。

1)如何從眾多的屬性變量中選擇一個當(dāng)前的最佳分支變量僻肖;也就是選擇能使異質(zhì)性下降最快的變量。異質(zhì)性的度量:GINI芹啥、TWOING、least squared deviation铺峭。前兩種主要針對分類型變量墓怀,LSD針對連續(xù)性變量。

2)如何從分支變量的眾多取值中找到一個當(dāng)前的最佳分割點(分割閾值)卫键。A傀履、數(shù)值型變量——對記錄的值從小到大排序,計算每個值作為臨界點產(chǎn)生的子節(jié)點的異質(zhì)性統(tǒng)計量莉炉。能夠使異質(zhì)性減小程度最大的臨界值便是最佳的劃分點钓账。B、分類型變量——列出劃分為兩個子集的所有可能組合絮宁,計算每種組合下生成子節(jié)點的異質(zhì)性梆暮。同樣,找到使異質(zhì)性減小程度最大的組合作為最佳劃分點绍昂。

3在決策樹的每一個節(jié)點上我們可以按任一個屬性的任一個值進(jìn)行劃分啦粹。按哪種劃分最好呢?有3個標(biāo)準(zhǔn)可以用來衡量劃分的好壞:GINI指數(shù)窘游、雙化指數(shù)唠椭、有序雙化指數(shù)。


參考文獻(xiàn):

本文轉(zhuǎn)載自 ? ?http://www.360doc.com/userhome.aspx?userid=26290960&cid=10

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末忍饰,一起剝皮案震驚了整個濱河市贪嫂,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌喘批,老刑警劉巖撩荣,帶你破解...
    沈念sama閱讀 206,968評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件铣揉,死亡現(xiàn)場離奇詭異饶深,居然都是意外死亡餐曹,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,601評論 2 382
  • 文/潘曉璐 我一進(jìn)店門敌厘,熙熙樓的掌柜王于貴愁眉苦臉地迎上來台猴,“玉大人,你說我怎么就攤上這事俱两”タ瘢” “怎么了?”我有些...
    開封第一講書人閱讀 153,220評論 0 344
  • 文/不壞的土叔 我叫張陵宪彩,是天一觀的道長休讳。 經(jīng)常有香客問我,道長尿孔,這世上最難降的妖魔是什么俊柔? 我笑而不...
    開封第一講書人閱讀 55,416評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮活合,結(jié)果婚禮上雏婶,老公的妹妹穿的比我還像新娘。我一直安慰自己白指,他們只是感情好留晚,可當(dāng)我...
    茶點故事閱讀 64,425評論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著告嘲,像睡著了一般错维。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上橄唬,一...
    開封第一講書人閱讀 49,144評論 1 285
  • 那天需五,我揣著相機與錄音,去河邊找鬼轧坎。 笑死宏邮,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的缸血。 我是一名探鬼主播蜜氨,決...
    沈念sama閱讀 38,432評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼捎泻!你這毒婦竟也來了飒炎?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,088評論 0 261
  • 序言:老撾萬榮一對情侶失蹤笆豁,失蹤者是張志新(化名)和其女友劉穎郎汪,沒想到半個月后赤赊,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,586評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡煞赢,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,028評論 2 325
  • 正文 我和宋清朗相戀三年抛计,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片照筑。...
    茶點故事閱讀 38,137評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡吹截,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出凝危,到底是詐尸還是另有隱情波俄,我是刑警寧澤,帶...
    沈念sama閱讀 33,783評論 4 324
  • 正文 年R本政府宣布蛾默,位于F島的核電站懦铺,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏支鸡。R本人自食惡果不足惜冬念,卻給世界環(huán)境...
    茶點故事閱讀 39,343評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望苍匆。 院中可真熱鬧刘急,春花似錦、人聲如沸浸踩。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,333評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽检碗。三九已至据块,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間折剃,已是汗流浹背另假。 一陣腳步聲響...
    開封第一講書人閱讀 31,559評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留怕犁,地道東北人边篮。 一個月前我還...
    沈念sama閱讀 45,595評論 2 355
  • 正文 我出身青樓,卻偏偏與公主長得像奏甫,于是被迫代替她去往敵國和親戈轿。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,901評論 2 345

推薦閱讀更多精彩內(nèi)容