查理芒格思維模型探尋之旅07-決策樹理論

圖片來自網(wǎng)絡(luò)

查理芒格提出跨學(xué)科知識(shí)以及多元思維模型,在《窮查理寶典》中提到了有100多個(gè)思維模型尾抑,我們在【查理芒格研習(xí)會(huì)】中,將會(huì)以學(xué)習(xí)思維模型的方式對查理提到的這100多個(gè)思維模型進(jìn)行深入探討和學(xué)習(xí)派草,會(huì)將該模型的原始出處和原理搞清楚须蜗,然后在結(jié)合自身的工作和生活進(jìn)行理解和運(yùn)用硅确,希望能將這100多個(gè)思維模型都融入到我們自身的知識(shí)結(jié)構(gòu)中。

決策樹理論是我們整理學(xué)習(xí)的第七個(gè)思維模型明肮。

本文主要是以摘抄維基百科的內(nèi)容來講解決策時(shí)理論菱农,以劉潤5分鐘商學(xué)院的決策樹案例進(jìn)行分析解說,前半部分理論相對晦澀難懂柿估,可以跳過直接看后面的案例解說循未。


什么是決策樹理論?

決策論中(如風(fēng)險(xiǎn)管理)秫舌,決策樹(Decision tree)由一個(gè)決策圖和可能的結(jié)果(包括資源成本和風(fēng)險(xiǎn))組成的妖,用來創(chuàng)建到達(dá)目標(biāo)的規(guī)劃。決策樹建立并用來輔助決策足陨,是一種特殊的樹結(jié)構(gòu)羔味。決策樹是一個(gè)利用像樹一樣的圖形或決策模型的決策支持工具,包括隨機(jī)事件結(jié)果钠右,資源代價(jià)和實(shí)用性。它是一個(gè)算法顯示的方法忘蟹。決策樹經(jīng)常在運(yùn)籌學(xué)中使用飒房,特別是在決策分析中,它幫助確定一個(gè)能最可能達(dá)到目標(biāo)的策略媚值。如果在實(shí)際中狠毯,決策不得不在沒有完備知識(shí)的情況下被在線采用,一個(gè)決策樹應(yīng)該平行概率模型作為最佳的選擇模型或在線選擇模型算法褥芒。決策樹的另一個(gè)使用是作為計(jì)算條件概率的描述性手段嚼松。

機(jī)器學(xué)習(xí)中嫡良,決策樹是一個(gè)預(yù)測模型;他代表的是對象屬性與對象值之間的一種映射關(guān)系献酗。樹中每個(gè)節(jié)點(diǎn)表示某個(gè)對象寝受,而每個(gè)分叉路徑則代表某個(gè)可能的屬性值,而每個(gè)葉節(jié)點(diǎn)則對應(yīng)從根節(jié)點(diǎn)到該葉節(jié)點(diǎn)所經(jīng)歷的路徑所表示的對象的值罕偎。決策樹僅有單一輸出很澄,若欲有復(fù)數(shù)輸出,可以建立獨(dú)立的決策樹以處理不同輸出颜及。 數(shù)據(jù)挖掘中決策樹是一種經(jīng)常要用到的技術(shù)甩苛,可以用于分析數(shù)據(jù),同樣也可以用來作預(yù)測俏站。

從數(shù)據(jù)產(chǎn)生決策樹的機(jī)器學(xué)習(xí)技術(shù)叫做決策樹學(xué)習(xí)讯蒲,通俗說就是決策樹。

一個(gè)決策樹包含三種類型的節(jié)點(diǎn):

? ? 1肄扎、決策節(jié)點(diǎn):通常用矩形框來表示

? ? 2墨林、機(jī)會(huì)節(jié)點(diǎn):通常用圓圈來表示

? ? 3、終結(jié)點(diǎn):通常用三角形來表示

圖片來自網(wǎng)絡(luò)

決策樹學(xué)習(xí)也是數(shù)據(jù)挖掘中一個(gè)普通的方法反浓。在這里萌丈,每個(gè)決策樹都表述了一種樹型結(jié)構(gòu),它由它的分支來對該類型的對象依靠屬性進(jìn)行分類雷则。每個(gè)決策樹可以依靠對源數(shù)據(jù)庫的分割進(jìn)行數(shù)據(jù)測試辆雾。這個(gè)過程可以遞歸式的對樹進(jìn)行修剪。 當(dāng)不能再進(jìn)行分割或一個(gè)單獨(dú)的類可以被應(yīng)用于某一分支時(shí)月劈,遞歸過程就完成了度迂。另外,隨機(jī)森林分類器將許多決策樹結(jié)合起來以提升分類的正確率猜揪。

決策樹的優(yōu)點(diǎn)

相對于其他數(shù)據(jù)挖掘算法惭墓,決策樹在以下幾個(gè)方面擁有優(yōu)勢:

1、決策樹易于理解和實(shí)現(xiàn)而姐,人們在通過解釋后都有能力去理解決策樹所表達(dá)的意義腊凶。

2、對于決策樹拴念,數(shù)據(jù)的準(zhǔn)備往往是簡單或者是不必要的钧萍,其他的技術(shù)往往要求先把數(shù)據(jù)一般化,比如去掉多余的或者空白的屬性政鼠。

3风瘦、能夠同時(shí)處理數(shù)據(jù)型和常規(guī)型屬性。其他的技術(shù)往往要求數(shù)據(jù)屬性的單一公般。

4万搔、是一個(gè)白盒模型胡桨,如果給定一個(gè)觀察的模型,那么根據(jù)所產(chǎn)生的決策樹很容易推出相應(yīng)的邏輯表達(dá)式瞬雹。

5昧谊、易于通過靜態(tài)測試來對模型進(jìn)行評(píng)測。表示有可能測量該模型的可信度挖炬。

6揽浙、在相對短的時(shí)間內(nèi)能夠?qū)Υ笮蛿?shù)據(jù)源做出可行且效果良好的結(jié)果。

決策樹的缺點(diǎn)

1意敛、對于那些各類別樣本數(shù)量不一致的數(shù)據(jù)馅巷,在決策樹當(dāng)中信息增益的結(jié)果偏向于那些具有更多數(shù)值的特征。

2草姻、訓(xùn)練一棵最優(yōu)的決策樹是一個(gè)完全NP問題钓猬。因此, 實(shí)際應(yīng)用時(shí)決策樹的訓(xùn)練采用啟發(fā)式搜索算法例如貪心算法來達(dá)到局部最優(yōu)。這樣的算法沒辦法得到最優(yōu)的決策樹撩独。

3敞曹、決策樹創(chuàng)建的過度復(fù)雜會(huì)導(dǎo)致無法很好的預(yù)測訓(xùn)練集之外的數(shù)據(jù)。這稱作過擬合综膀,剪枝機(jī)制可以避免這種問題澳迫。

4、有些問題決策樹沒辦法很好的解決,例如異或問題剧劝。解決這種問題的時(shí)候橄登,決策樹會(huì)變得過大。 要解決這種問題讥此,只能改變問題的領(lǐng)域或者使用其他更為耗時(shí)的學(xué)習(xí)算法 (例如統(tǒng)計(jì)關(guān)系學(xué)習(xí) 或者 歸納邏輯編程).

5拢锹、對那些有類別型屬性的數(shù)據(jù), 信息增益會(huì)有一定的偏置。

決策樹的剪枝

剪枝是決策樹停止分支的方法之一萄喳,剪枝有分預(yù)先剪枝和后剪枝兩種卒稳。預(yù)先剪枝是在樹的生長過程中設(shè)定一個(gè)指標(biāo),當(dāng)達(dá)到該指標(biāo)時(shí)就停止生長他巨,這樣做容易產(chǎn)生“視界局限”充坑,就是一旦停止分支,使得節(jié)點(diǎn)N成為葉節(jié)點(diǎn)染突,就斷絕了其后繼節(jié)點(diǎn)進(jìn)行“好”的分支操作的任何可能性匪傍。不嚴(yán)格的說這會(huì)已停止的分支會(huì)誤導(dǎo)學(xué)習(xí)算法,導(dǎo)致產(chǎn)生的樹不純度降差最大的地方過分靠近根節(jié)點(diǎn)觉痛。后剪枝中樹首先要充分生長,直到葉節(jié)點(diǎn)都有最小的不純度值為止茵休,因而可以克服“視界局限”薪棒。然后對所有相鄰的成對葉節(jié)點(diǎn)考慮是否消去它們手蝎,如果消去能引起令人滿意的不純度增長,那么執(zhí)行消去俐芯,并令它們的公共父節(jié)點(diǎn)成為新的葉節(jié)點(diǎn)棵介。這種“合并”葉節(jié)點(diǎn)的做法和節(jié)點(diǎn)分支的過程恰好相反,經(jīng)過剪枝后葉節(jié)點(diǎn)常常會(huì)分布在很寬的層次上吧史,樹也變得非平衡邮辽。后剪枝技術(shù)的優(yōu)點(diǎn)是克服了“視界局限”效應(yīng),而且無需保留部分樣本用于交叉驗(yàn)證贸营,所以可以充分利用全部訓(xùn)練集的信息吨述。但后剪枝的計(jì)算量代價(jià)比預(yù)剪枝方法大得多,特別是在大樣本集中钞脂,不過對于小樣本的情況揣云,后剪枝方法還是優(yōu)于預(yù)剪枝方法的。


決策樹理論的運(yùn)用

借用劉潤的5分鐘商學(xué)院中講解決策樹的一個(gè)案例冰啃,相對比較簡單清晰邓夕。

作為一個(gè)女孩子,你媽媽一直很為你的終身大事?lián)难忠悖裉煊忠o你介紹對象了焚刚。你隨口一問:多大了?她說:26扇调。你問:長得帥不帥矿咕?她說:挺帥的。你問:收入高不高肃拜?她說:不算很高痴腌,中等情況。你問:是《劉潤.5分鐘商學(xué)院》學(xué)員嗎燃领?她說:是士聪,還經(jīng)常留言呢。你說:那好的猛蔽,我去見見剥悟。

找男朋友,絕對是比找工作曼库、創(chuàng)業(yè)区岗、投資公司,更重要的戰(zhàn)略決策毁枯。這么重要的決策慈缔,就可以用到?jīng)Q策樹(Decision Tree)這個(gè)工具。

什么叫決策樹种玛?其實(shí)剛才那連珠炮似的問題藐鹤,就有決策樹的基本邏輯在里面瓤檐。

圖片來自劉潤商學(xué)院

當(dāng)你問:“多大了?”的時(shí)候娱节,其實(shí)就開始啟動(dòng)了“相親決策樹”的第一個(gè)決策節(jié)點(diǎn)挠蛉。這個(gè)決策節(jié)點(diǎn),有兩條分支:第一肄满,大于30歲谴古?哦,是大叔稠歉,那就不見了掰担;第二,三十歲以下轧抗?哦恩敌,年齡還可以。然后横媚,你才會(huì)接著問“長得帥不帥纠炮?”這又是一個(gè)決策節(jié)點(diǎn),“不帥到了丑的級(jí)別”灯蝴,那就別見了恢口。如果至少中等,那就再往下穷躁,走到第三個(gè)決策節(jié)點(diǎn)“收入高不高耕肩?”。窮问潭?那也不能忍猿诸。然后是第四個(gè)決策節(jié)點(diǎn)“是《5商》學(xué)員嗎?”狡忙。是梳虽?太好了,小伙子很上進(jìn)灾茁,那就見吧窜觉。

你通過四個(gè)決策節(jié)點(diǎn)“年齡、長相北专、收入禀挫、上進(jìn)”,排除了“老拓颓、丑语婴、窮還不上進(jìn)的人”,選出“30歲以下,收入中等腻格,但是很上進(jìn)画拾,在學(xué)習(xí)《劉潤.5分鐘商學(xué)院》的帥小伙”。這套像樹一樣層層分支菜职,不斷遞進(jìn)的決策工具,就是“決策樹”旗闽。

西蒙說:管理就是決策酬核。而決策樹,就是一種把決策節(jié)點(diǎn)畫成樹的輔助決策工具适室,一種尋找最優(yōu)方案的畫圖法嫡意。

怎么樣?一點(diǎn)都不難吧捣辆。但是別急蔬螟,你注意到?jīng)]有,你的“相親決策樹”有一個(gè)不太現(xiàn)實(shí)的地方汽畴,就是你媽居然能回答你的每一個(gè)問題旧巾。這讓你的決策,變得非常簡單直接∪绦現(xiàn)實(shí)情況通常不是這樣的鲁猩。

現(xiàn)實(shí)情況通常是,你希望賴以決策的依據(jù)罢坝,是沒有確定答案的廓握。比如你如果問你媽:他的脾氣好嗎?你媽估計(jì)會(huì)說:哎呀嘁酿,這個(gè)說不好隙券,我只見過一面,感覺八成脾氣還不錯(cuò)吧闹司。你再問:他未來會(huì)有錢嗎娱仔?你媽估計(jì)會(huì)說:這天知道。他那么努力开仰,估計(jì)至少有三成概率拟枚,未來總會(huì)有錢吧?

聽完這些回答:80%可能脾氣不錯(cuò)众弓,30%可能將來會(huì)有錢恩溅,你還去不去相親?這就難決定了谓娃。這時(shí)脚乡,我們就往“決策樹”中引入一個(gè)“概率”。

這種被概率化的決策樹,又叫:概率樹(Probability Tree)奶稠。

增加了“不確定性”后俯艰,應(yīng)該怎么用“決策樹”,或者“概率樹”決策呢锌订?

假設(shè)滿意的最高分是10分竹握,不滿意的最高分是-10分,現(xiàn)在你要做一件事情辆飘,給“脾氣”和“有錢”這兩個(gè)不確定的條件啦辐,所產(chǎn)生的四個(gè)組合,誠實(shí)的打個(gè)分蜈项。

如果他真的脾氣好芹关,也真的未來很有錢,你有多滿意紧卒?如果真是這樣侥衬,那是100%的滿意啊跑芳!打10分轴总。

如果他的脾氣雖然好,但是很不幸聋亡,因?yàn)檫\(yùn)氣問題肘习、能力問題,最后真的還是一生窮困坡倔,你有多滿意漂佩?嗯,雖然沒錢罪塔,但好歹脾氣好投蝉。這就是命吧。如果真這樣征堪,我的滿意度是3分瘩缆。

接下來。如果不幸他的脾氣很差佃蚜,最后還沒錢呢庸娱?這簡直就是渣男啊,-10分谐算!

那如果脾氣差熟尉,但最后一不小心很有錢呢?這是一個(gè)好問題洲脂。要不要為了錢忍呢斤儿?忍一輩子很難啊,我還是打-5分吧。

圖片來自劉潤商學(xué)院

在80%好脾氣往果,30%會(huì)有錢的不確定下疆液,你是見,還是不見呢陕贮?如果決定不見堕油,你沒有得失,收益是“0”肮之。但是如果見呢馍迄?那就有四種可能性:

1、脾氣差局骤,但有錢的概率是:20% x 30% = 5%。對這種情況暴凑,你打了-5分峦甩。也就是這條概率分支,你的收益是:6% x (-5分) = -0.3分现喳。

2凯傲、脾氣差,沒錢呢嗦篱?概率是:20% x 70% = 14%冰单,收益是:14% x (-10分) = -1.4分。

3灸促、脾氣又好又有錢的概率是:80% x 30% = 24%诫欠,收益是:24% x 10分 = 2.4分。

4浴栽、脾氣好荒叼,但是沒錢的概率是:80% x 70% = 56%,收益是:56% x 3分 = 1.68分典鸡。

所以被廓,如果你選擇了見,你的總收益是:(-0.3分) + (-1.4分) + 2.4分 + 1.68分 = 2.38分萝玷。

你決定見的總體收益是2.38分嫁乘,不見的收益是0。所以球碉,怎么樣蜓斧?應(yīng)該趕緊畫個(gè)妝出門,去相親汁尺。

小結(jié):認(rèn)識(shí)決策樹

什么是決策樹法精?決策樹,就是一種把決策節(jié)點(diǎn)畫成樹的輔助決策工具,一種尋找最優(yōu)方案的畫圖法搂蜓。

什么是概率樹狼荞?概率樹在決策樹的基礎(chǔ)上,增加了對條件發(fā)生概率的預(yù)測帮碰,和對結(jié)果收益的評(píng)估相味,然后加權(quán)平均得到一個(gè)“期望值”,用這個(gè)期望值殉挽,作為依據(jù)丰涉,輔助決策。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末斯碌,一起剝皮案震驚了整個(gè)濱河市一死,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌傻唾,老刑警劉巖投慈,帶你破解...
    沈念sama閱讀 206,723評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異冠骄,居然都是意外死亡伪煤,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,485評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門凛辣,熙熙樓的掌柜王于貴愁眉苦臉地迎上來抱既,“玉大人,你說我怎么就攤上這事扁誓》辣茫” “怎么了?”我有些...
    開封第一講書人閱讀 152,998評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵跋理,是天一觀的道長择克。 經(jīng)常有香客問我,道長前普,這世上最難降的妖魔是什么肚邢? 我笑而不...
    開封第一講書人閱讀 55,323評(píng)論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮拭卿,結(jié)果婚禮上骡湖,老公的妹妹穿的比我還像新娘。我一直安慰自己峻厚,他們只是感情好响蕴,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,355評(píng)論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著惠桃,像睡著了一般浦夷。 火紅的嫁衣襯著肌膚如雪辖试。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,079評(píng)論 1 285
  • 那天劈狐,我揣著相機(jī)與錄音罐孝,去河邊找鬼。 笑死肥缔,一個(gè)胖子當(dāng)著我的面吹牛莲兢,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播续膳,決...
    沈念sama閱讀 38,389評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼改艇,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了坟岔?” 一聲冷哼從身側(cè)響起谒兄,我...
    開封第一講書人閱讀 37,019評(píng)論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎社付,沒想到半個(gè)月后舵变,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,519評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡瘦穆,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,971評(píng)論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了赊豌。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片扛或。...
    茶點(diǎn)故事閱讀 38,100評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖碘饼,靈堂內(nèi)的尸體忽然破棺而出熙兔,到底是詐尸還是另有隱情,我是刑警寧澤艾恼,帶...
    沈念sama閱讀 33,738評(píng)論 4 324
  • 正文 年R本政府宣布住涉,位于F島的核電站,受9級(jí)特大地震影響钠绍,放射性物質(zhì)發(fā)生泄漏舆声。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,293評(píng)論 3 307
  • 文/蒙蒙 一柳爽、第九天 我趴在偏房一處隱蔽的房頂上張望媳握。 院中可真熱鬧,春花似錦磷脯、人聲如沸蛾找。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,289評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽打毛。三九已至柿赊,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間幻枉,已是汗流浹背碰声。 一陣腳步聲響...
    開封第一講書人閱讀 31,517評(píng)論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留展辞,地道東北人奥邮。 一個(gè)月前我還...
    沈念sama閱讀 45,547評(píng)論 2 354
  • 正文 我出身青樓,卻偏偏與公主長得像罗珍,于是被迫代替她去往敵國和親洽腺。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,834評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容