Google機(jī)器學(xué)習(xí)筆記(二)決策樹與可視化

Visualizing a Decision Tree

Google Machine Learning Recipes 2
官方中文博客
http://chinagdg.org/2016/03/machine-learning-recipes-for-new-developers/
視頻地址
http://v.youku.com/v_show/id_XMTUzNDE5Mzg0MA==.html?f=26979872&from=y1.2-3.4.3
Github工程地址
https://github.com/ahangchen/GoogleML
歡迎Star锄奢,也歡迎到Issue區(qū)討論

我們從Iris問題,學(xué)習(xí)決策樹可視化,了解決策樹工作過程婚度。

Why decision Tree

有很多分類器

  • Artificial neural network
  • Support Vector Machine
  • Lions
  • Tigers
  • Bears

為啥有這么多動物……

決策樹好處

  • Easy to read and understand
  • 僅有的可解釋的幾種模型之一(能理解分類器做決策的過程)

決策樹就是一系列關(guān)于feature的判斷作為結(jié)點(diǎn)婴程,以label為葉子的一棵樹。因此feature越好,結(jié)果也越好旱眯。

Iris

經(jīng)典機(jī)器學(xué)習(xí)問題:識別三種Iris

可以在維基看到這個數(shù)據(jù)集的詳細(xì)信息耕魄,共 50 * 3 = 150 條記錄

四個feature:Sepal length, Sepal width, Petal length, Petal width

三個label:setosa, versicolor, virginica画恰。

可以從sklearn中直接導(dǎo)入。

組成

  • metadata: feature_names, target_names(這個其實(shí)就是label names)吸奴,描述數(shù)據(jù)用
  • data: 具體feature數(shù)據(jù)允扇,是一個數(shù)組,數(shù)組中的每個元素是dataset中的一條數(shù)據(jù)
  • target: 具體label數(shù)據(jù)则奥,是一個數(shù)組

目標(biāo)

  1. 導(dǎo)入數(shù)據(jù)
  2. 訓(xùn)練分類器
  3. 預(yù)測新的花的label
  4. 查看決策樹

測試數(shù)據(jù)

  • 非訓(xùn)練數(shù)據(jù)的真實(shí)數(shù)據(jù)考润,測試分類器的準(zhǔn)確度,
  • 這里從dataset中抽出第0读处,第50糊治,第100條作為測試數(shù)據(jù)
  • numpy是一個Python的數(shù)據(jù)處理庫,查看官方Tutorial學(xué)習(xí)更多
  • 測試有很多內(nèi)容罚舱,后面還會有井辜。

環(huán)境

可視化使用了pydot,但Pycharm會升級anaconda中的包管闷,導(dǎo)致找不到粥脚,我執(zhí)行了

sudo /home/cwh/anaconda2/bin/conda install -p /home/cwh/anaconda2 pydot -y

重新安裝pydot修復(fù)pydot找不到的問題;

另外pydot會找不到Graphviz包个,需要再安裝

sudo /home/cwh/anaconda2/bin/conda install -p /home/cwh/anaconda2 Graphviz -y

然后將Graphviz添加到環(huán)境變量中刷允,修改/etc/environment為以下內(nèi)容,重啟系統(tǒng)(我的系統(tǒng)是Ubuntu14.04LTS):

PATH="/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games:/home/cwh/android-sdk-linux/ndk-bundle:/home/cwh/android-sdk-linux/platform-tools:/home/cwh/anaconda2/pkgs/graphviz-2.38.0-1/bin"

然后又會有Graphviz中找不到libgvplugin_pango.so.6的問題碧囊,根據(jù)官網(wǎng)Issue的解答树灶,應(yīng)該是少了依賴庫

ldd /home/cwh/anaconda2/pkgs/graphviz-2.38.0-1/lib/graphviz/libgvplugin_pango.so.6

發(fā)現(xiàn)libpng16 not found,于是安裝libpng16糯而,在這里下載破托,然后安裝,

./configure
make
sudo make install
sudo ldconfig

再運(yùn)行代碼即可歧蒋。

代碼

Viz:以Iris為例土砂,導(dǎo)入數(shù)據(jù),訓(xùn)練分類器谜洽,預(yù)測萝映,查看決策樹

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市阐虚,隨后出現(xiàn)的幾起案子序臂,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,907評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件奥秆,死亡現(xiàn)場離奇詭異逊彭,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)构订,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,987評論 3 395
  • 文/潘曉璐 我一進(jìn)店門侮叮,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人悼瘾,你說我怎么就攤上這事囊榜。” “怎么了亥宿?”我有些...
    開封第一講書人閱讀 164,298評論 0 354
  • 文/不壞的土叔 我叫張陵卸勺,是天一觀的道長。 經(jīng)常有香客問我烫扼,道長曙求,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,586評論 1 293
  • 正文 為了忘掉前任映企,我火速辦了婚禮悟狱,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘卑吭。我一直安慰自己芽淡,他們只是感情好马绝,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,633評論 6 392
  • 文/花漫 我一把揭開白布豆赏。 她就那樣靜靜地躺著,像睡著了一般富稻。 火紅的嫁衣襯著肌膚如雪掷邦。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,488評論 1 302
  • 那天椭赋,我揣著相機(jī)與錄音抚岗,去河邊找鬼。 笑死哪怔,一個胖子當(dāng)著我的面吹牛宣蔚,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播认境,決...
    沈念sama閱讀 40,275評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼胚委,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了叉信?” 一聲冷哼從身側(cè)響起亩冬,我...
    開封第一講書人閱讀 39,176評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎硼身,沒想到半個月后硅急,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體覆享,經(jīng)...
    沈念sama閱讀 45,619評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,819評論 3 336
  • 正文 我和宋清朗相戀三年营袜,在試婚紗的時候發(fā)現(xiàn)自己被綠了撒顿。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,932評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡连茧,死狀恐怖核蘸,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情啸驯,我是刑警寧澤客扎,帶...
    沈念sama閱讀 35,655評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站罚斗,受9級特大地震影響徙鱼,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜针姿,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,265評論 3 329
  • 文/蒙蒙 一袱吆、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧距淫,春花似錦绞绒、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,871評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至彤枢,卻和暖如春狰晚,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背缴啡。 一陣腳步聲響...
    開封第一講書人閱讀 32,994評論 1 269
  • 我被黑心中介騙來泰國打工壁晒, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人业栅。 一個月前我還...
    沈念sama閱讀 48,095評論 3 370
  • 正文 我出身青樓秒咐,卻偏偏與公主長得像,于是被迫代替她去往敵國和親碘裕。 傳聞我的和親對象是個殘疾皇子携取,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,884評論 2 354

推薦閱讀更多精彩內(nèi)容