谷歌大腦最新技術(shù):將神經(jīng)網(wǎng)絡(luò)提煉成軟決策樹玄组!

姓名:付盼龍

轉(zhuǎn)載至全球人工智能

【嵌牛導(dǎo)讀】經(jīng)實(shí)踐證明滔驾,深度神經(jīng)網(wǎng)絡(luò)是執(zhí)行分類任務(wù)的一種非常有效的方法。當(dāng)輸入數(shù)據(jù)是高維度俄讹,輸入輸出之間關(guān)系異常復(fù)雜哆致,標(biāo)注訓(xùn)練樣本數(shù)量非常大的時候,深度神經(jīng)網(wǎng)絡(luò)的性能表現(xiàn)是非常好的患膛。但是很難解釋為什么學(xué)習(xí)網(wǎng)絡(luò)在一個特定的測試用例做出特定的分類決策摊阀。這主要是由于它們對于分布式分層表示的依賴。如果我們能夠充分利用從神經(jīng)網(wǎng)絡(luò)所獲得的知識踪蹬,并在一個依賴分層決策的模型中表達(dá)相同的知識胞此,那么解釋一個特定的決策將會容易得多。我們描述了一種使用已訓(xùn)練的神經(jīng)網(wǎng)絡(luò)創(chuàng)建一種軟決策樹的方法跃捣,該方法的泛化效果要比直接從訓(xùn)練數(shù)據(jù)中得以學(xué)習(xí)要好得多漱牵。

【嵌牛提問】神經(jīng)網(wǎng)絡(luò)如何變?yōu)闆Q策樹?

【嵌牛鼻子】神經(jīng)網(wǎng)絡(luò) 決策樹

【嵌牛正文】

深度神經(jīng)網(wǎng)絡(luò)的優(yōu)秀泛化能力取決于它們在隱藏層中分布式表示的使用疚漆,但這些表示難以理解酣胀。對于第一個隱藏層,我們可以理解是什么原因?qū)е铝艘粋€單元的激活娶聘,而對于最后一個隱藏層闻镶,我們可以理解激活一個單元所產(chǎn)生的效果,但是對于其他隱藏層趴荸,理解一個特征激活的產(chǎn)生原因和造成的影響要困難得多儒溉,尤其是就輸入和輸出變量這些有意義的變量而言。與此同時发钝,隱藏層中的單元將輸入向量的表示分解為一組特征激活顿涣,通過這種方式波闹,激活特征的組合效果能夠在下一隱藏層中產(chǎn)生適當(dāng)?shù)姆植际奖硎尽_@使得我們很難獨(dú)立性地理解任何特定特征激活的函數(shù)作用涛碑,因?yàn)樗倪呺H效應(yīng)依賴于同一層中所有其他單元的影響精堕。

圖片發(fā)自簡書App
這個圖顯示了一個軟二進(jìn)制決策樹,其中有一個內(nèi)部節(jié)點(diǎn)和兩個葉節(jié)點(diǎn)蒲障。

深度網(wǎng)絡(luò)通過對訓(xùn)練數(shù)據(jù)的輸入和輸出之間關(guān)系中的大量弱統(tǒng)計(jì)規(guī)律進(jìn)行建模從而做出可靠的決策歹篓,基于這一事實(shí),上述困難進(jìn)一步加深揉阎,而且庄撮,神經(jīng)網(wǎng)絡(luò)中沒有任何東西可以從訓(xùn)練集的抽樣特性所產(chǎn)生的偽規(guī)律中區(qū)分這些弱規(guī)律,即數(shù)據(jù)的真實(shí)屬性毙籽。面對所有這些困難洞斯,放棄理解深度神經(jīng)網(wǎng)絡(luò)是如何通過理解單一隱藏單元所作所為來進(jìn)行一個分類決策的想法,似乎是明智的坑赡。

相比之下烙如,決策樹是如何進(jìn)行任意特定的分類就很容易解釋了,因?yàn)檫@取決于一個相對較短的決策序列毅否,且每個決策都直接基于輸入數(shù)據(jù)亚铁。然而,決策樹通常不會像神經(jīng)網(wǎng)絡(luò)那樣泛化螟加。與神經(jīng)網(wǎng)絡(luò)中的隱藏單元不同的是徘溢,決策樹較低級別的典型節(jié)點(diǎn)僅被一小部分訓(xùn)練數(shù)據(jù)所使用,因此決策樹的較低部分傾向于過度擬合仰迁,除非與樹的深度相比甸昏,訓(xùn)練集的大小大的程度能夠呈現(xiàn)出指數(shù)級。

圖片發(fā)自簡書App
圖片發(fā)自簡書App
這是一個在MNIST上進(jìn)行訓(xùn)練的深度為4的軟決策樹的可視化圖徐许。內(nèi)部節(jié)點(diǎn)的圖像是已學(xué)習(xí)過的過濾器施蜜,而葉部的圖像是覆蓋所有類的學(xué)習(xí)概率分布的可視化。而最后對每一個葉部的雌隅,以及對每條邊緣的可能分類都已有注釋翻默。如果我們以最右邊的內(nèi)部結(jié)點(diǎn)為例,可以看到恰起,在樹的那個層級上修械,潛在的分類只有3或8,因此检盼,已學(xué)習(xí)的過濾器只是簡單地學(xué)習(xí)該如何區(qū)分這兩個數(shù)字肯污。結(jié)果是一個在尋找這個兩個區(qū)域存在的過濾器,會連接到3的末端,從而生成8蹦渣。

我們提出了一種全新的解決泛化和可解釋性之間矛盾的方法哄芜。我們不是試圖了解深度神經(jīng)網(wǎng)絡(luò)是如何做出決策的,而是使用深度神經(jīng)網(wǎng)絡(luò)來訓(xùn)練一個決策樹柬唯,它會對神經(jīng)網(wǎng)絡(luò)所發(fā)現(xiàn)的輸入輸出函數(shù)進(jìn)行模仿认臊,但是以一種完全不同的方式運(yùn)行。如果有大量未標(biāo)注的數(shù)據(jù)锄奢,則可以使用神經(jīng)網(wǎng)絡(luò)來創(chuàng)建一個更大的標(biāo)注數(shù)據(jù)集用以訓(xùn)練決策樹失晴,從而克服決策樹的統(tǒng)計(jì)無效性問題。即使未標(biāo)注的數(shù)據(jù)不可用拘央,也有可能利用生成建模方面所取得的最新進(jìn)展涂屁,從一個類似數(shù)據(jù)分布的分布中生成合成的未標(biāo)注數(shù)據(jù)。在不使用未標(biāo)注的數(shù)據(jù)的情況下堪滨,我們可以通過使用一種叫做提煉(distillation)的技術(shù)以及一種能夠做軟決策的決策胯陋,將神經(jīng)網(wǎng)絡(luò)的泛化能力遷移到?jīng)Q策樹中。

圖片發(fā)自簡書App
這是一個在Connect4數(shù)據(jù)集上進(jìn)行訓(xùn)練的軟決策樹的前兩層的可視化視圖袱箱。通過檢查學(xué)習(xí)過濾器,我們可以看到义矛,該游戲可以分為兩個不同的子類型游戲发笔,其中一個游戲中,玩家已經(jīng)把金幣放在板的邊緣凉翻,而另一個游戲中了讨,玩家將金幣放置在板的中心。

在測試期間制轰,我們使用決策樹作為我們的模型前计。它的執(zhí)行效果可能會比神經(jīng)網(wǎng)絡(luò)稍微差一點(diǎn),但它通常會快得多垃杖,而且現(xiàn)在我們有了一個模型男杈,可以直接對其決策進(jìn)行解釋和參與其中。現(xiàn)在调俘,我們首先對我們所使用的決策樹的類型進(jìn)行描述伶棒。我們之所以做出這個選擇是為了便于將從深度神經(jīng)網(wǎng)絡(luò)獲得的知識簡化到?jīng)Q策樹中。

我們已經(jīng)描述了一種使用已訓(xùn)練的神經(jīng)網(wǎng)絡(luò)彩库,以軟決策樹的形式創(chuàng)建一個更具可解釋性的模型的方法肤无,其中,決策樹是通過隨機(jī)梯度下降進(jìn)行訓(xùn)練的骇钦,利用神經(jīng)網(wǎng)絡(luò)的預(yù)測以便提供更多的信息目標(biāo)宛渐。軟決策樹使用已學(xué)習(xí)的過濾器做出一個基于輸入樣本的分層決策,最終選擇一個特定的覆蓋所有類的靜態(tài)概率分布作為其輸出。這種軟決策樹的泛化能力要比直接在數(shù)據(jù)上進(jìn)行訓(xùn)練好得多窥翩,但性能表現(xiàn)要比用來提供對其進(jìn)行訓(xùn)練的軟目標(biāo)的神經(jīng)網(wǎng)絡(luò)差得多业岁。因此,如果能夠解釋一個模型為什么要以特定方式對特定測試用例進(jìn)行分類是至關(guān)重要的話鳍烁,那么我們就可以使用軟決策樹叨襟,但是,如果我們使用深度神經(jīng)網(wǎng)絡(luò)來改進(jìn)這個具有可解釋性模型的訓(xùn)練性能的話糊闽,是非常有價值的爹梁。

原文:https://arxiv.org/pdf/1711.09784.pdf

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末念链,一起剝皮案震驚了整個濱河市掂墓,隨后出現(xiàn)的幾起案子君编,更是在濱河造成了極大的恐慌吃嘿,老刑警劉巖兑燥,帶你破解...
    沈念sama閱讀 217,734評論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件降瞳,死亡現(xiàn)場離奇詭異艾蓝,居然都是意外死亡亮靴,警方通過查閱死者的電腦和手機(jī)于置,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,931評論 3 394
  • 文/潘曉璐 我一進(jìn)店門瞄桨,熙熙樓的掌柜王于貴愁眉苦臉地迎上來讶踪,“玉大人乳讥,你說我怎么就攤上這事唉工×芟酰” “怎么了谣膳?”我有些...
    開封第一講書人閱讀 164,133評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經(jīng)常有香客問我,道長咬腕,這世上最難降的妖魔是什么涨共? 我笑而不...
    開封第一講書人閱讀 58,532評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮宠漩,結(jié)果婚禮上举反,老公的妹妹穿的比我還像新娘。我一直安慰自己扒吁,他們只是感情好火鼻,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,585評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般魁索。 火紅的嫁衣襯著肌膚如雪融撞。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,462評論 1 302
  • 那天粗蔚,我揣著相機(jī)與錄音尝偎,去河邊找鬼。 笑死鹏控,一個胖子當(dāng)著我的面吹牛致扯,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播牧挣,決...
    沈念sama閱讀 40,262評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼急前,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了瀑构?” 一聲冷哼從身側(cè)響起裆针,我...
    開封第一講書人閱讀 39,153評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎寺晌,沒想到半個月后世吨,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,587評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡呻征,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,792評論 3 336
  • 正文 我和宋清朗相戀三年耘婚,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片陆赋。...
    茶點(diǎn)故事閱讀 39,919評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡沐祷,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出攒岛,到底是詐尸還是另有隱情赖临,我是刑警寧澤,帶...
    沈念sama閱讀 35,635評論 5 345
  • 正文 年R本政府宣布灾锯,位于F島的核電站兢榨,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏顺饮。R本人自食惡果不足惜吵聪,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,237評論 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望兼雄。 院中可真熱鬧吟逝,春花似錦、人聲如沸君旦。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,855評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至局蚀,卻和暖如春麦锯,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背琅绅。 一陣腳步聲響...
    開封第一講書人閱讀 32,983評論 1 269
  • 我被黑心中介騙來泰國打工扶欣, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人千扶。 一個月前我還...
    沈念sama閱讀 48,048評論 3 370
  • 正文 我出身青樓料祠,卻偏偏與公主長得像,于是被迫代替她去往敵國和親澎羞。 傳聞我的和親對象是個殘疾皇子髓绽,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,864評論 2 354

推薦閱讀更多精彩內(nèi)容

  • 今天,我在衛(wèi)生間里洗漱完妆绞,就走出衛(wèi)生間顺呕,并隨手把燈關(guān)上了。突然括饶,媽媽大叫一聲:“你在干什么株茶?”我說:“我要...
    永恒夜空中最亮的星閱讀 104評論 0 1
  • 朦朧的夢境中,我和潘清美手挽著手图焰,歡聲笑語地走著启盛,她的手挽著我的臂彎,頭輕輕靠著我的肩膀技羔,輕喃著自己玫瑰色的夢……...
    知遙閱讀 1,822評論 5 7
  • 人們常常會說藤滥,越難過棍厂,越要笑,小時候的我們不會懂得它的真正含義超陆,只會遍遍的疑惑,“難過浦马,不是要大聲哭泣才能夠得到真...
    阿俊xi閱讀 1,198評論 0 1
  • 打開文本編輯器(可以使用 vi/vim 命令來創(chuàng)建文件)时呀,新建一個文件 test.sh,擴(kuò)展名為 sh(sh代表s...
    孤月環(huán)舟閱讀 256評論 0 0
  • 珠寶首飾趴梢,有的適合隨時佩戴漠畜,不僅有安神靜眠的效用,也能緩解一些身體的“亞健康”狀態(tài)坞靶。但是憔狞,有些珠寶千萬別再睡覺的時...
    珠寶大課堂閱讀 1,004評論 0 0