谷歌開發(fā)的“阿爾法狗”打敗世界頂尖圍棋高手李世石湿颅,讓“深度學(xué)習(xí)”再次成為頭條载绿。谷歌在深度學(xué)習(xí)上不惜重金投入,“阿爾法狗”是其深度學(xué)習(xí)項(xiàng)目的最新成果油航。谷歌的搜索引擎崭庸、語音識(shí)別系統(tǒng)和自動(dòng)駕駛都極大地依賴于深度學(xué)習(xí)技術(shù)。此外谊囚,他們已經(jīng)使用深度學(xué)習(xí)網(wǎng)絡(luò)建立了一個(gè)程序怕享,能在YouYube上抓取畫面,作為索引圖像镰踏。去年函筋,谷歌宣布“智能回復(fù)”,這個(gè)系統(tǒng)能幫助你進(jìn)行簡剪短的郵件回復(fù)奠伪。
深度學(xué)習(xí)似乎無所不能跌帐,但又似乎有幾分神秘。那么绊率,深度學(xué)習(xí)到底為何物谨敛,有何用呢?
機(jī)器學(xué)習(xí)
“機(jī)器學(xué)習(xí)”和“深度學(xué)習(xí)”這兩個(gè)詞有時(shí)候被當(dāng)作同義詞使用滤否,但是它們并不是一回事脸狸。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一種,就好比騎自行是鍛煉的一種藐俺。了解了機(jī)器學(xué)習(xí)炊甲,再了解深度學(xué)習(xí)就會(huì)容易的多泥彤。
機(jī)器學(xué)習(xí)經(jīng)常被描述為“人工智能”(譯者注:Artificial Intelligence,縮寫AI)的一種卿啡。在人工智能環(huán)境中吟吝,是計(jì)算機(jī)學(xué)習(xí)去做某件事,而不是進(jìn)行編程去做牵囤。舉一個(gè)簡單的例子爸黄,你可以用寫代碼的方式編程,讓計(jì)算機(jī)在看到一張?zhí)囟ǖ呢埖恼掌瑫r(shí)揭鳞,識(shí)別出這是一只“貓”炕贵。如果恰好這個(gè)程序見到的這只貓也是照片里的貓,那么這種方法非常奏效野崇。然而称开,如果讓程序去看許多種不同的動(dòng)物,包括不同種類的貓乓梨,并且將貓從其他不同的動(dòng)物中區(qū)別開來鳖轰,這種編程的方法就不靈了。
機(jī)器學(xué)習(xí)的程序可以用不同的方式進(jìn)行訓(xùn)練扶镀。比如蕴侣,其中一種是給這個(gè)程序看大量的動(dòng)物圖片,在每張照片上標(biāo)注處動(dòng)物的名字臭觉。比如昆雀,所有貓的照片就標(biāo)注上“貓”。最后蝠筑,程序?qū)W習(xí)到長得像貓的動(dòng)物就叫“貓”狞膘。這種方法不是去用編程告訴它這張貓的圖片叫“貓”。
這個(gè)程序之所以能這樣做什乙,是因?yàn)閷W(xué)習(xí)了那些經(jīng)常在一起出現(xiàn)特征的組合挽封。比如,貓就一些看得見的特征——它們的體型臣镣、長胡子辅愿、臉,這些特征足以把它們與別的動(dòng)物區(qū)別開來忆某。程序?qū)W習(xí)是把這些不同的特征進(jìn)行組合渠缕,與“貓”聯(lián)系起來。這個(gè)學(xué)習(xí)的過程通常被叫做建模褒繁。
一旦建立了貓的模型,機(jī)器學(xué)習(xí)就用它沒見過的照片測試這個(gè)模型馍忽。通過識(shí)別新的貓進(jìn)行評(píng)價(jià)棒坏,并用產(chǎn)生的信息去調(diào)整模型燕差,以便下次再識(shí)別貓的時(shí)候更為精準(zhǔn)。新的模型隨后不斷被驗(yàn)證坝冕,識(shí)別的準(zhǔn)確性被評(píng)估徒探,以此再調(diào)整。這種迭代過程持續(xù)進(jìn)行喂窟,直到建立的模型能夠高精度識(shí)別貓测暗。
深度學(xué)習(xí)
深度是也是通過機(jī)器學(xué)習(xí)的過程進(jìn)行的,只不過它用的是由很多層級(jí)以分層形式組合在一起的人工神經(jīng)網(wǎng)絡(luò)(artificial neural net)磨澡。這個(gè)網(wǎng)絡(luò)在初級(jí)層次學(xué)習(xí)到一個(gè)簡單的信息碗啄,然而將信息傳遞到下一層。經(jīng)過這一層到處理稳摄,將這個(gè)信息變得復(fù)雜稚字,并傳遞到第三層。在每一個(gè)層級(jí)厦酬,這樣的過程持續(xù)進(jìn)行胆描,進(jìn)而構(gòu)建出比上一個(gè)層級(jí)更為復(fù)雜的信息。
再以貓為例仗阅。深度學(xué)習(xí)網(wǎng)絡(luò)的初級(jí)層級(jí)可能使用貓的圖片中深色和淺色區(qū)域去學(xué)習(xí)貓的輪廓或線條昌讲。初級(jí)層級(jí)包含貓的輪廓的信息傳遞到第二層。在第二個(gè)層級(jí)减噪,這些有關(guān)輪廓的信息被組合成簡單的對(duì)角線或直角短绸。第三個(gè)層級(jí),這些簡單的形狀被組合成更為復(fù)雜的物體——比如橢圓形或長方形旋廷。而下一層級(jí)可能將這些橢圓形和長方形組合成發(fā)育不全的胡須鸠按,爪子或者尾巴。這個(gè)過程持續(xù)進(jìn)行饶碘,直到達(dá)到最高層級(jí)目尖,人工神經(jīng)網(wǎng)絡(luò)就學(xué)會(huì)了識(shí)別貓。在學(xué)習(xí)識(shí)別貓的同時(shí)扎运,網(wǎng)絡(luò)也在學(xué)習(xí)它看到的其他動(dòng)物瑟曲。
深度學(xué)習(xí)有何用?
深度學(xué)習(xí)吸引了很多人的眼球豪治,是因?yàn)樵诂F(xiàn)實(shí)世界中它的應(yīng)用潛力巨大洞拨。前面介紹過,機(jī)器學(xué)習(xí)是用訓(xùn)練的方法將所有的圖片標(biāo)注上“貓”负拟。測試和校對(duì)模型的每一步都要對(duì)圖片上的標(biāo)記和程序中的標(biāo)記進(jìn)行對(duì)比烦衣,從而決定程序的標(biāo)注是否正確。這種訓(xùn)練方法稱之為“督導(dǎo)式學(xué)習(xí)”(supervised learning)。
與機(jī)器學(xué)習(xí)中其他的訓(xùn)練技術(shù)相比花吟,督導(dǎo)式學(xué)習(xí)相對(duì)而言速度快秸歧,而且計(jì)算量不大。但是它有一個(gè)致命的缺陷衅澈,就是現(xiàn)實(shí)世界中的應(yīng)用键菱。一個(gè)人每天使用社交媒體、硬件今布、軟件服務(wù)協(xié)定经备、App準(zhǔn)入條件和cookies數(shù)據(jù)包等產(chǎn)生的信息是海量的。這些信息無論在哪個(gè)層級(jí)都具有極大的商用價(jià)值部默。但問題是侵蒙,這些所有的信息都無法被標(biāo)記,也不能依靠督導(dǎo)式學(xué)習(xí)使用機(jī)器學(xué)習(xí)的方法去訓(xùn)練程序甩牺。如果需要一個(gè)人去標(biāo)記這些數(shù)據(jù)蘑志,那么標(biāo)記的過程將非常耗時(shí)并且昂貴。
相比之下贬派,深度學(xué)習(xí)網(wǎng)絡(luò)就能夠避免這個(gè)缺陷急但,因?yàn)樗鼈兩瞄L的是非督導(dǎo)式學(xué)習(xí)(unsupervised learning)。督導(dǎo)式學(xué)習(xí)和非督導(dǎo)式學(xué)習(xí)最大的區(qū)別是搞乏,在非督導(dǎo)式學(xué)習(xí)中波桩,數(shù)據(jù)不用去標(biāo)記。即使貓的照片不用標(biāo)記上“貓”请敦,深度學(xué)習(xí)依然可以學(xué)習(xí)標(biāo)識(shí)貓镐躲。其他的機(jī)器學(xué)習(xí)是不可同日而語的。
這種從非標(biāo)記數(shù)據(jù)或非建構(gòu)信息中進(jìn)行學(xué)習(xí)的能力侍筛,對(duì)于那些熱衷于現(xiàn)實(shí)應(yīng)用的公司而言是天大的福利萤皂。對(duì)那些滿懷想象,夢想挖掘非建構(gòu)大數(shù)據(jù)寶藏的掘?qū)毴硕韵灰疃葘W(xué)習(xí)無疑為他們打開了這個(gè)寶藏之門裆熙。
深度學(xué)習(xí)可以用在知識(shí)發(fā)現(xiàn)、知識(shí)應(yīng)用和基于知識(shí)的預(yù)測禽笑。換句話說入录,深度學(xué)習(xí)是產(chǎn)生應(yīng)用結(jié)果的超強(qiáng)引擎。
我們看看那些使用深度學(xué)習(xí)系統(tǒng)創(chuàng)造出新鮮玩意兒的公司:
圖像識(shí)別創(chuàng)業(yè)公司ViSenze開發(fā)了一種商用應(yīng)用程序佳镜,讓深度學(xué)習(xí)系統(tǒng)進(jìn)行圖像識(shí)別和標(biāo)簽僚稿,用戶可以使用照片而不是關(guān)鍵詞來檢索自己想要的產(chǎn)品。
美國人工智能公司Skymind建立了一個(gè)開放式的深度學(xué)習(xí)平臺(tái)蟀伸,進(jìn)行詐騙檢測蚀同、用戶推薦缅刽、用戶反饋管理等。
Atomwise使用深度學(xué)習(xí)網(wǎng)絡(luò)唤崭,進(jìn)行新藥物的研發(fā)拷恨。他們使用深度學(xué)習(xí)系統(tǒng)探索重新利用現(xiàn)有和正在測試的藥物,以抵抗新的疾病谢肾。
Descartes實(shí)驗(yàn)室是美國洛斯阿拉莫斯國家實(shí)驗(yàn)室的一個(gè)孵化公司。他們用深度學(xué)習(xí)網(wǎng)絡(luò)通過進(jìn)行衛(wèi)星成像分析小泉,對(duì)食品生產(chǎn)和能源基礎(chǔ)設(shè)施提供實(shí)時(shí)的信息反饋芦疏。
這些,只是使用深度學(xué)習(xí)開發(fā)創(chuàng)新微姊、新鮮事物的很小一部分例子酸茴。
發(fā)現(xiàn)和識(shí)別我們周圍世界中的模型和規(guī)則是科技進(jìn)步的核心。它關(guān)乎我們?nèi)绾芜M(jìn)步兢交,如何創(chuàng)新薪捍。同樣,它也是深度學(xué)習(xí)所擅長的領(lǐng)域配喳。問題不是深度學(xué)習(xí)是否有用酪穿,而是如何用深度學(xué)習(xí)去改進(jìn)正在做的事情,或者晴裹,從已有的數(shù)據(jù)中發(fā)現(xiàn)新的價(jià)值被济。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?——2017年1月2日星期一
注:
本文為譯文,原文鏈接為:http://www.forbes.com/sites/kevinmurnane/2016/04/01/what-is-deep-learning-and-how-is-it-useful/#5dd74ae710f0
原文標(biāo)題:What Is Deep Learning And How Is It Useful?
原文作者:Kevin Murnane涧团,認(rèn)知科學(xué)家只磷、退休教授、音樂家泌绣、游戲愛好者钮追、騎行者。歷史學(xué)學(xué)士阿迈、歷史與哲學(xué)碩士元媚、認(rèn)識(shí)心理學(xué)博士。
本文圖片:均來源于原文仿滔。