有人說,人工智能(AI)是未來鸽扁,人工智能是科幻蒜绽,人工智能也是我們?nèi)粘I钪械囊徊糠帧_@些評(píng)價(jià)可以說都是正確的桶现,就看你指的是哪一種人工智能躲雅。
今年早些時(shí)候,Google DeepMind的AlphaGo打敗了韓國的圍棋大師李世乭九段骡和。在媒體描述DeepMind勝利的時(shí)候相赁,將人工智能(AI)、機(jī)器學(xué)習(xí)(machine learning)和深度學(xué)習(xí)(deep learning)都用上了慰于。這三者在AlphaGo擊敗李世乭的過程中都起了作用钮科,但它們說的并不是一回事。
今天我們就用最簡單的方法——同心圓婆赠,可視化地展現(xiàn)出它們?nèi)叩年P(guān)系和應(yīng)用绵脯。
如上圖休里,人工智能是最早出現(xiàn)的蛆挫,也是最大、最外側(cè)的同心圓份帐;其次是機(jī)器學(xué)習(xí)璃吧,稍晚一點(diǎn);最內(nèi)側(cè)废境,是深度學(xué)習(xí)畜挨,當(dāng)今人工智能大爆炸的核心驅(qū)動(dòng)。
五十年代噩凹,人工智能曾一度被極為看好巴元。之后,人工智能的一些較小的子集發(fā)展了起來驮宴。先是機(jī)器學(xué)習(xí)逮刨,然后是深度學(xué)習(xí)。深度學(xué)習(xí)又是機(jī)器學(xué)習(xí)的子集。深度學(xué)習(xí)造成了前所未有的巨大的影響修己。
| ****從概念的提出到走向繁榮
1956年恢总,幾個(gè)計(jì)算機(jī)科學(xué)家相聚在達(dá)特茅斯會(huì)議(Dartmouth Conferences),提出了“人工智能”的概念睬愤。其后片仿,人工智能就一直縈繞于人們的腦海之中,并在科研實(shí)驗(yàn)室中慢慢孵化尤辱。之后的幾十年砂豌,人工智能一直在兩極反轉(zhuǎn),或被稱作人類文明耀眼未來的預(yù)言光督;或者被當(dāng)成技術(shù)瘋子的狂想扔到垃圾堆里阳距。坦白說,直到2012年之前结借,這兩種聲音還在同時(shí)存在筐摘。
過去幾年,尤其是2015年以來映跟,人工智能開始大爆發(fā)蓄拣。很大一部分是由于GPU的廣泛應(yīng)用扬虚,使得并行計(jì)算變得更快努隙、更便宜、更有效辜昵。當(dāng)然荸镊,無限拓展的存儲(chǔ)能力和驟然爆發(fā)的數(shù)據(jù)洪流(大數(shù)據(jù))的組合拳,也使得圖像數(shù)據(jù)堪置、文本數(shù)據(jù)躬存、交易數(shù)據(jù)、映射數(shù)據(jù)全面海量爆發(fā)舀锨。
讓我們慢慢梳理一下計(jì)算機(jī)科學(xué)家們是如何將人工智能從最早的一點(diǎn)點(diǎn)苗頭岭洲,發(fā)展到能夠支撐那些每天被數(shù)億用戶使用的應(yīng)用的。
| ****人工智能(Artificial Intelligence)——為機(jī)器賦予人的智能
早在1956年夏天那次會(huì)議盾剩,人工智能的先驅(qū)們就夢(mèng)想著用當(dāng)時(shí)剛剛出現(xiàn)的計(jì)算機(jī)來構(gòu)造復(fù)雜的、擁有與人類智慧同樣本質(zhì)特性的機(jī)器替蔬。這就是我們現(xiàn)在所說的“強(qiáng)人工智能”(General AI)告私。這個(gè)無所不能的機(jī)器,它有著我們所有的感知(甚至比人更多)承桥,我們所有的理性驻粟,可以像我們一樣思考。
人們?cè)陔娪袄镆部偸强吹竭@樣的機(jī)器:友好的凶异,像星球大戰(zhàn)中的C-3PO蜀撑;邪惡的挤巡,如終結(jié)者。強(qiáng)人工智能現(xiàn)在還只存在于電影和科幻小說中酷麦,原因不難理解玄柏,我們還沒法實(shí)現(xiàn)它們,至少目前還不行贴铜。
我們目前能實(shí)現(xiàn)的粪摘,一般被稱為“弱人工智能”(Narrow AI)。弱人工智能是能夠與人一樣绍坝,甚至比人更好地執(zhí)行特定任務(wù)的技術(shù)徘意。例如,Pinterest上的圖像分類轩褐;或者Facebook的人臉識(shí)別椎咧。
這些是弱人工智能在實(shí)踐中的例子。這些技術(shù)實(shí)現(xiàn)的是人類智能的一些具體的局部把介。但它們是如何實(shí)現(xiàn)的勤讽?這種智能是從何而來?這就帶我們來到同心圓的里面一層拗踢,機(jī)器學(xué)習(xí)脚牍。
| ****機(jī)器學(xué)習(xí)—— 一種實(shí)現(xiàn)人工智能的方法
機(jī)器學(xué)習(xí)最基本的做法巢墅,是使用算法來解析數(shù)據(jù)诸狭、從中學(xué)習(xí),然后對(duì)真實(shí)世界中的事件做出決策和預(yù)測(cè)君纫。與傳統(tǒng)的為解決特定任務(wù)驯遇、硬編碼的軟件程序不同,機(jī)器學(xué)習(xí)是用大量的數(shù)據(jù)來“訓(xùn)練”蓄髓,通過各種算法從數(shù)據(jù)中學(xué)習(xí)如何完成任務(wù)叉庐。
機(jī)器學(xué)習(xí)直接來源于早期的人工智能領(lǐng)域。傳統(tǒng)算法包括決策樹學(xué)習(xí)会喝、推導(dǎo)邏輯規(guī)劃陡叠、聚類、強(qiáng)化學(xué)習(xí)和貝葉斯網(wǎng)絡(luò)等等好乐。眾所周知匾竿,我們還沒有實(shí)現(xiàn)強(qiáng)人工智能。早期機(jī)器學(xué)習(xí)方法甚至都無法實(shí)現(xiàn)弱人工智能蔚万。
機(jī)器學(xué)習(xí)最成功的應(yīng)用領(lǐng)域是計(jì)算機(jī)視覺岭妖,雖然也還是需要大量的手工編碼來完成工作。人們需要手工編寫分類器、邊緣檢測(cè)濾波器昵慌,以便讓程序能識(shí)別物體從哪里開始假夺,到哪里結(jié)束;寫形狀檢測(cè)程序來判斷檢測(cè)對(duì)象是不是有八條邊斋攀;寫分類器來識(shí)別字母“ST-O-P”已卷。使用以上這些手工編寫的分類器,人們總算可以開發(fā)算法來感知圖像淳蔼,判斷圖像是不是一個(gè)停止標(biāo)志牌侧蘸。
這個(gè)結(jié)果還算不錯(cuò),但并不是那種能讓人為之一振的成功鹉梨。特別是遇到云霧天讳癌,標(biāo)志牌變得不是那么清晰可見,又或者被樹遮擋一部分存皂,算法就難以成功了晌坤。這就是為什么前一段時(shí)間,計(jì)算機(jī)視覺的性能一直無法接近到人的能力旦袋。它太僵化骤菠,太容易受環(huán)境條件的干擾。
隨著時(shí)間的推進(jìn)疤孕,學(xué)習(xí)算法的發(fā)展改變了一切商乎。
| ****深度學(xué)習(xí)——一種實(shí)現(xiàn)機(jī)器學(xué)習(xí)的技術(shù)
人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks)是早期機(jī)器學(xué)習(xí)中的一個(gè)重要的算法胰柑,歷經(jīng)數(shù)十年風(fēng)風(fēng)雨雨截亦。神經(jīng)網(wǎng)絡(luò)的原理是受我們大腦的生理結(jié)構(gòu)——互相交叉相連的神經(jīng)元啟發(fā)爬泥。但與大腦中一個(gè)神經(jīng)元可以連接一定距離內(nèi)的任意神經(jīng)元不同柬讨,人工神經(jīng)網(wǎng)絡(luò)具有離散的層、連接和數(shù)據(jù)傳播的方向袍啡。
例如踩官,我們可以把一幅圖像切分成圖像塊,輸入到神經(jīng)網(wǎng)絡(luò)的第一層境输。在第一層的每一個(gè)神經(jīng)元都把數(shù)據(jù)傳遞到第二層蔗牡。第二層的神經(jīng)元也是完成類似的工作,把數(shù)據(jù)傳遞到第三層嗅剖,以此類推辩越,直到最后一層,然后生成結(jié)果信粮。
每一個(gè)神經(jīng)元都為它的輸入分配權(quán)重黔攒,這個(gè)權(quán)重的正確與否與其執(zhí)行的任務(wù)直接相關(guān)。最終的輸出由這些權(quán)重加總來決定。
我們?nèi)砸酝V梗⊿top)標(biāo)志牌為例督惰。將一個(gè)停止標(biāo)志牌圖像的所有元素都打碎不傅,然后用神經(jīng)元進(jìn)行“檢查”:八邊形的外形、救火車般的紅顏色赏胚、鮮明突出的字母访娶、交通標(biāo)志的典型尺寸和靜止不動(dòng)運(yùn)動(dòng)特性等等觉阅。神經(jīng)網(wǎng)絡(luò)的任務(wù)就是給出結(jié)論,它到底是不是一個(gè)停止標(biāo)志牌典勇。神經(jīng)網(wǎng)絡(luò)會(huì)根據(jù)所有權(quán)重,給出一個(gè)經(jīng)過深思熟慮的猜測(cè)——“概率向量”痴柔。
這個(gè)例子里沦偎,系統(tǒng)可能會(huì)給出這樣的結(jié)果:86%可能是一個(gè)停止標(biāo)志牌;7%的可能是一個(gè)限速標(biāo)志牌豪嚎;5%的可能是一個(gè)風(fēng)箏掛在樹上等等谈火。然后網(wǎng)絡(luò)結(jié)構(gòu)告知神經(jīng)網(wǎng)絡(luò)侈询,它的結(jié)論是否正確。
即使是這個(gè)例子糯耍,也算是比較超前了扔字。直到前不久,神經(jīng)網(wǎng)絡(luò)也還是為人工智能圈所淡忘革为。其實(shí)在人工智能出現(xiàn)的早期舵鳞,神經(jīng)網(wǎng)絡(luò)就已經(jīng)存在了,但神經(jīng)網(wǎng)絡(luò)對(duì)于“智能”的貢獻(xiàn)微乎其微抛虏。主要問題是套才,即使是最基本的神經(jīng)網(wǎng)絡(luò)迂猴,也需要大量的運(yùn)算沸毁。神經(jīng)網(wǎng)絡(luò)算法的運(yùn)算需求難以得到滿足。
不過以清,還是有一些虔誠的研究團(tuán)隊(duì),以多倫多大學(xué)的Geoffrey Hinton為代表眉孩,堅(jiān)持研究勒葱,實(shí)現(xiàn)了以超算為目標(biāo)的并行算法的運(yùn)行與概念證明。但也直到GPU得到廣泛應(yīng)用死遭,這些努力才見到成效凯旋。
我們回過頭來看這個(gè)停止標(biāo)志識(shí)別的例子。神經(jīng)網(wǎng)絡(luò)是調(diào)制至非、訓(xùn)練出來的荒椭,時(shí)不時(shí)還是很容易出錯(cuò)的。它最需要的趣惠,就是訓(xùn)練。需要成百上千甚至幾百萬張圖像來訓(xùn)練草戈,直到神經(jīng)元的輸入的權(quán)值都被調(diào)制得十分精確傍菇,無論是否有霧,晴天還是雨天,每次都能得到正確的結(jié)果淮悼。
只有這個(gè)時(shí)候,我們才可以說神經(jīng)網(wǎng)絡(luò)成功地自學(xué)習(xí)到一個(gè)停止標(biāo)志的樣子见擦;或者在Facebook的應(yīng)用里,神經(jīng)網(wǎng)絡(luò)自學(xué)習(xí)了你媽媽的臉损痰;又或者是2012年吳恩達(dá)(Andrew Ng)教授在Google實(shí)現(xiàn)了神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)到貓的樣子等等酒来。
吳教授的突破在于,把這些神經(jīng)網(wǎng)絡(luò)從基礎(chǔ)上顯著地增大了辽社。層數(shù)非常多翘鸭,神經(jīng)元也非常多,然后給系統(tǒng)輸入海量的數(shù)據(jù)就乓,來訓(xùn)練網(wǎng)絡(luò)生蚁。在吳教授這里,數(shù)據(jù)是一千萬YouTube視頻中的圖像守伸。吳教授為深度學(xué)習(xí)(deep learning)加入了“深度”(deep)。這里的“深度”就是說神經(jīng)網(wǎng)絡(luò)中眾多的層见芹。
現(xiàn)在蠢涝,經(jīng)過深度學(xué)習(xí)訓(xùn)練的圖像識(shí)別,在一些場(chǎng)景中甚至可以比人做得更好:從識(shí)別貓徘铝,到辨別血液中癌癥的早期成分惯吕,到識(shí)別核磁共振成像中的腫瘤。Google的AlphaGo先是學(xué)會(huì)了如何下圍棋淹魄,然后與它自己下棋訓(xùn)練堡距。它訓(xùn)練自己神經(jīng)網(wǎng)絡(luò)的方法兆蕉,就是不斷地與自己下棋缤沦,反復(fù)地下,永不停歇包蓝。
| ****深度學(xué)習(xí)呆奕,給人工智能以璀璨的未來
深度學(xué)習(xí)使得機(jī)器學(xué)習(xí)能夠?qū)崿F(xiàn)眾多的應(yīng)用,并拓展了人工智能的領(lǐng)域范圍绳泉。深度學(xué)習(xí)摧枯拉朽般地實(shí)現(xiàn)了各種任務(wù)姆泻,使得似乎所有的機(jī)器輔助功能都變?yōu)榭赡堋?a target="_blank" rel="nofollow">無人駕駛汽車,預(yù)防性醫(yī)療保健四苇,甚至是更好的電影推薦方咆,都近在眼前,或者即將實(shí)現(xiàn)瓣赂。
人工智能就在現(xiàn)在,就在明天妓肢。有了深度學(xué)習(xí)苫纤,人工智能甚至可以達(dá)到我們暢想的科幻小說一般。你的C-3PO我拿走了喊废,你有你的終結(jié)者就好了恭金。