前言:
10月24日開始,集智AI學(xué)園陸續(xù)推送“人工智能簡史”系列文章塌计,講述人工智能從孕育挺身、誕生到坎坷成長的百年歷程侯谁。本文是《人工智能之夢》的第三部分,原文收錄于集智俱樂部第一本實體圖書《科學(xué)的極致:漫談人工智能》章钾。
前情概要:人工智能之夢——夢的持續(xù)(1956-1980)1956年達特茅斯會議之后墙贱,人工智能迎來井噴發(fā)展,許多數(shù)學(xué)定理被計算機證明贱傀,程序可以戰(zhàn)勝跳棋州際冠軍惨撇,在這個黃金時代,人工智能看上去前景光明府寒。然而好景不長魁衙,更難的數(shù)學(xué)定理難倒了計算機,跳棋程序始終無法戰(zhàn)勝世界冠軍株搔,相關(guān)科研經(jīng)費被大幅削減剖淀,人工智能進入寒冬。危難之間纤房,攜帶大量人類知識來解決問題的專家系統(tǒng)出現(xiàn)了……
人工智能之夢
——群龍問鼎(1980—2010)
專家系統(tǒng)纵隔、知識工程的運作需要從外界獲得大量知識的輸入,而這樣的輸入工作是極其費時費力的炮姨,這就是知識獲取的瓶頸捌刮。于是,在20世紀(jì)80年代舒岸,機器學(xué)習(xí)這個原本處于人工智能邊緣地區(qū)的分支一下子成為了人們關(guān)注的焦點绅作。
盡管傳統(tǒng)的人工智能研究者也在奮力掙扎,但是人們很快發(fā)現(xiàn)蛾派,如果采用完全不同的世界觀俄认,即讓知識通過自下而上的方式涌現(xiàn)堕扶,而不是讓專家們自上而下地設(shè)計出來,那么機器學(xué)習(xí)的問題其實可以得到很好地解決梭依。這就好比我們教育小孩子稍算,傳統(tǒng)人工智能好像填鴨式教學(xué),而新的方法則是啟發(fā)式教學(xué):讓孩子自己來學(xué)役拴。
事實上糊探,在人工智能界,很早就有人提出過自下而上的涌現(xiàn)智能的方案河闰,只不過它們從來沒有引起大家的注意科平。一批人認(rèn)為可以通過模擬大腦的結(jié)構(gòu)(神經(jīng)網(wǎng)絡(luò))來實現(xiàn),而另一批人則認(rèn)為可以從那些簡單生物體與環(huán)境互動的模式中尋找答案姜性。他們分別被稱為連接學(xué)派和行為學(xué)派瞪慧。與此相對,傳統(tǒng)的人工智能則被統(tǒng)稱為符號學(xué)派部念。自20世紀(jì)80年代開始弃酌,到20世紀(jì)90年代,這三大學(xué)派形成了三足鼎立的局面儡炼。
符號學(xué)派
作為符號學(xué)派的代表妓湘,人工智能的創(chuàng)始人之一約翰·麥卡錫在自己的網(wǎng)站上掛了一篇文章《什么是人工智能》,為大家闡明什么是人工智能(按照符號學(xué)派的理解)乌询。
(人工智能)是關(guān)于如何制造智能機器榜贴,特別是智能的計算機程序的科學(xué)和工程。它與使用機器來理解人類智能密切相關(guān)妹田,但人工智能的研究并不需要局限于生物學(xué)上可觀察到的那些方法唬党。
在這里,麥卡錫特意強調(diào)人工智能研究并不一定局限于模擬真實的生物智能行為鬼佣,而是更強調(diào)它的智能行為和表現(xiàn)的方面驶拱,這一點和圖靈測試的想法是一脈相承的。另外沮趣,麥卡錫還突出了利用計算機程序來模擬智能的方法屯烦。他認(rèn)為,智能是一種特殊的軟件房铭,與實現(xiàn)它的硬件并沒有太大的關(guān)系驻龟。
紐厄爾和西蒙則把這種觀點概括為“物理符號系統(tǒng)假說”(physical symbolic system hypothesis)。該假說認(rèn)為缸匪,任何能夠?qū)⑽锢淼哪承┠J剑╬attern)或符號進行操作并轉(zhuǎn)化成另外一些模式或符號的系統(tǒng)翁狐,就有可能產(chǎn)生智能的行為。這種物理符號可以是通過高低電位的組成或者是燈泡的亮滅所形成的霓虹燈圖案凌蔬,當(dāng)然也可以是人腦神經(jīng)網(wǎng)絡(luò)上的電脈沖信號露懒。這也恰恰是“符號學(xué)派”得名的依據(jù)闯冷。
在“物理符號系統(tǒng)假說”的支持下,符號學(xué)派把焦點集中在人類智能的高級行為懈词,如推理蛇耀、規(guī)劃、知識表示等方面坎弯。這些工作在一些領(lǐng)域獲得了空前的成功纺涤。
人機大戰(zhàn)
計算機博弈(下棋)方面的成功就是符號學(xué)派名揚天下的資本。早在1958年抠忘,人工智能的創(chuàng)始人之一西蒙就曾預(yù)言撩炊,計算機會在10年內(nèi)成為國際象棋世界冠軍。然而崎脉,正如我們前面討論過的拧咳,這種預(yù)測過于樂觀了。事實比西蒙的預(yù)言足足晚了40年的時間囚灼。
1988年骆膝,IBM開始研發(fā)可以與人下國際象棋的智能程序“深思”——一個可以以每秒70萬步棋的速度進行思考的超級程序。到了1991年啦撮,“深思II”已經(jīng)可以戰(zhàn)平澳大利亞國際象棋冠軍達瑞爾·約翰森(Darryl Johansen)谭网。1996年,“深思”的升級版“深藍”開始挑戰(zhàn)著名的人類國際象棋世界冠軍加里·卡斯帕羅夫(Garry Kasparov)赃春,卻以2:4敗下陣來。但是劫乱,一年后的5月11日织中,“深藍”最終以3.5:2.5的成績戰(zhàn)勝了卡斯帕羅夫(見圖1-5),成為了人工智能的一個里程碑衷戈。
圖片來源:http://cdn.theatlantic.com/static/mt/assets/science/kasparov615.jpg
人機大戰(zhàn)終于以計算機的勝利劃上了句號狭吼。那是不是說計算機已經(jīng)超越了人類了呢?要知道殖妇,計算機通過超級強大的搜索能力險勝了人類——當(dāng)時的“深藍”已經(jīng)可以在1秒鐘內(nèi)算兩億步棋刁笙。而且,“深藍”存儲了100年來幾乎所有的國際特級大師的開局和殘局下法谦趣。另外還有四位國際象棋特級大師親自“訓(xùn)練”“深藍”疲吸,真可謂是超豪華陣容。所以前鹅,最終的結(jié)果很難說是計算機戰(zhàn)勝了人摘悴,更像是一批人戰(zhàn)勝了另一批人。最重要的是舰绘,國際象棋上的博弈是在一個封閉的棋盤世界中進行的蹂喻,而人類智能面對的則是一個復(fù)雜得多的開放世界葱椭。
然而,時隔14年后口四,另外一場在IBM超級計算機和人類之間的人機大戰(zhàn)刷新了記錄孵运,也使得我們必須重新思考機器是否能戰(zhàn)勝人類這個問題。因為這次的比賽不再是下棋蔓彩,而是自由的“知識問答”掐松,這種競賽環(huán)境比國際象棋開放得多,因為提問的知識可以涵蓋時事粪小、歷史大磺、文學(xué)、藝術(shù)探膊、流行文化杠愧、科學(xué)、體育逞壁、地理流济、文字游戲等多個方面。因此腌闯,這次的機器勝利至少證明了計算機同樣可以在開放的世界中表現(xiàn)得不遜于人類绳瘟。
這場人機大戰(zhàn)的游戲叫作《危險》(Jeopardy),是美國一款著名的電視節(jié)目姿骏。在節(jié)目中糖声,主持人通過自然語言給出一系列線索,然后分瘦,參賽隊員要根據(jù)這些線索用最短的時間把主持人描述的人或者事物猜出來蘸泻,并且以提問的方式回答。例如當(dāng)節(jié)目主持人給出線索“這是一種冷血的無足的冬眠動物”的時候嘲玫,選手應(yīng)該回答“什么是蛇悦施?”而不是簡單地回答“蛇”。由于問題會涉及各個領(lǐng)域去团,所以一般知識淵博的人類選手都很難獲勝抡诞。
然而,在2011年2月14日到2月16日期間的《危險》比賽中,IBM公司的超級計算機沃森(Watson)卻戰(zhàn)勝了人類選手(見圖1-6)。
圖片來源:
http://cdn.geekwire.com/wp-content/uploads/IBM-Watson.jpg
這一次剖毯,IBM打造的沃森是一款完全不同于以往的機器。首先乔遮,它必須是一個自然語言處理的高手,因為它必須在短時間內(nèi)理解主持人的提問取刃,甚至有的時候還必須理解語言中的隱含意思蹋肮。而正如我們前文所說出刷,自然語言理解始終是人工智能的最大難題。其次坯辩,沃森必須充分了解字謎馁龟,要領(lǐng)會雙關(guān)語,并且腦中還要裝滿諸如莎士比亞戲劇的獨白漆魔、全球主要的河流和各國首都等知識坷檩,所有這些知識并不限定在某個具體的領(lǐng)域。所以改抡,沃森的勝利的確是人工智能界的一個標(biāo)志性事件矢炼。
可以說,人機大戰(zhàn)是人工智能符號學(xué)派1980年以來最出風(fēng)頭的應(yīng)用阿纤。然而句灌,這種無休止的人機大戰(zhàn)也難逃成為噱頭的嫌疑。事實上欠拾,歷史上每次吸引眼球的人機大戰(zhàn)似乎都必然伴隨著IBM公司的股票大漲胰锌,這也就不難理解為什么IBM會花重金開發(fā)出一款又一款大型計算機去參加這么多無聊的競賽,而不是去做一些更實用的東西了藐窄。
實際上资昧,20世紀(jì)80年代以后,符號學(xué)派的發(fā)展勢頭已經(jīng)遠(yuǎn)不如當(dāng)年了荆忍,因為人工智能武林霸主的地位很快就屬于其他學(xué)派了格带。
連接學(xué)派
我們知道,人類的智慧主要來源于大腦的活動东揣,而大腦則是由一萬億個神經(jīng)元細(xì)胞通過錯綜復(fù)雜的相互連接形成的践惑。于是,人們很自然地想到嘶卧,我們是否可以通過模擬大量神經(jīng)元的集體活動來模擬大腦的智力呢?
對比物理符號系統(tǒng)假說凉袱,我們不難發(fā)現(xiàn)芥吟,如果將智力活動比喻成一款軟件,那么支撐這些活動的大腦神經(jīng)網(wǎng)絡(luò)就是相應(yīng)的硬件专甩。于是钟鸵,主張神經(jīng)網(wǎng)絡(luò)研究的科學(xué)家實際上在強調(diào)硬件的作用,認(rèn)為高級的智能行為是從大量神經(jīng)網(wǎng)絡(luò)的連接中自發(fā)出現(xiàn)的涤躲,因此棺耍,他們又被稱為連接學(xué)派。
神經(jīng)網(wǎng)絡(luò)
連接學(xué)派的發(fā)展也是一波三折种樱。事實上蒙袍,最早的神經(jīng)網(wǎng)絡(luò)研究可以追溯到1943年計算機發(fā)明之前俊卤。當(dāng)時,沃倫·麥卡洛克(Warren McCulloch)和沃爾特·匹茲(Walter Pitts)二人提出了一個單個神經(jīng)元的計算模型害幅,如圖1-7所示消恍。
在這個模型中,左邊的I1,I2,…,IN為輸入單元以现,可以從其他神經(jīng)元接受輸出狠怨,然后將這些信號經(jīng)過加權(quán)(W1,W2,…,WN)傳遞給當(dāng)前的神經(jīng)元并完成匯總。如果匯總的輸入信息強度超過了一定的閾值(T)邑遏,則該神經(jīng)元就會發(fā)放一個信號y給其他神經(jīng)元或者直接輸出到外界佣赖。該模型后來被稱為麥卡洛克-匹茲模型,可以說它是第一個真實神經(jīng)元細(xì)胞的模型记盒。
1957年憎蛤,弗蘭克·羅森布拉特(Frank Rosenblatt)對麥卡洛克-匹茲模型進行了擴充,即在麥卡洛克-匹茲神經(jīng)元上加入了學(xué)習(xí)算法孽鸡,擴充的模型有一個響亮的名字:感知機蹂午。感知機可以根據(jù)模型的輸出y與我們希望模型的輸出y*之間的誤差,調(diào)整權(quán)重W1,W2,…,WN來完成學(xué)習(xí)彬碱。
我們可以形象地把感知機模型理解為一個裝滿了大大小小水龍頭(W1,W2,…,WN)的水管網(wǎng)絡(luò)豆胸,學(xué)習(xí)算法可以調(diào)節(jié)這些水龍頭來控制最終輸出的水流,并讓它達到我們想要的流量巷疼,這就是學(xué)習(xí)的過程晚胡。這樣,感知機就好像一個可以學(xué)習(xí)的小孩嚼沿,無論什么問題估盘,只要明確了我們想要的輸入和輸出之間的關(guān)系,都可能通過學(xué)習(xí)得以解決骡尽,至少它的擁護者是這樣認(rèn)為的遣妥。
然而,好景不長攀细,1969年箫踩,人工智能界的權(quán)威人士馬文·閔斯基給連接學(xué)派帶來了致命一擊。他通過理論分析指出谭贪,感知機并不像它的創(chuàng)立者羅森布拉特宣稱的那樣可以學(xué)習(xí)任何問題境钟。連一個最簡單的問題:判斷一個兩位的二進制數(shù)是否僅包含0或者1(即所謂的XOR問題)都無法完成。這一打擊是致命的俭识,本來就不是很熱的神經(jīng)網(wǎng)絡(luò)研究差點就被閔斯基這一棒子打死了慨削。
多則不同
1974年,人工智能連接學(xué)派的救世主杰夫·辛頓(Geoffrey Hinton)終于出現(xiàn)了。他曾至少兩次挽回連接學(xué)派的敗局缚态,1974年是第一次磁椒,第二次會在下文提到。辛頓的出發(fā)點很簡單——“多則不同”:只要把多個感知機連接成一個分層的網(wǎng)絡(luò)猿规,那么衷快,它就可以圓滿地解決閔斯基的問題。如圖1-8所示姨俩,多個感知機連接成為一個四層的網(wǎng)絡(luò)蘸拔,最左面為輸入層,最右面為輸出層环葵,中間的那些神經(jīng)元位于隱含層调窍,右側(cè)的神經(jīng)元接受左側(cè)神經(jīng)元的輸出。
但接下來的問題是张遭,“人多吃得多”邓萨,那么多個神經(jīng)元,可能有幾百甚至上千個參數(shù)需要調(diào)節(jié)菊卷,我們?nèi)绾螌@樣復(fù)雜的網(wǎng)絡(luò)進行訓(xùn)練呢缔恳?辛頓等人發(fā)現(xiàn),采用幾年前阿瑟·布賴森(Arthur Bryson)等人提出來的反向傳播算法(Back propagation algorithm洁闰,簡稱BP算法)就可以有效解決多層網(wǎng)絡(luò)的訓(xùn)練問題歉甚。
還是以水流管道為例來說明。當(dāng)網(wǎng)絡(luò)執(zhí)行決策的時候扑眉,水從左側(cè)的輸入節(jié)點往右流纸泄,直到輸出節(jié)點將水吐出。而在訓(xùn)練階段腰素,我們則需要從右往左來一層層地調(diào)節(jié)各個水龍頭聘裁,要使水流量達到要求,我們只要讓每一層的調(diào)節(jié)只對它右面一層的節(jié)點負(fù)責(zé)就可以了弓千,這就是反向傳播算法衡便。事實證明,多層神經(jīng)網(wǎng)絡(luò)裝備上反向傳播算法之后洋访,可以解決很多復(fù)雜的識別和預(yù)測等問題砰诵。
幾乎是在同一時間,又有幾個不同的神經(jīng)網(wǎng)絡(luò)模型先后被提出捌显,這些模型有的可以完成模式聚類,有的可以模擬聯(lián)想思維总寒,有的具有深厚的數(shù)學(xué)物理基礎(chǔ)扶歪,有的則模仿生物的構(gòu)造。所有這些大的突破都令連接學(xué)派名聲大噪,異軍突起善镰。
統(tǒng)計學(xué)習(xí)理論
然而妹萨,連接學(xué)派的科學(xué)家們很快又陷入了困境。雖然各種神經(jīng)網(wǎng)絡(luò)可以解決問題炫欺,但是乎完,它們究竟為什么會成功以及為什么在有些問題上會屢遭失敗,卻沒有人能說得清楚品洛。對網(wǎng)絡(luò)運行原理的無知树姨,也使得人們對如何提高神經(jīng)網(wǎng)絡(luò)運行效率的問題無從下手。因此桥状,連接學(xué)派需要理論的支持帽揪。
2000年左右,弗拉基米爾·萬普尼克(Vladimir Naumovich Vapnik)和亞歷克塞·澤范蘭杰斯(Alexey Yakovlevich Chervonenkis)這兩位俄羅斯科學(xué)家提出了一整套新的理論:統(tǒng)計學(xué)習(xí)理論辅斟,受到連接學(xué)派的頂禮膜拜转晰。
該理論大意可概括為“殺雞焉用宰牛刀”。我們的模型一定要與待解決的問題相匹配士飒,如果模型過于簡單查邢,而問題本身的復(fù)雜度很高,就無法得到預(yù)期的精度酵幕。反過來扰藕,若問題本身簡單,而模型過于復(fù)雜裙盾,那么模型就會比較僵死实胸,無法舉一反三,即出現(xiàn)所謂的“過擬合”(overfitting)現(xiàn)象番官。
實際上庐完,統(tǒng)計學(xué)習(xí)理論的精神與奧卡姆剃刀原理有著深刻的聯(lián)系。威廉·奧卡姆(William Occum徘熔,1287—1347)是中世紀(jì)時期的著名哲學(xué)家门躯,他留下的最重要的遺產(chǎn)就是奧卡姆剃刀原理。該原理說酷师,如果對于同一個問題有不同的解決方案讶凉,那么我們應(yīng)該挑選其中最簡單的一個。神經(jīng)網(wǎng)絡(luò)或者其他機器學(xué)習(xí)模型也應(yīng)該遵循類似的原理山孔,只有當(dāng)模型的復(fù)雜度與所解決的問題相匹配的時候懂讯,才能讓模型更好地發(fā)揮作用。
然而台颠,統(tǒng)計學(xué)習(xí)理論也有很大的局限性褐望,因為理論的嚴(yán)格分析僅僅限于一類特殊的神經(jīng)網(wǎng)絡(luò)模型:支持向量機(Supporting Vector Machine)。而對于更一般的神經(jīng)網(wǎng)絡(luò),人們還未找到統(tǒng)一的分析方法瘫里。所以說实蔽,連接學(xué)派的科學(xué)家們雖然會向大腦學(xué)習(xí)如何構(gòu)造神經(jīng)網(wǎng)絡(luò)模型,但實際上他們自己也不清楚這些神經(jīng)網(wǎng)絡(luò)究竟是如何工作的谨读。不過局装,他們這種尷尬局面也是無獨有偶,另外一派后起之秀雖然來勢洶洶劳殖,卻也沒有解決理論基礎(chǔ)問題铐尚,這就是行為學(xué)派。
行為學(xué)派
行為學(xué)派的出發(fā)點與符號學(xué)派和連接學(xué)派完全不同闷尿,他們并沒有把目光聚焦在具有高級智能的人類身上塑径,而是關(guān)注比人類低級得多的昆蟲。即使這樣簡單的動物也體現(xiàn)出了非凡的智能填具,昆蟲可以靈活地擺動自己的身體行走统舀,還能夠快速地反應(yīng),躲避捕食者的攻擊劳景。而另一方面誉简,盡管螞蟻個體非常簡單,但是盟广,當(dāng)很多小螞蟻聚集在一起形成龐大的蟻群的時候闷串,卻能表現(xiàn)出非凡的智能,還能形成嚴(yán)密的社會分工組織筋量。
正是受到了自然界中這些相對低等生物的啟發(fā)烹吵,行為學(xué)派的科學(xué)家們決定從簡單的昆蟲入手來理解智能的產(chǎn)生。的確桨武,他們?nèi)〉昧瞬诲e的成果肋拔。
機器昆蟲
羅德尼·布魯克斯(Rodney Brooks)是一名來自美國麻省理工學(xué)院的機器人專家。在他的實驗室中有大量的機器昆蟲(如圖1-9所示)呀酸。相對于那些笨拙的機器人鐵家伙來說凉蜂,這些小昆蟲要靈活得多。
圖片來源:http://grant.solarbotics.net/walkman.htm性誉。
這些機器昆蟲沒有復(fù)雜的大腦窿吩,也不會按照傳統(tǒng)的方式進行復(fù)雜的知識表示和推理。它們甚至不需要大腦的干預(yù)错览,僅憑四肢和關(guān)節(jié)的協(xié)調(diào)纫雁,就能很好地適應(yīng)環(huán)境。當(dāng)我們把這些機器昆蟲放到復(fù)雜的地形中的時候倾哺,它們可以痛快地爬行先较,還能聰明地避開障礙物携冤。它們看起來的智能事實上并不來源于自上而下的復(fù)雜設(shè)計,而是來源于自下而上的與環(huán)境的互動闲勺。這就是布魯克斯所倡導(dǎo)的理念。
如果說符號學(xué)派模擬智能軟件扣猫,連接學(xué)派模擬大腦硬件菜循,那么行為學(xué)派就算是模擬身體了,而且是簡單的申尤、看起來沒有什么智能的身體癌幕。例如,行為學(xué)派的一個非常成功的應(yīng)用就是美國波士頓動力公司(Boston Dynamics)研制開發(fā)的機器人“大狗②昧穿。如圖1-10所示勺远,“大狗”是一個四足機器人,它能夠在各種復(fù)雜的地形中行走时鸵、攀爬胶逢、奔跑,甚至還可以背負(fù)重物饰潜〕踝梗“大狗”模擬了四足動物的行走行為,能夠自適應(yīng)地根據(jù)不同的地形調(diào)整行走的模式彭雾。推薦感興趣的讀者掃描下方二維碼觀看視頻介紹碟刺。
大狗:BigDog,參見http://www.bostondynamics.com/robot_bigdog.html薯酝。
圖片來源:http://www.militaryfactory.com/armor/detail.asp?armor_id=184半沽。
當(dāng)這只大狗伴隨著“沙沙”的機器運作聲朝你走來時,你一定會被它的氣勢所嚇到吴菠,因為它的樣子很像是一頭公牛呢者填!
進化計算
我們從生物身上學(xué)到的東西還不僅僅是這些。從更長的時間尺度看橄务,生物體對環(huán)境的適應(yīng)還會迫使生物進化幔托,從而實現(xiàn)從簡單到復(fù)雜、從低等到高等的躍遷蜂挪。
約翰·霍蘭(John Holland)是美國密西根大學(xué)的心理學(xué)重挑、電器工程以及計算機的三科教授。他本科畢業(yè)于麻省理工學(xué)院棠涮,后來到了密西根大學(xué)師從阿瑟·伯克斯(Arthur Burks谬哀,曾是馮·諾依曼的助手)攻讀博士學(xué)位。1959年严肪,他拿到了全世界首個計算機科學(xué)的博士頭銜史煎。別看霍蘭個頭不高谦屑,他的骨子里卻有一種離經(jīng)叛道的氣魄。他在讀博期間就對如何用計算機模擬生物進化異常著迷篇梭,并最終發(fā)表了他的遺傳算法氢橙。
遺傳算法對大自然中的生物進化進行了大膽的抽象,最終提取出兩個主要環(huán)節(jié):變異(包括基因重組和突變)和選擇恬偷。在計算機中悍手,我們可以用一堆二進制串來模擬自然界中的生物體。而大自然的選擇作用——生存競爭袍患、優(yōu)勝劣汰——則被抽象為一個簡單的適應(yīng)度函數(shù)坦康。這樣,一個超級濃縮版的大自然進化過程就可以搬到計算機中了诡延,這就是遺傳算法滞欠。
遺傳算法在剛發(fā)表的時候并沒有引起多少人的重視。然而肆良,隨著時間的推移筛璧,當(dāng)人工智能的焦點轉(zhuǎn)向機器學(xué)習(xí)時,遺傳算法就一下子家喻戶曉了妖滔,因為它的確是一個非常簡單而有效的機器學(xué)習(xí)算法隧哮。與神經(jīng)網(wǎng)絡(luò)不同,遺傳算法不需要把學(xué)習(xí)區(qū)分成訓(xùn)練和執(zhí)行兩個階段座舍,它完全可以指導(dǎo)機器在執(zhí)行中學(xué)習(xí)沮翔,即所謂的做中學(xué)(learning by doing)。同時曲秉,遺傳算法比神經(jīng)網(wǎng)絡(luò)具有更方便的表達性和簡單性采蚀。
無獨有偶,美國的勞倫斯·福格爾(Lawrence Fogel)承二、德國的因戈·雷伯格(Ingo Rechenberg)以及漢斯·保羅·施韋費爾(Hans-Paul Schwefel)榆鼠、霍蘭的學(xué)生約翰·科扎(John Koza)等人也先后提出了演化策略、演化編程和遺傳編程亥鸠。這使得進化計算大家庭的成員更加多樣化了妆够。
人工生命
無論是機器昆蟲還是進化計算,科學(xué)家們關(guān)注的焦點都是如何模仿生物來創(chuàng)造智能的機器或者算法负蚊。克里斯托弗·蘭頓(Chirstopher Langton)進行了進一步提煉神妹,提出了“人工生命”這一新興學(xué)科。人工生命與人工智能非常接近家妆,但是它的關(guān)注點在于如何用計算的手段來模擬生命這種更加“低等”的現(xiàn)象鸵荠。
人工生命認(rèn)為,所謂的生命或者智能實際上是從底層單元(可以是大分子化合物伤极,也可以是數(shù)字代碼)通過相互作用而產(chǎn)生的涌現(xiàn)屬性(emergent property)蛹找∫躺耍“涌現(xiàn)”(emergence)這個詞是人工生命研究中使用頻率最高的詞之一,它強調(diào)了一種只有在宏觀具備但不能分解還原到微觀層次的屬性庸疾、特征或行為乍楚。單個的蛋白質(zhì)分子不具備生命特征,但是大量的蛋白質(zhì)分子組合在一起形成細(xì)胞的時候彼硫,整個系統(tǒng)就具備了“活”性炊豪,這就是典型的涌現(xiàn)。同樣地拧篮,智能則是比生命更高一級(假如我們能夠?qū)⒅悄芎蜕殖刹煌燃壍脑挘┑挠楷F(xiàn)——在生命系統(tǒng)中又涌現(xiàn)出了一整套神經(jīng)網(wǎng)絡(luò)系統(tǒng),從而使得整個生命體具備了智能屬性∏2眨現(xiàn)實世界中的生命是由碳水化合物編織成的一個復(fù)雜網(wǎng)絡(luò)串绩,而人工生命則是寄生于01世界中的復(fù)雜有機體。
人工生命的研究思路是通過模擬的形式在計算機數(shù)碼世界中產(chǎn)生類似現(xiàn)實世界的涌現(xiàn)芜壁。因此礁凡,從本質(zhì)上講,人工生命模擬的就是涌現(xiàn)過程慧妄,而不太關(guān)心實現(xiàn)這個過程的具體單元顷牌。我們用01數(shù)字代表蛋白質(zhì)分子,并為其設(shè)置詳細(xì)的規(guī)則塞淹,接下來的事情就是運行這個程序窟蓝,然后盯著屏幕,喝上一杯咖啡饱普,等待著令人吃驚的“生命現(xiàn)象”在電腦中出現(xiàn)运挫。
模擬群體行為是人工生命的典型應(yīng)用之一。1983年套耕,計算機圖形學(xué)家克雷格·雷諾茲(Craig Reynolds)曾開發(fā)了一個名為Boid的計算機模擬程序(見圖1-11)谁帕,它可以逼真地模擬鳥群的運動,還能夠聰明地躲避障礙物冯袍。后來匈挖,肯尼迪(Kennedy)等人于1995年擴展了Boid模型,提出了PSO(粒子群優(yōu)化)算法康愤,成功地通過模擬鳥群的運動來解決函數(shù)優(yōu)化等問題儡循。
圖片來源:http://www.red3d.com/cwr/boids/。
類似地翘瓮,利用模擬群體行為來實現(xiàn)智能設(shè)計的例子還有很多贮折,例如蟻群算法、免疫算法等资盅,共同特征都是讓智能從規(guī)則中自下而上地涌現(xiàn)出來调榄,并能解決實際問題踊赠。關(guān)于人工生命的詳細(xì)討論,可以參考本書11~13章每庆。
然而筐带,行為學(xué)派帶來的問題似乎比提供的解決方法還多。究竟在什么情況下能夠發(fā)生涌現(xiàn)缤灵?如何設(shè)計底層規(guī)則使得系統(tǒng)能夠以我們希望的方式涌現(xiàn)伦籍?行為學(xué)派、人工生命的研究者們無法回答腮出。更糟糕的是帖鸦,幾十年過去了,人工生命研究似乎仍然只擅長于模擬小蟲子胚嘲、螞蟻之類的低等生物作儿,高級的智能完全沒有像他們預(yù)期的那樣自然涌現(xiàn),而且沒有絲毫跡象馋劈。
三大學(xué)派間的關(guān)系
正如我們前面提到的攻锰,這三個學(xué)派大致是從軟件、硬件和身體這三個角度來模擬和理解智能的妓雾。但是娶吞,這僅僅是一個粗糙的比喻。事實上械姻,三大學(xué)派之間還存在著很多微妙的差異和聯(lián)系妒蛇。
首先,符號學(xué)派的思想和觀點直接繼承自圖靈策添,他們是直接從功能的角度來理解智能的材部。他們把智能理解為一個黑箱,只關(guān)心這個黑箱的輸入和輸出唯竹,而不關(guān)心黑箱的內(nèi)部構(gòu)造乐导。因此,符號學(xué)派利用知識表示和搜索來替代真實人腦的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)浸颓。符號學(xué)派假設(shè)知識是先驗地存儲于黑箱之中的物臂,因此,它很擅長解決利用現(xiàn)有的知識做比較復(fù)雜的推理产上、規(guī)劃棵磷、邏輯運算和判斷等問題。
連接學(xué)派則顯然要把智能系統(tǒng)的黑箱打開晋涣,從結(jié)構(gòu)的角度來模擬智能系統(tǒng)的運作仪媒,而不單單重現(xiàn)功能。這樣谢鹊,連接學(xué)派看待智能會比符號學(xué)派更加底層算吩。這樣做的好處是可以很好地解決機器學(xué)習(xí)的問題留凭,并自動獲取知識;但是弱點是對于知識的表述是隱含而晦澀的偎巢,因為所有學(xué)習(xí)到的知識都變成了連接權(quán)重的數(shù)值蔼夜。我們?nèi)粢x出神經(jīng)網(wǎng)絡(luò)中存儲的知識,就必須要讓這個網(wǎng)絡(luò)運作起來压昼,而無法直接從模型中讀出求冷。連接學(xué)派擅長解決模式識別、聚類窍霞、聯(lián)想等非結(jié)構(gòu)化的問題匠题,但卻很難解決高層次的智能問題(如機器定理證明)。
行為學(xué)派則研究更低級的智能行為但金,它更擅長模擬身體的運作機制梧躺,而不是腦。同時傲绣,行為學(xué)派非常強調(diào)進化的作用,他們認(rèn)為巩踏,人類的智慧也理應(yīng)是從漫長的進化過程中逐漸演變而來的秃诵。行為學(xué)派擅長解決適應(yīng)性、學(xué)習(xí)塞琼、快速行為反應(yīng)等問題菠净,也可以解決一定的識別、聚類彪杉、聯(lián)想等問題毅往,但在高級智能行為(如問題求解、邏輯演算)上則相形見絀派近。
有意思的是攀唯,連接學(xué)派和行為學(xué)派似乎更加接近,因為他們都相信智能是自下而上涌現(xiàn)出來的渴丸,而非自上而下的設(shè)計侯嘀。但麻煩在于,怎么涌現(xiàn)谱轨?涌現(xiàn)的機制是什么戒幔?這些深層次問題無法在兩大學(xué)派內(nèi)部解決,而必須求助于復(fù)雜系統(tǒng)科學(xué)土童。
三大學(xué)派分別從高诗茎、中、低三個層次來模擬智能献汗,但現(xiàn)實中的智能系統(tǒng)顯然是一個完整的整體敢订。我們應(yīng)如何調(diào)解王污、綜合這三大學(xué)派的觀點呢?這是一個未解決的開放問題枢析,而且似乎很難在短時間內(nèi)解決玉掸。主要的原因在于,無論是在理論指導(dǎo)思想還是計算機模型等方面醒叁,三大學(xué)派都存在著太大的差異司浪。
分裂與統(tǒng)一
于是,就這樣磕磕碰碰地把沼,人工智能走入了新的世紀(jì)啊易。到了2000年前后,人工智能的發(fā)展非但沒有解決問題饮睬,反而引入了一個又一個新的問題租谈,這些問題似乎變得越來越難以回答,而且所牽扯的理論也越來越深捆愁。于是割去,很多人工智能研究者干脆當(dāng)起了“鴕鳥”,對理論問題不聞不問昼丑,而是一心向“應(yīng)用”看齊呻逆。爭什么爭呀,實踐是檢驗真理的唯一標(biāo)準(zhǔn)菩帝,無論是符號咖城、連接、行為呼奢,能夠解決實際問題的鳥就是好鳥宜雀。
群龍無首
在這樣一種大背景下,人工智能開始進一步分化握础,很多原本隸屬于人工智能的領(lǐng)域逐漸獨立成為面向具體應(yīng)用的新興學(xué)科辐董,我們簡單羅列如下:
自動定理證明
模式識別
機器學(xué)習(xí)
自然語言理解
計算機視覺
自動程序設(shè)計
每一個領(lǐng)域都包含大量具體的技術(shù)和專業(yè)知識以及特殊的應(yīng)用背景,不同分支之間也幾乎是老死不相往來弓候,大一統(tǒng)的人工智能之夢仿佛破滅了郎哭。于是,計算機視覺專家甚至不愿意承認(rèn)自己搞的叫人工智能菇存,因為他們認(rèn)為夸研,人工智能已經(jīng)成為了一個僅僅代表傳統(tǒng)的符號學(xué)派觀點的專有名詞,大一統(tǒng)的人工智能概念沒有任何意義依鸥,也沒有存在的必要亥至。這就是人工智能進入2000年之后的狀況。
貝葉斯統(tǒng)計
但是,世界總是那么奇妙姐扮,少數(shù)派總是存在的絮供。當(dāng)人工智能正面臨著土崩瓦解的窘境時,仍然有少數(shù)科學(xué)家正在逆流而動茶敏,試圖重新構(gòu)建統(tǒng)一的模式壤靶。
麻省理工學(xué)院的喬希·特南鮑姆(Josh Tenenbaum)以及斯坦福大學(xué)的達芙妮·科勒(Daphne Koller)就是這樣的少數(shù)派惊搏。他們的特立獨行起源于對概率這個有著幾百年歷史的數(shù)學(xué)概念的重新認(rèn)識贮乳,并利用這種認(rèn)識來統(tǒng)一人工智能的各個方面,包括學(xué)習(xí)恬惯、知識表示向拆、推理以及決策。
這樣的認(rèn)識其實可以追溯到一位18世紀(jì)的古人酪耳,這就是著名的牧師浓恳、業(yè)余數(shù)學(xué)家:托馬斯·貝葉斯(Thomas Bayes)。與傳統(tǒng)的方法不同碗暗,貝葉斯將事件的概率視為一種主觀的信念颈将,而不是傳統(tǒng)意義上的事件發(fā)生的頻率。因此言疗,概率是一種主觀的測度消请,而非客觀的度量钉答。故而做院,人們也將貝葉斯對概率的看法稱為主觀概率學(xué)派——這一觀點更加明確地凸顯出貝葉斯概率與傳統(tǒng)概率統(tǒng)計的區(qū)別盗棵。
貝葉斯學(xué)派的核心就是著名的貝葉斯公式呻引,它表達了智能主體如何根據(jù)搜集到的信息改變對外在事物的看法挖腰。因此捉捅,貝葉斯公式概括了人們的學(xué)習(xí)過程闯捎。以貝葉斯公式為基礎(chǔ)撒蟀,人們發(fā)展出了一整套稱為貝葉斯網(wǎng)絡(luò)(示例見圖1-12)的方法叙谨。在這個網(wǎng)絡(luò)上,研究者可以展開對學(xué)習(xí)保屯、知識表示和推理的各種人工智能的研究手负。隨著大數(shù)據(jù)時代的來臨,貝葉斯方法所需要的數(shù)據(jù)也是唾手可得姑尺,這使得貝葉斯網(wǎng)絡(luò)成為了人們關(guān)注的焦點竟终。
圖片來源:Wikipedia。
通用人工智能
另外一個嘗試統(tǒng)一人工智能的學(xué)者是澳大利亞國立大學(xué)的馬庫斯·胡特(Marcus Hutter)切蟋,他在2000年的時候就開始嘗試建立一個新的學(xué)科统捶,并為這個新學(xué)科取了一個響當(dāng)當(dāng)?shù)拿郑和ㄓ萌斯ぶ悄埽║niversal Artificial Intelligence)。
胡特認(rèn)為,現(xiàn)在主流的人工智能研究已經(jīng)嚴(yán)重偏離人工智能這個名稱的本意喘鸟。我們不應(yīng)該將智能化分成學(xué)習(xí)匆绣、認(rèn)知、決策什黑、推理等分立的不同側(cè)面崎淳。事實上,對于人類來說愕把,所有這些功能都是智能作為一個整體的不同表現(xiàn)拣凹。因此,在人工智能中礼华,我們應(yīng)該始終保持清醒的頭腦咐鹤,將智能看作一個整體,而不是若干分離的子系統(tǒng)圣絮。
如果非要堅持統(tǒng)一性和廣泛性祈惶,那么我們就不得不放棄理論上的實用性,這恰恰正是胡特的策略扮匠。與通常的人工智能研究非常不同捧请,胡特采用的是規(guī)范研究方法,即給出所謂的智能程序一個數(shù)學(xué)上的定義棒搜,然后運用嚴(yán)格的數(shù)理邏輯討論它的性質(zhì)疹蛉。但是,理論上已證明力麸,胡特定義的智能程序是數(shù)學(xué)上可構(gòu)造的可款,但卻是計算機不可計算的——任何計算機都無法模擬這樣的智能程序——只有上帝能計算出來。
不可計算的智能程序有什么用克蚂?相信讀者會有這樣的疑問闺鲸。實際上,如果在20世紀(jì)30年代埃叭,我們也會對圖靈的研究發(fā)出同樣的疑問摸恍。因為那個時候計算機還沒有發(fā)明呢,那么圖靈機模型有什么用呢赤屋?這也仿佛是傳說中英國女王對法拉第的詰難:“你研究的這些電磁理論有什么用呢立镶?”法拉第則反問道:“那么,我尊敬的女王陛下类早,您認(rèn)為媚媒,您懷中抱著的嬰兒有什么用呢?”
胡特的理論雖然還不能與圖靈的研究相比涩僻,但是欣范,它至少為統(tǒng)一人工智能開辟了新方向变泄,讓我們看到了統(tǒng)一的曙光。我們只有等待歷史來揭曉最終的答案恼琼。更多關(guān)于通用人工智能的內(nèi)容妨蛹,請參見本書第5章。
未完待續(xù)......
21世紀(jì)的第二個十年晴竞,如果要評選出最惹人注目的人工智能研究蛙卤,那么一定要數(shù)深度學(xué)習(xí)(Deep Learning)。
下期“AI 簡史”噩死,我們將為你揭曉深度學(xué)習(xí)如何在新世紀(jì)崛起颤难。
張江:《人工智能之夢》系列
人工智能之夢——群龍問鼎(1980-2010)
人工智能之夢——夢醒何方(2010至今)
原書:《科學(xué)的極致:漫談人工智能》豆瓣評分8.3
https://book.douban.com/subject/26546914/
搜索微信公眾號:swarmAI
集智AI學(xué)園QQ群:426390994
學(xué)園網(wǎng)站:campus.swarma.org