貝葉斯統(tǒng)計
但是岸晦,世界總是那么奇妙三热,少數(shù)派總是存在的弃揽。當人工智能正面臨著土崩瓦解的窘境時脯爪,仍然有少數(shù)科學家正在逆流而動,試圖重新構(gòu)建統(tǒng)一的模式矿微。
麻省理工學院的喬希?特南鮑姆(Josh Tenenbaum)以及斯坦福大學的達芙妮?科勒(Daphne Koller)就是這樣的少數(shù)派痕慢。他們的特立獨行起源于對概率這個有著幾百年歷史的數(shù)學概念的重新認識,并利用這種認識來統(tǒng)一人工智能的各個方面涌矢,包括學習掖举、知識表示、推理以及決策娜庇。
這樣的認識其實可以追溯到一位18世紀的古人塔次,這就是著名的牧師、業(yè)余數(shù)學家:托馬斯?貝葉斯(Thomas Bayes)名秀。與傳統(tǒng)的方法不同励负,貝葉斯將事件的概率視為一種主觀的信念,而不是傳統(tǒng)意義上的事件發(fā)生的頻率匕得。因此继榆,概率是一種主觀的測度,而非客觀的度量汁掠。故而略吨,人們也將貝葉斯對概率的看法稱為主觀概率學派——這一觀點更加明確地凸顯出貝葉斯概率與傳統(tǒng)概率統(tǒng)計的區(qū)別。
貝葉斯學派的核心就是著名的貝葉斯公式考阱,它表達了智能主體如何根據(jù)搜集到的信息改變對外在事物的看法翠忠。因此,貝葉斯公式概括了人們的學習過程羔砾。以貝葉斯公式為基礎(chǔ)负间,人們發(fā)展出了一整套稱為貝葉斯網(wǎng)絡(luò)(示例見圖1-12)的方法偶妖。在這個網(wǎng)絡(luò)上,研究者可以展開對學習政溃、知識表示和推理的各種人工智能的研究趾访。隨著大數(shù)據(jù)時代的來臨,貝葉斯方法所需要的數(shù)據(jù)也是唾手可得董虱,這使得貝葉斯網(wǎng)絡(luò)成為了人們關(guān)注的焦點扼鞋。
圖片來源:Wikipedia。
通用人工智能
另外一個嘗試統(tǒng)一人工智能的學者是澳大利亞國立大學的馬庫斯?胡特(Marcus Hutter)愤诱,他在2000年的時候就開始嘗試建立一個新的學科云头,并為這個新學科取了一個響當當?shù)拿郑和ㄓ萌斯ぶ悄埽║niversal Artificial Intelligence)。
胡特認為淫半,現(xiàn)在主流的人工智能研究已經(jīng)嚴重偏離人工智能這個名稱的本意溃槐。我們不應(yīng)該將智能化分成學習、認知科吭、決策昏滴、推理等分立的不同側(cè)面。事實上对人,對于人類來說谣殊,所有這些功能都是智能作為一個整體的不同表現(xiàn)。因此牺弄,在人工智能中姻几,我們應(yīng)該始終保持清醒的頭腦,將智能看作一個整體势告,而不是若干分離的子系統(tǒng)蛇捌。
如果非要堅持統(tǒng)一性和廣泛性,那么我們就不得不放棄理論上的實用性培慌,這恰恰正是胡特的策略豁陆。與通常的人工智能研究非常不同,胡特采用的是規(guī)范研究方法吵护,即給出所謂的智能程序一個數(shù)學上的定義盒音,然后運用嚴格的數(shù)理邏輯討論它的性質(zhì)。但是馅而,理論上已證明祥诽,胡特定義的智能程序是數(shù)學上可構(gòu)造的,但卻是計算機不可計算的——任何計算機都無法模擬這樣的智能程序——只有上帝能計算出來瓮恭。
不可計算的智能程序有什么用雄坪?相信讀者會有這樣的疑問。實際上屯蹦,如果在20世紀30年代维哈,我們也會對圖靈的研究發(fā)出同樣的疑問绳姨。因為那個時候計算機還沒有發(fā)明呢,那么圖靈機模型有什么用呢阔挠?這也仿佛是傳說中英國女王對法拉第的詰難:“你研究的這些電磁理論有什么用呢飘庄?”法拉第則反問道:“那么,我尊敬的女王陛下购撼,您認為跪削,您懷中抱著的嬰兒有什么用呢?”
胡特的理論雖然還不能與圖靈的研究相比迂求,但是碾盐,它至少為統(tǒng)一人工智能開辟了新方向,讓我們看到了統(tǒng)一的曙光揩局。我們只有等待歷史來揭曉最終的答案毫玖。更多關(guān)于通用人工智能的內(nèi)容,請參見本書第5章谐腰。
夢醒何方(2010至今)
就這樣孕豹,在爭論聲中,人工智能走進了21世紀的第二個十年十气,似乎一切都沒有改變。但是春霍,幾件事情悄悄地發(fā)生了砸西,它們重新燃起了人們對于人工智能之夢的渴望。
深度學習
21世紀的第二個十年址儒,如果要評選出最惹人注目的人工智能研究芹枷,那么一定要數(shù)深度學習(Deep Learning)了。
2011年莲趣,谷歌X實驗室的研究人員從YouTube視頻中抽取出1000萬張靜態(tài)圖片鸳慈,把它喂給“谷歌大腦”——一個采用了所謂深度學習技術(shù)的大型神經(jīng)網(wǎng)絡(luò)模型,在這些圖片中尋找重復(fù)出現(xiàn)的模式喧伞。三天后走芋,這臺超級“大腦”在沒有人類的幫助下,居然自己從這些圖片中發(fā)現(xiàn)了“貓”潘鲫。
2012年11月翁逞,微軟在中國的一次活動中,展示了他們新研制的一個全自動的同聲翻譯系統(tǒng)——采用了深度學習技術(shù)的計算系統(tǒng)溉仑。演講者用英文演講挖函,這臺機器能實時地完成語音識別、機器翻譯和中文的語音合成浊竟,也就是利用深度學習完成了同聲傳譯怨喘。
2013年1月津畸,百度公司成立了百度研究院,其中必怜,深度學習研究所是該研究院旗下的第一個研究所肉拓。
……
這些全球頂尖的計算機、互聯(lián)網(wǎng)公司都不約而同地對深度學習表現(xiàn)出了極大的興趣棚赔。那么究竟什么是深度學習呢帝簇?
事實上,深度學習仍然是一種神經(jīng)網(wǎng)絡(luò)模型靠益,只不過這種神經(jīng)網(wǎng)絡(luò)具備了更多層次的隱含層節(jié)點丧肴,同時配備了更先進的學習技術(shù),如圖1-13所示胧后。
然而芋浮,當我們將超大規(guī)模的訓(xùn)練數(shù)據(jù)喂給深度學習模型的時候,這些具備深層次結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)仿佛搖身一變壳快,成為了擁有感知和學習能力的大腦纸巷,表現(xiàn)出了遠遠好于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的學習和泛化的能力。
當我們追溯歷史眶痰,深度學習神經(jīng)網(wǎng)絡(luò)其實早在20世紀80年代就出現(xiàn)了瘤旨。然而,當時的深度網(wǎng)絡(luò)并沒有表現(xiàn)出任何超凡能力竖伯。這是因為存哲,當時的數(shù)據(jù)資源遠沒有現(xiàn)在豐富,而深度學習網(wǎng)絡(luò)恰恰需要大量的數(shù)據(jù)以提高它的訓(xùn)練實例數(shù)量七婴。
到了2000年祟偷,當大多數(shù)科學家已經(jīng)對深度學習失去興趣的時候,又是那個杰夫?辛頓帶領(lǐng)他的學生繼續(xù)在這個冷門的領(lǐng)域里堅持耕耘打厘。起初他們的研究并不順利修肠,但他們堅信他們的算法必將給世界帶來驚奇。
驚奇終于出現(xiàn)了户盯,到了2009年嵌施,辛頓小組獲得了意外的成功。他們的深度學習神經(jīng)網(wǎng)絡(luò)在語音識別應(yīng)用中取得了重大的突破先舷,轉(zhuǎn)換精度已經(jīng)突破了世界紀錄艰管,錯誤率比以前減少了25%〗ǎ可以說牲芋,辛頓小組的研究讓語音識別領(lǐng)域縮短了至少10年的時間。就這樣,他們的突破吸引了各大公司的注意缸浦。蘋果公司甚至把他們的研究成果應(yīng)用到了Siri語音識別系統(tǒng)上夕冲,使得iPhone5全球熱賣。從此裂逐,深度學習的流行便一發(fā)不可收拾歹鱼。
那么,為什么把網(wǎng)絡(luò)的深度提高卜高,配合上大數(shù)據(jù)的訓(xùn)練就能使得網(wǎng)絡(luò)性能有如此大的改善呢弥姻?答案是,因為人腦恰恰就是這樣一種多層次的深度神經(jīng)網(wǎng)絡(luò)掺涛。例如庭敦,已有的證據(jù)表明,人腦處理視覺信息就是經(jīng)過多層加工完成的薪缆。所以秧廉,深度學習實際上只不過是對大腦的一種模擬。
模式識別問題長久以來是人工智能發(fā)展的一個主要瓶頸拣帽。然而疼电,深度學習技術(shù)似乎已經(jīng)突破了這個瓶頸。有人甚至認為减拭,深度學習神經(jīng)網(wǎng)絡(luò)已經(jīng)可以達到2歲小孩的識別能力蔽豺。有理由相信,深度學習會將人工智能引入全新的發(fā)展局面拧粪。本書第6章將詳細介紹深度學習這一全新技術(shù)茫虽,第14章將介紹集智俱樂部下的一個研究小組對深度學習技術(shù)的應(yīng)用——彩云天氣,用人工智能提供精準的短時間天氣預(yù)報既们。
模擬大腦
我們已經(jīng)看到,深度學習模型成功的秘訣之一就在于它模仿了人類大腦的深層體系結(jié)構(gòu)正什。那么啥纸,我們?yōu)槭裁床恢苯幽M人類的大腦呢?事實上婴氮,科學家們已經(jīng)行動起來了斯棒。
例如,德國海德爾堡大學的FACETS(Fast Analog Computing with Emergent Transient States)計劃就是一個利用硬件來模擬大腦部分功能的項目主经。他們采用數(shù)以千計的芯片荣暮,創(chuàng)造出一個包含10億神經(jīng)元和1013突觸的回路的人工腦(其復(fù)雜程度相當于人類大腦的十分之一)。與此對應(yīng)罩驻,由瑞士洛桑理工學院和IBM公司聯(lián)合發(fā)起的藍色大腦計劃則是通過軟件來模擬人腦的實踐穗酥。他們采用逆向工程方法,計劃2015年開發(fā)出一個虛擬的大腦。
然而砾跃,這類研究計劃也有很大的局限性骏啰。其中最大的問題就在于:迄今為止,我們對大腦的結(jié)構(gòu)以及動力學的認識還相當初級抽高,尤其是神經(jīng)元活動與生物體行為之間的關(guān)系還遠遠沒有建立判耕。例如捍掺,盡管科學家早在30年前就已經(jīng)弄清楚了秀麗隱桿線蟲(Caenorhabditis elegans)302個神經(jīng)元之間的連接方式蛤育,但到現(xiàn)在仍然不清楚這種低等生物的生存行為(例如進食和交配)是如何產(chǎn)生的。盡管科學家已經(jīng)做過諸多嘗試诚欠,比如連接組學(Connectomics)碳竟,也就是全面監(jiān)測神經(jīng)元之間的聯(lián)系(即突觸)的學問草丧,但是,正如線蟲研究一樣瞭亮,這幅圖譜僅僅是個開始方仿,它還不足以解釋不斷變化的電信號是如何產(chǎn)生特定認知過程的。
于是统翩,為了進一步深入了解大腦的運行機制仙蚜,一些“大科學”項目先后啟動。2013年厂汗,美國奧巴馬政府宣布了“腦計劃”(Brain Research through Advancing Innovative Neurotechnologies委粉,簡稱BRAIN)的啟動。該計劃在2014年的啟動資金為1億多美元娶桦,致力于開發(fā)能記錄大群神經(jīng)元甚至是整片腦區(qū)電活動的新技術(shù)贾节。
無獨有偶,歐盟也發(fā)起了“人類大腦計劃”(The Human Brain Project)衷畦,這一計劃為期10年栗涂,將耗資16億美元,致力于構(gòu)建能真正模擬人腦的超級計算機祈争。除此之外斤程,中國、日本菩混、以色列也都有雄心勃勃的腦科學研究計劃出爐忿墅。這似乎讓人們想到了第二次世界大戰(zhàn)后的情景,各國爭相發(fā)展“大科學項目”:核武器沮峡、太空探索疚脐、計算機等。腦科學的時代已經(jīng)來臨邢疙。關(guān)于人腦與電腦的比較棍弄,請參見本書第7章望薄。
“人工”人工智能
2007年,一位谷歌的實習生路易斯?馮?安(Luis von Ahn)開發(fā)了一款有趣的程序“ReCapture”照卦,卻無意間開創(chuàng)了一個新的人工智能研究方向:人類計算式矫。
ReCapture的初衷很簡單,它希望利用人類高超的模式識別能力役耕,自動幫助谷歌公司完成大量掃描圖書的文字識別任務(wù)采转。但是,如果要雇用人力來完成這個任務(wù)則需要花費一大筆開銷瞬痘。于是故慈,馮?安想到,每天都有大量的用戶在輸入驗證碼來向機器證明自己是人而不是機器框全,而輸入驗證碼事實上就是在完成文本識別問題察绷。于是,一方面是有大量的掃描的圖書中難以識別的文字需要人來識別津辩;另一方面是由計算機生成一些扭曲的圖片讓大量的用戶做識別以表明自己的身份拆撼。那么,為什么不把兩個方面結(jié)合在一起呢喘沿?這就是ReCapture的創(chuàng)意(如圖1-14所示)闸度,馮?安聰明地讓用戶在輸入識別碼的時候悄悄幫助谷歌完成了文字識別工作!
這一成功的應(yīng)用實際上是借助人力完成了傳統(tǒng)的人工智能問題蚜印,馮?安把它叫作人類計算(Human Computation)莺禁,我們則把它形象地稱為“人工”人工智能。除了ReCapture以外窄赋,馮?安還開發(fā)了很多類似的程序或系統(tǒng)哟冬,例如ESP游戲是讓用戶通過競爭的方式為圖片貼標簽,從而完成“人工”人工分類圖片忆绰;Duolingo系統(tǒng)則是讓用戶在學習外語的同時浩峡,順便翻譯一下互聯(lián)網(wǎng),這是“人工”機器翻譯错敢。
也許红符,這樣巧妙的人機結(jié)合才是人工智能發(fā)展的新方向之一。因為一個完全脫離人類的人工智能程序?qū)τ谖覀儧]有任何獨立存在的意義伐债,所以人工智能必然會面臨人機交互的問題。而隨著互聯(lián)網(wǎng)的興起致开,人和計算機交互的方式會更加便捷而多樣化峰锁。因此,這為傳統(tǒng)的人工智能問題提供了全新的解決途徑双戳。
然而虹蒋,讀者也許會質(zhì)疑,這種摻合了人類智能的系統(tǒng)還能叫作純粹的人工智能嗎?這種質(zhì)疑事實上有一個隱含的前提魄衅,就是人工智能是一個獨立運作的系統(tǒng)峭竣,它與人類環(huán)境應(yīng)相互隔離。但當我們考慮人類智能的時候就會發(fā)現(xiàn)晃虫,任何智能系統(tǒng)都不能與環(huán)境絕對隔離皆撩,它只有在開放的環(huán)境下才能表現(xiàn)出智能。同樣的道理哲银,人工智能也必須向人類開放扛吞,于是引入人的作用也變成了一種很自然的事情。關(guān)于這個主題荆责,我們將在本書第8章和第9章中進一步討論滥比。
結(jié)語
本章介紹了人工智能近60年所走過的曲折道路。也許做院,讀者所期待的內(nèi)容盲泛,諸如奇點臨近、超級智能機器人键耕、人與機器的共生演化等激動人心的內(nèi)容并沒有出現(xiàn)寺滚,但是,我能保證的郁竟,是一段真實的歷史玛迄,并力圖做到準確無誤。
盡管人工智能這條道路蜿蜒曲折棚亩,荊棘密布蓖议,但至少它在發(fā)展并不斷壯大。最重要的是讥蟆,人們對于人工智能的夢想永遠沒有破滅過勒虾。也許人工智能之夢將無法在你我的有生之年實現(xiàn),也許人工智能之夢始終無法逾越哥德爾定理那個碩大無朋的“如來佛手掌”瘸彤,但是修然,人工智能之夢將永遠驅(qū)動著我們不斷前行,挑戰(zhàn)極限质况。
推薦閱讀
關(guān)于希爾伯特愕宋、圖靈、哥德爾的故事和相關(guān)研究可以閱讀《哥德爾结榄、艾舍爾中贝、巴赫:集異璧之大成》一書。關(guān)于馮?諾依曼臼朗,可以閱讀他的傳記:《天才的拓荒者:馮?諾依曼傳》邻寿。關(guān)于維納蝎土,可以參考他的著作《控制論》。若要全面了解人工智能绣否,給大家推薦兩本書:Artificial Intelligence: A Modern Approach和Artificial Intelligence: Structures and Strategies for Complex Problem Solving誊涯。了解機器學習以及人工神經(jīng)網(wǎng)絡(luò)可以參考Pattern Recognition和Neural Networks and Learning Machines。關(guān)于行為學派和人工生命蒜撮,可以參考《數(shù)字創(chuàng)世紀:人工生命的新科學》以及人工生命的論文集暴构。若要深入了解貝葉斯網(wǎng)絡(luò),可以參考Causality: Models, Reasoning, and Inference淀弹。深入了解胡特的通用人工智能理論可以閱讀Universal Artificial Intelligence: Sequential Decisions Based on Algorithmic Probability丹壕。關(guān)于深度學習方面的知識可參考網(wǎng)站:http://deeplearning.net/reading-list/,其中有不少綜述性的文章薇溃。人類計算方面可以參考馮?安的網(wǎng)站:http://www.cs.cmu.edu/~biglou/菌赖。
參考文獻
1候世達,嚴勇沐序,劉皓. 哥德爾琉用、艾舍爾、巴赫:集異璧之大成. 莫大偉 譯. 北京:商務(wù)印書館策幼,1997.
2諾曼?麥克雷. 天才的拓荒者:馮?諾伊曼傳. 范秀華邑时,朱朝輝 譯. 上海:上海科技教育出版社特姐,2008.
3維納. 控制論:或關(guān)于在動物和機器中控制和通信的科學. 郝季仁 譯. 北京:北京大學出版社晶丘,2007.
4Luger G F. Artificial intelligence: structures and strategies for complex problem solving (6th Edition). Addison-Wesley, 2008.
5Russel S K, Norvig P. Artificial Intelligence: A Modern Approach (2nd Edition). Prentice Hall, 2002.
6Theodoridis S, Koutroumbas K. Pattern Recognition (2nd edition). Academic Press, 2008.
7Haykin S O. Neural Networks and Learning Machines (3rd Edition). Prentice Hall, 2000.
8李建會,張江. 數(shù)字創(chuàng)世紀:人工生命的新科學. 北京:科學出版社唐含,2006.
9Pearl J. Causality: models, reasoning, and inference. Cambridge University Press, 2000.
10Hutter M. Universal Artificial Intelligence:Sequential Decisions based on Algorithmic Probability. Springer, 2005.
作者簡介
張江浅浮,集智俱樂部主要發(fā)起人和核心成員,2014~2015年度集智輪值主席〗菘荩現(xiàn)在北京師范大學系統(tǒng)科學學院任教滚秩,副教授。主要從事有關(guān)計算機模擬和人工智能的教學工作以及復(fù)雜系統(tǒng)的相關(guān)研究工作淮捆。研究興趣包括異速生長律郁油、開放流網(wǎng)絡(luò)、注意力流與互聯(lián)網(wǎng)等攀痊。代表作品有:論文Allometry and dissipation of ecological flow networks(PLoS ONE 2013, 8(9): e72525.)桐腌、論文The Metabolism and Growth of Web Forums (PLoS ONE 20149(8): e102646),著有《數(shù)字創(chuàng)世紀:人工生命的新科學》(科學出版社苟径,2006)一書哩掺。
——文章選自《科學的極致:漫談人工智能》