圖文來源:AI科技大本營(ID:rgznai100)
浙江大學(xué)計(jì)算機(jī)學(xué)院副院長煞躬、人工智能研究所所長 吳飛
西周的印紙?jiān)煳母嘏簟⑷龂哪九A黢R、希臘古城的黃金機(jī)器女仆……吳飛的演講恩沛,一下子將人工智能的歷史拉到了2000年前……原來用機(jī)器替代勞動的想法古已有之在扰,不得不說古代人民如此智慧!
那么智慧的古代勞動人民究竟是如何定義人工智能的呢雷客?我們翻出國學(xué)經(jīng)典芒珠,在荀子《正名》中就提出了“知有所合者謂之智、人知在人者謂之能搅裙、人有所合者謂之本正”皱卓,形象生動地將人工智能的精髓表達(dá)了出來。
俗話說部逮,不識廬山真面目娜汁,只緣生在此山中。很多時(shí)候兄朋,我們過多沉溺技術(shù)掐禁,只是通過五花八門的資訊讓頭腦裝滿了人工智能的碎片,卻忘了站在高處颅和,更加全面地思考傅事。
吳飛就是站在更高處,從人工智能的學(xué)科發(fā)展峡扩、方法研究以及歷史低谷等幾個(gè)角度出發(fā)蹭越,把問題剖析得更深刻。
在講到人工智能的“沉浮歷史”時(shí)教届,他旁征博引……從英國人工智能發(fā)展的偏激調(diào)查响鹃,到日本“第五代機(jī)器人研發(fā)”的功敗垂成驾霜,再到斯坦福大學(xué)+谷歌合作帶來的CYC知識系統(tǒng)……我們不禁思考,發(fā)展到今天的人工智能茴迁,究竟該如何分類寄悯、到底該怎樣學(xué)習(xí)……
吳飛強(qiáng)調(diào),無論是規(guī)則堕义、數(shù)據(jù)還是經(jīng)驗(yàn)猜旬,我們并不能判斷誰比誰好,誰可以取代誰倦卖,其實(shí)它們彼此各有優(yōu)點(diǎn)和不足洒擦。舉個(gè)例子,用規(guī)則教怕膛,確實(shí)和人的思維非常契合熟嫩,邏輯很強(qiáng),但我們確實(shí)很難把人類所有的規(guī)則和理念用來指導(dǎo)或者決策整個(gè)過程……
探尋新技術(shù)褐捻,我們除了了解方法和規(guī)則之外掸茅,更重要的還要聯(lián)系實(shí)際,現(xiàn)在火熱的人機(jī)博弈除了給人們帶來“AI 改變世界”的興奮激動以及“AI 比人類更c(diǎn)lever”的精神焦慮外柠逞,還有什么特殊的意義嗎昧狮?這不,吳飛又理論聯(lián)系實(shí)踐板壮,給我們上了一堂“人機(jī)博弈”的大課……
以下為浙江大學(xué)計(jì)算機(jī)學(xué)院副院長逗鸣、人工智能研究所所長吳飛進(jìn)行的主題為“新一代人工智能的思考與挑戰(zhàn)”的演講內(nèi)容:
今天,我簡單給大家介紹一下人工智能的發(fā)展歷史绰精,以及從人機(jī)博弈的角度看人工智能現(xiàn)在以及即將面臨的一些挑戰(zhàn)撒璧。
一直以來,人類對人類以外的智能都懷有崇高的夢想笨使。
從西周周穆王的印紙?jiān)煳牡饺龂哪九A黢R卿樱,再到希臘古城的黃金機(jī)器女仆……實(shí)際上,這三個(gè)都是人類自己幻想出來能夠替代人類全部勞動的機(jī)械裝置硫椰。
事實(shí)上繁调,自從人工智能在被寫入規(guī)劃的過程中,大家就都想了解中國的人工智能是從什么時(shí)候被提出來的最爬。后來發(fā)現(xiàn),原來中國的人工智能早在荀子時(shí)代门岔,就已經(jīng)提出來了爱致。荀子在《正名》中有四句話表述了人工智能的脈絡(luò)。
荀子說:“知之在人者謂之知”寒随,這里的知就是咨詢的意思糠悯。人有視覺帮坚、聽覺、觸覺互艾、味覺和壓力這些感知能力试和,我們會對身體所處的環(huán)境進(jìn)行多通道、多模態(tài)的感知纫普。
“知有所合者謂之智”阅悍,而感知得到的不同通道的多種類型的大數(shù)據(jù),在大腦中形成概念昨稼,形成對象节视,就產(chǎn)生了智慧。這種智慧的來源假栓,是我們?nèi)藢Υ髷?shù)據(jù)一種綜合的思考得到的一種結(jié)果寻行。
“人知在人者謂之能”,這里講的是人的一些本能匾荆。例如拌蜘,在路上你碰到前面一輛疾駛而來的汽車,你馬上就能感知出來并認(rèn)知出來這是一輛汽車牙丽,而且快速向你沖過來简卧,如果你不做避讓的話,就可能吾命不久矣剩岳。那這個(gè)時(shí)候人們就會開始趨利避害贞滨。人類有一些本能,可以做到對感知或者認(rèn)知的結(jié)果快速地做出處理拍棕。
“人有所合者謂之本正”晓铆,就可以被理解為是現(xiàn)在我們說的人工智能。就是要把所有從前端感知得到的數(shù)據(jù)绰播,激發(fā)出智慧骄噪,再形成與之相關(guān)的行動或者決策。這樣來看蠢箩,整個(gè)人工智能脈絡(luò)就已經(jīng)被清晰得勾勒出來了链蕊。
這是我在中國古文中尋找出來的有關(guān)人工智能的蛛絲馬跡。
再看西方谬泌,他們就比較講究學(xué)科層面
歷史上學(xué)科層面的人工智能可不是荀子提出來的滔韵。
學(xué)科歷史上,人工智能是由4位學(xué)者早1955年提出來的掌实,其中有兩位是當(dāng)時(shí)非常年輕的陪蜻,也就是年齡僅僅31、32歲的學(xué)者贱鼻。一個(gè)是時(shí)任達(dá)特茅斯數(shù)學(xué)系的助理教師麥卡錫宴卖,另一個(gè)是時(shí)任哈佛大學(xué)數(shù)學(xué)系和神經(jīng)學(xué)系的馬文明斯基滋将,他們兩位后來都獲得了計(jì)算機(jī)界的最高獎項(xiàng)(圖靈獎)。另外兩位分別是信息論之父叫香農(nóng)和IBM第一代通用計(jì)算機(jī)701的總設(shè)計(jì)師羅徹斯特。
1955年的8月,四位學(xué)者給美國的一個(gè)洛克菲勒私人基金會寫了一個(gè)提案社牲,這個(gè)提案中的題目出現(xiàn)了Artificial Intelligence,這也是AI 這個(gè)單詞在人類學(xué)科歷史上的首次出現(xiàn)掘宪。
建議書中,主要是向美國的洛克菲勒的私人基金申請一筆資金分苇,用于支付十幾個(gè)人通過一個(gè)半月的工作來完成一個(gè)研究添诉。這樣的一筆開支,希望通過建議書得到洛克菲勒的私人基金會的贊助医寿。很順利栏赴,這個(gè)基金會很快批準(zhǔn)了這個(gè)提案,但是把提建議書上提出的金額有所縮減靖秩。
幾位科學(xué)家說须眷,想做一個(gè)AI,這個(gè)AI是一臺機(jī)器沟突,能夠像人那樣認(rèn)知花颗、思考和學(xué)習(xí),也就是用計(jì)算機(jī)來模擬人的智能惠拭。在這個(gè)報(bào)道中扩劝,他們?yōu)榱送怀鲭y點(diǎn),列舉了7個(gè)準(zhǔn)備去攻克的難點(diǎn)問題:
1职辅、系統(tǒng)計(jì)算機(jī)棒呛;
2、用程序?qū)τ?jì)算機(jī)進(jìn)行編程域携;
3簇秒、神經(jīng)網(wǎng)絡(luò);
4秀鞭、計(jì)算的復(fù)雜性趋观;
5、自我學(xué)習(xí)與提高锋边;
6皱坛、抽象;
7豆巨、隨手創(chuàng)造力剩辟。
事實(shí)上我們可以看到,列舉出來的七個(gè)問題,后三個(gè)問題到現(xiàn)在仍然是人工智能面臨的巨大挑戰(zhàn)抹沪。
舉個(gè)例子,我們說自我學(xué)習(xí)與提高瓤球,人確實(shí)具備這樣的能融欧。人類從幼兒園、小學(xué)卦羡、初中到高中噪馏,就已經(jīng)形成了這個(gè)能力。參加高考的時(shí)候绿饵,很多高考題目并不是之前完全做過的欠肾,但是人們可以通過運(yùn)用自己的一些知識和數(shù)據(jù)去處理新的問題。
所以我們很難想象拟赊,如果有一個(gè)機(jī)器人刺桃,他也和我們的兒子或者女兒一樣,手牽手坐在了所謂的幼兒園中的課堂里上課吸祟,然后經(jīng)歷了幼兒園瑟慈、小學(xué)、初中屋匕、高中的學(xué)習(xí)過程葛碧,又去參加競賽和比賽……總之很難想象機(jī)器可以具備人的自我學(xué)習(xí)和提升能力。
從1955年提案提出过吻,人工智能就邁上了它的征途进泼,按照當(dāng)時(shí)的提議,人工智能是部分地替代人類的部分勞動纤虽。
例如我們制造一個(gè)機(jī)器乳绕,它能夠定義和證明取代人類的某個(gè)工作;制造一個(gè)機(jī)器翻譯廓推,它能替代人類的翻譯家刷袍;制造一個(gè)專家系統(tǒng),它能幫人看病樊展、會診等呻纹。那時(shí)候的人工智能就是按照這樣的思路發(fā)展的,也就是試圖取代人的一部分工作专缠、勞動雷酪。
隨著時(shí)間的發(fā)展,在這個(gè)過程中涝婉,人工智能逐漸延展出符號阻力哥力、連接阻力和行為阻力這三種仿人,或者仿腦的思路。
接著上面的話題吩跋,講一講人工智能一直以來延續(xù)而生的三種分類:
語義相關(guān)的人工智能
一直以來我們都給這個(gè)類別起了一個(gè)不太好聽的名字寞射,叫弱人工智能。這種人工智能指的音符換調(diào)锌钮、導(dǎo)向桥温,也可以說是它實(shí)際執(zhí)行的任務(wù)。
由于機(jī)器具有很強(qiáng)的記憶功能和存儲能力梁丘,它可能在依照葫蘆畫瓢的過程中侵浸,比人類畫得更快、更棒氛谜,但是它也只能按照葫蘆畫瓢掏觉,并不能創(chuàng)作出精美的山水畫。
你提供給它大量的數(shù)據(jù)值漫,它就可以通過數(shù)據(jù)進(jìn)行一定范圍內(nèi)的“創(chuàng)作”澳腹。但這種“創(chuàng)作”是具備導(dǎo)向性的,要和既定的領(lǐng)域相關(guān)杨何,不能算作是跨域機(jī)器的人工智能遵湖。
通用的人工智能或者跨域人工智能
人具有很強(qiáng)的舉一反三能力,從一種行為快速地跨越到另外的領(lǐng)域晚吞,而不是一味地通過數(shù)據(jù)驅(qū)動或者完成任務(wù)導(dǎo)向式地學(xué)習(xí)延旧。
如果說剛剛提到的第一類任務(wù)導(dǎo)向或者說弱人工智能,是數(shù)據(jù)和規(guī)則驅(qū)動槽地,那么通用的人工智能迁沫,則是掌握“學(xué)習(xí)”這個(gè)能力。
混合增強(qiáng)的人工智能
這一類舉例的話捌蚊,例如達(dá)芬奇手術(shù)機(jī)器人集畅。
曾經(jīng)在互聯(lián)網(wǎng)流傳一段視頻,達(dá)芬奇手術(shù)機(jī)器人以靈巧的外科機(jī)械臂做到將一個(gè)葡萄的皮劃開缅糟,然后把它縫補(bǔ)好挺智。原理就是,人類的醫(yī)生坐在機(jī)器后面來操縱機(jī)器人用靈巧的手臂完成高端窗宦、復(fù)雜的外科手術(shù)赦颇。在這個(gè)過程中,如果缺少了人類醫(yī)生或者這種復(fù)雜赴涵、高端的臨床外科手術(shù)的機(jī)械臂媒怯,都不能完成這樣一個(gè)高難度的任務(wù)。
據(jù)說髓窜,現(xiàn)在的達(dá)芬奇手術(shù)機(jī)器人已經(jīng)可以做到將一個(gè)神經(jīng)纖維切開扇苞,并且把它縫補(bǔ)成功欺殿。雖然這項(xiàng)工作是人類醫(yī)生不能完成的,但必須依靠人類醫(yī)生來指導(dǎo)完成這件事是確定無疑的鳖敷。
我們通常認(rèn)為脖苏,人、機(jī)器和互聯(lián)網(wǎng)的結(jié)合就變成了一個(gè)更加復(fù)雜的智能系統(tǒng)定踱,例如智慧城市帆阳。因此,任何一種智能活動將自己的長處與另外一個(gè)智能系統(tǒng)的長處進(jìn)行有機(jī)協(xié)調(diào)屋吨,我們就可以在一定程度上讓智能的程度增強(qiáng)。但我們一定要強(qiáng)調(diào)山宾,在這種增強(qiáng)的智能體中至扰,人永遠(yuǎn)是智能的開發(fā)者,從目前的情況來看资锰,應(yīng)該不可能產(chǎn)生機(jī)器來獨(dú)立命名的這種情況出現(xiàn)敢课。
盡管如今人工智能發(fā)展急劇升溫,但在它的發(fā)展歷史上也經(jīng)歷了三次低谷绷杜。
第一次低谷爆發(fā)在英國
1973年在英國直秆,一個(gè)皇家科學(xué)院院士,原本從事航空動力學(xué)鞭盟,而不是計(jì)算機(jī)科學(xué)圾结,他叫James Lighthill。他做了一件事情齿诉,帶領(lǐng)一幫人對當(dāng)時(shí)英國的人工智能發(fā)展進(jìn)行了一次全面的評估筝野,然后就把這個(gè)評估結(jié)果出版了。
他們說英國關(guān)于人工智能的研究主要集中在自動機(jī)粤剧、機(jī)器人和神經(jīng)網(wǎng)絡(luò)歇竟。其中自動機(jī)和神經(jīng)網(wǎng)絡(luò)的研究雖然有價(jià)值,但進(jìn)展令人失望抵恋;機(jī)器人的研究是沒有價(jià)值的焕议,進(jìn)展也非常令人失望,建議直接取消機(jī)器人的研究弧关。
實(shí)際上這個(gè)結(jié)論是比較偏激的盅安,和現(xiàn)在人工智能的現(xiàn)狀不符。但這樣的一篇報(bào)道使得整個(gè)英國的人工智能進(jìn)入了低谷世囊,很多做人工智能研究的專家從此就不敢說自己是做人工智能的了宽堆。
第二次低谷發(fā)生在日本
這次變化源于日本的第五代機(jī)器人研發(fā),也就是日本想造一個(gè)人工大腦茸习,盡管通過10年努力宣告失敗畜隶,但這項(xiàng)活動為日本積累了一大批半導(dǎo)體、機(jī)械和計(jì)算機(jī)方面的人才。
從這件事情上我們得到的結(jié)論是籽慢,驅(qū)動人工智能的發(fā)展浸遗,不單單是硬件的極大豐富,其更重要的是內(nèi)部的數(shù)據(jù)箱亿、知識和軟件的有機(jī)集成等跛锌。因?yàn)槿说拇竽X是數(shù)以千萬、數(shù)以億計(jì)的神經(jīng)原的相聯(lián)届惋,其中海馬體中有非常多的數(shù)據(jù)和知識來指導(dǎo)我們的推理髓帽。
第三次低谷來自知識百科
傳統(tǒng)的人工智能總是局限在規(guī)則和知識的推理中,因此我們希望把所有的知識裝入知識庫系統(tǒng)脑豹,這樣就能進(jìn)行很好的推理郑藏,于是我們就開始選擇把所有的規(guī)則以及理念全裝到數(shù)據(jù)庫中。
斯坦福大學(xué)就是這么干的瘩欺!
他們在1984年想把所有的規(guī)則和知識裝到一個(gè)CYC的知識系統(tǒng)中去必盖。經(jīng)過20多年的努力還是宣告失敗了,因?yàn)槿说暮芏嘀R是不確定俱饿,或者是有一定界限的歌粥。
例如“兩個(gè)知識”的例子。所有的鳥都會飛拍埠,這個(gè)結(jié)論是正確的失驶,所以被放進(jìn)去;鴕鳥是鳥枣购,這個(gè)結(jié)論也是正確的突勇,放進(jìn)去了,這樣看來兩個(gè)知識一旦同時(shí)被放進(jìn)去后坷虑,就會順理成章地推導(dǎo)出鴕鳥會飛甲馋,但是這樣的結(jié)論明顯是錯(cuò)誤的。
因?yàn)椤八械镍B都會飛”這句話本身就是不夠精確的迄损,如果我們就為了說明這一概念定躏,那又該怎么去闡釋它?我想必須要說出幾萬種鳥說芹敌,來列舉這些鳥不會飛痊远。
現(xiàn)實(shí)中,人和人的交流可沒那么麻煩氏捞,因?yàn)槿司邆湟恍┏WR性的知識碧聪,可以快速地進(jìn)行一些不精確的表達(dá),但這些表達(dá)可以完成常規(guī)的知識傳遞或者交流液茎。
這也說明了逞姿,想把所有的知識通過手工工作的形式裝在一個(gè)推理的知識庫中辞嗡,這是一個(gè)非常不可取的任務(wù)。
例如滞造,如今我們要了解一個(gè)新概念的時(shí)候续室,我們可能會經(jīng)常訪問百度百科怎么說,維基百科怎么說谒养,知乎上又是怎么說的挺狰,但是我們并不會去查新華字典怎么說的,十萬個(gè)為什么上是怎么說的……主要是因?yàn)橹R在不斷地买窟、持續(xù)地演化丰泊,只有互聯(lián)網(wǎng)技術(shù)所創(chuàng)造出來的“互聯(lián)網(wǎng)百科”才是非常重要的知識領(lǐng)域群。
說完人工智能的低谷始绍,來講講在人工智能歷史上瞳购,了解和學(xué)習(xí)人工智能通常采用的三種方法:
用規(guī)則去教
也就是將所有的知識和規(guī)則以邏輯的形式編碼成功。例如水利工程是工程的一種疆虚,三峽大壩是個(gè)水利工程,這樣一個(gè)程序化的概念體就出來了满葛。為了刻畫三峽大壩径簿,我們要說它的功能是什么,它的定位是什么嘀韧,由于三峽大壩和葛洲壩都位于長江領(lǐng)域篇亭,所以彼此之間具有管調(diào)節(jié)的關(guān)系等。
如果我們知道這些知識的話锄贷,我們又知道旦布利水畔和達(dá)納斯水畔都位于哥倫比亞這個(gè)河域译蒂,那我們就可以推理出來它們也具有反調(diào)節(jié)的關(guān)系。給定一些知識谊却,我們基于一個(gè)強(qiáng)大的推理引擎柔昼,就可以不斷地?cái)U(kuò)充這個(gè)知識體系中的概念、屬性以及關(guān)系炎辨,不斷地進(jìn)行知識學(xué)習(xí)捕透。
IBM的沃森就是很貼切的一個(gè)例子。
沃森是一個(gè)人機(jī)對話的系統(tǒng)碴萧,當(dāng)時(shí)有人考了這樣一個(gè)題目乙嘀,這個(gè)題目是人類選手回答不出來的,請問哪個(gè)城市是美國的鋼產(chǎn)量和鐵產(chǎn)量平均量第一破喻?
沃森通過一定的計(jì)算虎谢,很快回答出來是匹斯堡,后來從后臺的程序發(fā)現(xiàn)沃森把美國所有的城市的鋼產(chǎn)量和鐵產(chǎn)量的數(shù)據(jù)都從互聯(lián)網(wǎng)上找到了曹质,要做的就是簡單的累加并除二婴噩,然后做了一個(gè)排序擎场,現(xiàn)在是匹斯堡排在第一位,于是就輸出了匹斯堡這個(gè)答案讳推。
很難想象顶籽,如果人類專家可以回答出這種問題,顯然是不可想象的银觅。因?yàn)槿说拇竽X不可能記下這么海量的知識礼饱,而且這些知識可能與自身無關(guān)。通常情況下究驴,很多知識镊绪,我們可能在平時(shí)要用的時(shí)候就去翻翻書,查查互聯(lián)網(wǎng)就可以了洒忧,不會刻意地去記這種龐大的數(shù)據(jù)知識蝴韭。
用數(shù)據(jù)去學(xué)
這個(gè)就是現(xiàn)在深度學(xué)習(xí)的一個(gè)大行其道的方法。因?yàn)槲覀兒茈y去刻畫一個(gè)概念熙侍,例如海盜船榄鉴。你怎么用文字、邏輯去描述這個(gè)海盜船蛉抓?答案是很難去描述庆尘。
于是我們就選擇很多被標(biāo)注成海盜船的圖片,提供給計(jì)算機(jī)巷送,讓計(jì)算機(jī)不停地學(xué)習(xí)驶忌,學(xué)習(xí)之后計(jì)算機(jī)就會銘記海盜船圖像像素點(diǎn)空間分布的模式,進(jìn)而就學(xué)會了海盜船的這種模式笑跛。如果你再給它一張圖片是海盜船的話付魔,空間分布的模式和之前學(xué)習(xí)的模式是一樣的,于是就可以自動識別為海盜船飞蹂。
這個(gè)就是大數(shù)據(jù)驅(qū)動几苍,在大數(shù)據(jù)驅(qū)動的前提下,要把這個(gè)數(shù)據(jù)標(biāo)注成它本身明確的語義陈哑,或者概念擦剑,才能做更好的學(xué)習(xí)與提高。
關(guān)于這方面有幾個(gè)例子:
例子一芥颈,2012年紐約時(shí)報(bào)發(fā)表了一篇文章惠勒,題目叫多少臺計(jì)算可以識別一只貓,答案是16000臺爬坑。
例子二纠屋,特斯拉第一次造成車毀人亡現(xiàn)象。
特斯拉的無人汽車上有非常多的傳感器(例如雷達(dá)盾计、視覺等)售担。在風(fēng)和日麗的環(huán)境下赁遗,竟然發(fā)生了直接撞擊相馳火車的事故,大家都覺得不可思議族铆。
事后分析才發(fā)現(xiàn)岩四,特斯拉汽車一直向前開的過程中,司機(jī)正在看《哈利波特》的VCD哥攘,因?yàn)檠劬﹄x開了前方剖煌,手和腳也都離開了操作的儀器,一輛白色的箱式大貨車在它的對象車道行駛時(shí)有一個(gè)左轉(zhuǎn)彎逝淹,本來一般情況下是不會發(fā)生裝車事故的耕姊,但這次卻直接撞上去了。
分析整個(gè)過程栅葡,特斯拉前面配有雷達(dá)茉兰,這個(gè)雷達(dá)的電磁波就直接掃過去了。主要是由于白色箱式火車的底盤過高欣簇,雷達(dá)匯報(bào)前方無障礙物规脸,同時(shí)攝像頭在不斷地捕獲前方圖像,捕獲回來其實(shí)就是白色的背景熊咽,這樣的視覺圖像匯報(bào)莫鸭,讓系統(tǒng)誤認(rèn)為前方是白云,就直接撞上去了网棍,從而發(fā)生了非常慘烈的事件黔龟。
例子三妇智,是谷歌公司發(fā)布的一個(gè)叫做圖像的標(biāo)注的系統(tǒng)滥玷。
只要上傳一張圖片,就可以打標(biāo)簽巍棱,打上了標(biāo)簽就可以對這個(gè)圖片進(jìn)行一次搜索惑畴。因?yàn)楹芏鄷r(shí)候我們需要用文本信息或者單詞來進(jìn)行搜索圖片,一旦打標(biāo)簽的話航徙,我們就可以更好地進(jìn)行文搜圖的體驗(yàn)如贷。
有這樣的一件事情,一個(gè)黑人朋友上傳了 一張圖片到踏,卻被打上了黑猩猩的標(biāo)簽杠袱,于是他就狀告了谷歌公司,說對他是人格上的侮辱窝稿,谷歌公司花了很大一筆錢才把這個(gè)官司給平息楣富。
平息的過程中,谷歌就關(guān)閉了標(biāo)注系統(tǒng)伴榔,不再打標(biāo)簽纹蝴。過一段時(shí)間再開放的時(shí)候庄萎,就把黑猩猩從標(biāo)注詞典庫里移除了,即使再上傳的圖片是黑猩猩塘安,也不會被打上黑猩猩的標(biāo)簽糠涛。說明用數(shù)據(jù)驅(qū)動方法,實(shí)際在某些領(lǐng)域可以得到很好的應(yīng)用兼犯,但可能在其它領(lǐng)域還會有很大的誤讀。
從經(jīng)驗(yàn)中學(xué)
前面我們通過了用知識去教锉罐、用數(shù)據(jù)去學(xué)绕娘,第三種方法就是用問題引導(dǎo)學(xué)習(xí)脓规,這就是我們經(jīng)常說的強(qiáng)化學(xué)習(xí)。就是把一個(gè)智能體放到一個(gè)環(huán)境里面险领,它對這個(gè)環(huán)境做出一定的反應(yīng)侨舆,這個(gè)環(huán)境對它獎勵或者懲罰的一個(gè)結(jié)果。
假如說我這里放了一臺掃地機(jī)绢陌,它直接撞到一個(gè)桌子上挨下,撞翻了,它就知道這是一個(gè)不可撞的東西脐湾,那它再做下一個(gè)調(diào)整的時(shí)候,它往左轉(zhuǎn)愁铺、往右或往后走闻鉴,它不停地從失敗走向失敗,最后又從失敗走向了成功孟岛,它就對這種環(huán)境能夠很好地感知到瓶竭。
這種方法,我們叫做強(qiáng)化學(xué)習(xí),或者是叫做從經(jīng)驗(yàn)中學(xué)習(xí)次询,也就是沒有任何知識和數(shù)據(jù),就把它放在一個(gè)環(huán)境中進(jìn)行感知以及認(rèn)知。
像波士頓公司的兩輪機(jī)器人以及中國電科院提供的67架固定翼的集群系統(tǒng),還有美軍103架的固定翼集群系統(tǒng),就是在開放的環(huán)境中不停地進(jìn)行感知和認(rèn)知的學(xué)習(xí),從而得到經(jīng)驗(yàn)的提升跃须。
這三種學(xué)習(xí)方法第练,并能夠被判斷為誰比誰好,誰要取代誰复旬,其實(shí)它們彼此各有優(yōu)點(diǎn)和不足垦缅。例如用規(guī)則教冲泥,確實(shí)和人的思維非常契合驹碍,邏輯很強(qiáng),但我們確實(shí)很難把人類所有的規(guī)則和理念用來指導(dǎo)或者決策這個(gè)過程凡恍。
用數(shù)據(jù)去學(xué)的方法一定要依賴于標(biāo)注的大數(shù)據(jù)志秃。如果我們對于某個(gè)概念不能提供給它一個(gè)表示的大數(shù)據(jù)的話浮还,它就無法學(xué)習(xí)。
如果可解讀性不強(qiáng)闽巩,就算給它一張圖片钧舌,它可以識別出是人臉担汤,當(dāng)你疑問知道它是人臉的原因,它同樣也是無法得出洼冻,但是并不知道人臉的分布是否合適崭歧,例如說鼻子是對稱的,眼睛是對稱的撞牢,這樣的知識在機(jī)器的學(xué)習(xí)系統(tǒng)中很難做到契合率碾。
最后一種方法似乎也很不錯(cuò),沒有知識和數(shù)據(jù)屋彪,只要放在環(huán)境中進(jìn)行交互就可以了所宰。但是我們可以想象一下,當(dāng)一個(gè)智能體撞到墻的時(shí)候畜挥,它可以采取的策略是無窮多的仔粥,它可以發(fā)呆、發(fā)萌蟹但、哭泣件炉、憤怒,也可以不工作矮湘,有幾萬種選擇斟冕,那到底從幾萬種選擇中選擇哪一種來應(yīng)對撞墻的行為,這又是一個(gè)很難的問題缅阳。
因此磕蛇,這三種方法其實(shí)各有各的優(yōu)點(diǎn),也有它的不足十办,但它體現(xiàn)了從數(shù)據(jù)到知識秀撇,從知識到能力的過程,最終能力并不重要向族。我們界定一個(gè)人工智能程序是否成功呵燕,不在于提供給它的是1TB還是10TB的數(shù)據(jù),不在于是10萬條的知識還是20萬條的知識件相,而在于它已經(jīng)生成了一種能力再扭,這種能力可以指導(dǎo)它去處理新的數(shù)據(jù)和知識,以及構(gòu)成新的知識的能力夜矗,這是非常重要的泛范。
從火熱的人機(jī)博弈中,我們能看出什么紊撕?
用最近比較火熱的AlphaGo來做解釋罢荡。
我們知道AlphaGo是比較符合1955年提出的關(guān)于人工智能的理解。
AlphaGo首先選用了16萬棋局,大約3000萬盤的棋譜区赵,通過黑白相間的棋子惭缰,憑借策略網(wǎng)絡(luò)和一個(gè)快速走子網(wǎng)絡(luò)進(jìn)行訓(xùn)練。由于每盤棋我們都已經(jīng)知道了是執(zhí)黑會贏還是執(zhí)白會贏笼才,所以就會按照標(biāo)準(zhǔn)數(shù)據(jù)去訓(xùn)練从媚,也就是說當(dāng)遇到白棋的時(shí)候,我的黑棋落在哪兒患整,就是訓(xùn)練了這樣一個(gè)人工智能的系統(tǒng)拜效。
如果沒有后面的故事,現(xiàn)在的AlphaGo也只能戰(zhàn)勝人類選手的壟斷棋手各谚,但是如果可以實(shí)現(xiàn)兩臺機(jī)器自己和自己下棋紧憾,那技能就突飛猛進(jìn)了,突飛猛進(jìn)的結(jié)果就在2016年3月戰(zhàn)勝李世石的那場比賽昌渤。
基于產(chǎn)生了大量數(shù)據(jù)做訓(xùn)練的價(jià)值網(wǎng)絡(luò)赴穗,這種網(wǎng)絡(luò)就可以有效預(yù)測整盤棋的下法。簡單來說就是架構(gòu)網(wǎng)絡(luò)來預(yù)測這個(gè)棋子落下去后膀息,整盤棋和剩下的棋況怎么樣般眉。今年4月在烏鎮(zhèn)的那場較量,也就是戰(zhàn)勝柯潔的那次潜支,其實(shí)就是兩臺機(jī)器自己和自己博弈甸赃,進(jìn)一步帶來了能力的提升,也是完全基于這個(gè)強(qiáng)化學(xué)習(xí)的成果冗酿。
我們可以想到埠对,AlphaGo中實(shí)質(zhì)上有一個(gè)叫做利用探索的綁定。什么是利用探索呢裁替?它是19×19的黑白相間的棋盤项玛,里面只放黑棋和白棋,總共有多少種擺放的方法弱判?
答案是2的381次方襟沮。
2的381次方等于宇宙所有原子的數(shù)量,所以AlphaGo不可能把2的381次方都分辨一次昌腰,它只能盡量去判斷哪一種擺放的方式是最好的开伏。
在這個(gè)過程中,它就會把所有的信息都利用起來剥哑,也就意味著會盡量去研究或者實(shí)踐人類沒有下過的棋局硅则,所以很多時(shí)候我們看到Alpha Go下的棋局很怪淹父,因?yàn)槿祟愡x手從來沒有嘗試過株婴。
每下一個(gè)棋子的時(shí)候,AlphaGo已經(jīng)預(yù)測出這個(gè)棋誰勝。
大家可以看到困介,AlphaGo挑戰(zhàn)的過程中大审,它失去了信心,因?yàn)橐呀?jīng)預(yù)測自己獲得整盤棋的勝利的概率一直下降座哩,它沒有了戰(zhàn)勝對手的勇氣徒扶,這個(gè)很危險(xiǎn)。
通常來講根穷,人類才會有置之死地而后生姜骡,背水一戰(zhàn)的勇氣。有些情況下是可以扳回一局的屿良,但人工智能已經(jīng)失去了它的斗志圈澈,只有三種網(wǎng)絡(luò)都被利用的時(shí)候,它才會取得勝利尘惧。
2的381次方可能比宇宙的原子還多康栈,如果量子計(jì)算機(jī)被制造出來,MIT說100個(gè)量子進(jìn)行糾纏喷橙,就等于人類所有計(jì)算能力的綜合啥么,所以那個(gè)時(shí)候就不用某個(gè)模式搜索,也可以做到辨別所有的可能贰逾。
上面說的情況被稱為完全機(jī)器人架構(gòu)博弈悬荣,當(dāng)然還存在非完全機(jī)器人架構(gòu)博弈。就像泰利美工大學(xué)的德州撲克疙剑,其實(shí)就是一個(gè)非完全機(jī)器下的博弈隅熙。對于我們來說,圍棋都是規(guī)則已知核芽、策略已知 囚戚、勝負(fù)已知,相對來說比較明白直觀轧简,但是打撲克的話很多信息就不是很清楚了驰坊。
我們做了一個(gè)總結(jié),像迭代輔助哮独,AlphaGo拳芙,AlphaGo Zero……它們都有非常多的數(shù)據(jù)支持或者各種算法模型∑よ担可以看到舟扎,有些是利用知識,有些是利用數(shù)據(jù)悴务,有些是利用經(jīng)驗(yàn)去學(xué)習(xí)睹限,其實(shí)這種智能學(xué)習(xí)的算法需要不停地交會譬猫、融合。
人工智能是不斷往前發(fā)展的羡疗,我們希望把大數(shù)據(jù)虛擬的人工智能方法染服,從利用知識的人工智能,轉(zhuǎn)變?yōu)閺沫h(huán)境中獲得學(xué)習(xí)能力進(jìn)而提升效率的人工智能叨恨,如果能很好地協(xié)調(diào)和統(tǒng)一柳刮,可能就會形成一種更好的齒輪咬合能力。
從九輪計(jì)算到深度推理痒钝,從單純計(jì)算到數(shù)據(jù)驅(qū)動的模型秉颗,再發(fā)展到數(shù)據(jù)驅(qū)動與引導(dǎo)相結(jié)合,從領(lǐng)域任務(wù)驅(qū)動的人工智能過渡到通用條件下的強(qiáng)人工智能送矩,我們說強(qiáng)人工智能就是放到一個(gè)環(huán)境中能夠自己不斷學(xué)習(xí)的人工智能類型站宗。科學(xué)雜志在今年 7 月 7 日推出了人工智能屢嬗刊梢灭,人工智能在大數(shù)據(jù)洪流里面會發(fā)生變革性的因素,也有很玄的東西蒸其。
實(shí)際上人工智能并沒有那么強(qiáng)大敏释,即使像阿爾法狗 ZERO,也有需要提升的空間摸袁。但是從中學(xué)到的東西钥顽,卻能很好的幫助人類發(fā)展。據(jù)說整個(gè)宇宙有百分之一的東西是我們已經(jīng)知道的靠汁,這么分析人工智能已經(jīng)很不容易蜂大,盡管現(xiàn)在的人工智能還沒有全覆蓋。