澎湃新聞特約撰稿 劉秀云? 責任編輯:洪燕華 澎湃新聞
AlphaGo(阿爾法狗)之父在英國劍橋大學演講。?
4月10日买乃,“人機大戰(zhàn)”的消息再次傳出歹茶,關于人類和AI的對抗再次牽動世界的神經(jīng)泊碑。
“我會抱必勝心態(tài)、必死信念泪幌。我一定要擊敗阿爾法狗盲厌!”對于5月23日至27日與圍棋人工智能程序AlphaGo(阿爾法狗)的對弈,目前世界排名第一的中國職業(yè)九段柯潔放出豪言祸泪。然而吗浩,AlphaGo(阿爾法狗)之父卻說,“我們發(fā)明阿爾法狗没隘,并不是為了贏取圍棋比賽懂扼。”
AlphaGo之父杰米斯·哈薩比斯(Demis Hassabis)近日在母校英國劍橋大學做了一場題為“超越人類認知的極限”的演講右蒲,解答了世人對于人工智能阀湿,對于阿爾法狗的諸多疑問——過去3000年里人類低估了棋局哪個區(qū)域的重要性?阿爾法狗去年贏了韓國職業(yè)九段李世石靠哪幾個絕招瑰妄?今年年初拿下數(shù)位國際大師的神秘棋手Master究竟是不是阿爾法狗陷嘴?為什么圍棋是人工智能難解之謎?
杰米斯·哈薩比斯,Deep Mind創(chuàng)始人涨醋,AlphaGo(阿爾法狗)之父瓜饥, 4歲開始下象棋,8歲時在棋盤上的成功促使他開始思考兩個至今令他困擾的問題:第一浴骂,人腦是如何學會完成復雜任務的?第二宪潮,電腦能否做到這一點溯警?17歲時,哈薩比斯就負責了經(jīng)典模擬游戲《主題公園》的開發(fā)狡相,并在1994年發(fā)布梯轻。他隨后讀完了劍橋大學計算機科學學位,2005年進入倫敦大學學院尽棕,攻讀神經(jīng)科學博士學位喳挑,希望了解真正的大腦究竟是如何工作的,以此促進人工智能的發(fā)展滔悉。2014年他創(chuàng)辦公司Deep Mind, 公司產(chǎn)品阿爾法狗在2016年大戰(zhàn)圍棋冠軍李世石事件上一舉成名伊诵。
哈薩比斯在當天的演講中透露了韓國棋手李世石去年輸給阿爾法狗的致命原因,他最后也提到了阿爾法狗即將迎戰(zhàn)的中國棋手柯潔回官,他說曹宴,“柯潔也在網(wǎng)上和阿爾法狗對決過,比賽之后柯潔說人類已經(jīng)研究圍棋研究了幾千年了歉提,然而人工智能卻告訴我們笛坦,我們甚至連其表皮都沒揭開。異曲同工苔巨,柯潔提到了圍棋的真理版扩,我們在這里談的是科學的真理≈对螅”
澎湃新聞現(xiàn)場聆聽了AlphaGo(阿爾法狗)之父在劍橋大學歷時45分鐘的演講,干貨滿滿蔬顾,請不要漏掉任何一個細節(jié):
非常感謝大家今天能夠到場宴偿,今天,我將談談人工智能诀豁,以及DeepMind近期在做些什么窄刘,我把這場報告命名為“超越人類認知的極限”,我希望到了報告結(jié)束的時候舷胜,大家都清晰了解我想傳達的思想娩践。
1.你真的知道什么是人工智能嗎活翩?
對于不知道DeepMind公司的朋友,我做個簡單介紹翻伺,我們是在2010年于倫敦成立了這家公司材泄,在2014年我們被谷歌收購,希望借此加快我們?nèi)斯ぶ悄芗夹g的腳步吨岭。我們的使命是什么呢拉宗?我們的首要使命便是解決人工智能問題;一旦這個問題解決了辣辫,理論上任何問題都可以被解決旦事。這就是我們的兩大使命了急灭,聽起來可能有點狡猾,但是我們真的相信葬馋,如果人工智能最基本的問題都解決了的話,沒有什么問題是困難的畴嘶。
那么我們準備怎樣實現(xiàn)這個目標呢?DeepMind現(xiàn)在在努力制造世界上第一臺通用學習機掠廓,大體上學習可以分為兩類:一種就是直接從輸入和經(jīng)驗中學習,沒有既定的程序或者規(guī)則可循沉颂,系統(tǒng)需要從原始數(shù)據(jù)自己進行學習;第二種學習系統(tǒng)就是通用學習系統(tǒng)铸屉,指的是一種算法可以用于不同的任務和領域切端,甚至是一些從未見過的全新領域。大家肯定會問踏枣,系統(tǒng)是怎么做到這一點的昌屉?
其實,人腦就是一個非常明顯的例子茵瀑,這是可能的间驮,關鍵在于如何通過大量的數(shù)據(jù)資源,尋找到最合適的解決方式和算法马昨。我們把這種系統(tǒng)叫做通用人工智能竞帽,來區(qū)別于如今我們當前大部分人在用的僅在某一領域發(fā)揮特長的狹義人工智能扛施,這種狹義人工智能在過去的40-50年非常流行。
IBM 發(fā)明的深藍系統(tǒng)(Deep Blue)就是一個很好的狹義人工智能的例子屹篓,他在上世紀90年代末期曾打敗了國際象棋冠軍加里·卡斯帕羅夫(Gary Kasporov)?疙渣。如今,我們到了人工智能的新的轉(zhuǎn)折點堆巧,我們有著更加先進妄荔、更加匹配的技術。
2.如何讓機器聽從人類的命令恳邀?
大家可能想問機器是如何聽從人類的命令的懦冰,其實并不是機器或者算法本身,而是一群聰明的編程者智慧的結(jié)晶谣沸。他們與每一位國際象棋大師對話,汲取他們的經(jīng)驗笋颤,把其轉(zhuǎn)化成代碼和規(guī)則乳附,組建了人類最強的象棋大師團隊。但是這樣的系統(tǒng)僅限于象棋伴澄,不能用于其他游戲赋除。對于新的游戲,你需要重新開始編程非凌。在某種程度上举农,這些技術仍然不夠完美,并不是傳統(tǒng)意義上的完全人工智能敞嗡,其中所缺失的就是普適性和學習性。我們想通過“增強學習”來解決這一難題棱貌。在這里我解釋一下增強學習,我相信很多人都了解這個算法障贸。
首先,想像一下有一個主體嘀粱,在AI領域我們稱我們的人工智能系統(tǒng)為主體,它需要了解自己所處的環(huán)境,并盡力找出自己要達到的目的薄湿。這里的環(huán)境可以指真實事件偷卧,可以是機器人听诸,也可以是虛擬世界,比如游戲環(huán)境晌梨;主體通過兩種方式與周圍環(huán)境接觸泛领;它先通過觀察熟悉環(huán)境渊鞋,我們起初通過視覺,也可以通過聽覺员辩、觸覺等妒穴,我們也在發(fā)展多感覺的系統(tǒng)杰赛;
第二個任務根时,就是在此基礎上,建模并找出最佳選擇。這可能涉及到對未來的預期,想像把鉴,以及假設檢驗。這個主體經(jīng)常處在真實環(huán)境中峰搪,當時間節(jié)點到了的時候使套,系統(tǒng)需要輸出當前找到的最佳方案。這個方案可能或多或少會改變所處環(huán)境,從而進一步驅(qū)動觀察的結(jié)果,并反饋給主體匙握。
簡單來說麦射,這就是增強學習的原則,示意圖雖然簡單半等,但是其中卻涉及了極其復雜的算法和原理。如果我們能夠解決大部分問題,我們就能夠搭建普適人工智能。這是因為兩個主要原因:首先葡幸,從數(shù)學角度來講,我的合伙人,一名博士搀别,他搭建了一個系統(tǒng)叫‘AI-XI’蛮穿,用這個模型,他證明了在計算機硬件條件和時間無限的情況下羔飞,搭建一個普適人工智能么伯,需要的信息骨望。另外擎鸠,從生物角度來講,動物和人類等,人類的大腦是多巴胺控制的,它在執(zhí)行增強學習的行為夭坪。因此戏仓,不論是從數(shù)學的角度,還是生物的角度,增強學習是一個有效的解決人工智能問題的工具抗蠢。
3.為什么圍棋是人工智能難解之謎?
接下來壶硅,我要主要講講我們最近的技術扼睬,那就是去年誕生的阿爾法狗窗宇;希望在座的大家了解這個游戲捧存,并嘗試玩玩镰官,這是個非常棒的游戲泳唠。圍棋使用方形格狀棋盤及黑白二色圓形棋子進行對弈,棋盤上有縱橫各19條直線將棋盤分成361個交叉點,棋子走在交叉點上,雙方交替行棋哨苛,以圍地多者為勝玻侥。圍棋規(guī)則沒有多復雜边锁,我可以在五分鐘之內(nèi)教給大家音半。這張圖展示的就是一局已結(jié)束,整個棋盤基本布滿棋子,然后數(shù)一下你的棋子圈出的空間以及對方棋子圈出的空間,誰的空間大,誰就獲勝抖拴。在圖示的這場勢均力敵的比賽中笼蛛,白棋一格之差險勝。
其實,了解這個游戲的最終目的非常難,因為它并不像象棋那樣,有著直接明確的目標,在圍棋里噩峦,完全是憑直覺的,甚至連如何決定游戲結(jié)束對于初學者來說,都很難。圍棋是個歷史悠久的游戲,有著3000多年的歷史滤馍,起源于中國熙涤,在亞洲那槽,圍棋有著很深的文化意義。孔子還曾指出,圍棋是每一個真正的學者都應該掌握的四大技能之一(琴棋書畫)院尔,所以在亞洲圍棋是種藝術伍茄,專家們都會玩。
如今,這個游戲更加流行,有4000萬人在玩圍棋,超過2000多個頂級專家圃验,如果你在4-5歲的時候就展示了圍棋的天賦岳颇,這些小孩將會被選中,并進入特殊的專業(yè)圍棋學校,在那里,學生從6歲起,每天花12個小時學習圍棋,一周七天讲仰,天天如此霹俺。直到你成為這個領域的專家,才可以離開學校畢業(yè)。這些專家基本是投入人生全部的精力,去揣摩學習掌握這門技巧蹋宦,我認為圍棋也許是最優(yōu)雅的一種游戲了惑艇。
像我說的那樣思灌,這個游戲只有兩個非常簡單的規(guī)則甜奄,而其復雜性卻是難以想象的晨继,一共有10170 (10的170次方) 種可能性餐屎,這個數(shù)字比整個宇宙中的原子數(shù)1080(10的80次方)都多的去了,是沒有辦法窮舉出圍棋所有的可能結(jié)果的润讥。我們需要一種更加聰明的方法盘寡。你也許會問為什么計算機進行圍棋的游戲會如此困難竿痰,1997年,IBM的人工智能DeepBlue(深藍)打敗了當時的象棋世界冠軍GarryKasparov,圍棋一直是人工智能領域的難解之謎抚吠。我們能否做出一個算法來與世界圍棋冠軍競爭呢?要做到這一點孵户,有兩個大的挑戰(zhàn):
一夏哭、搜索空間龐大(分支因數(shù)就有200)竖配,一個很好的例子里逆,就是在圍棋中诸衔,平均每一個棋子有兩百個可能的位置竭宰,而象棋僅僅是20. 圍棋的分支因數(shù)遠大于象棋伴箩。
二、比這個更難的是,幾乎沒有一個合適的評價函數(shù)來定義誰是贏家炼蛤,贏了多少;這個評價函數(shù)對于該系統(tǒng)是至關重要的烹看。而對于象棋來說,寫一個評價函數(shù)是非常簡單的崎岂,因為象棋不僅是個相對簡單的游戲濒憋,而且是實體的黔夭,只用數(shù)一下雙方的棋子颜屠,就能輕而易舉得出結(jié)論了。你也可以通過其他指標來評價象棋餐济,比如棋子移動性等蚁阳。
所有的這些在圍棋里都是不可能的,并不是所有的部分都一樣倔喂,甚至一個小小部分的變動,會完全變化格局绰上,所以每一個小的棋子都對棋局有著至關重要的影響。最難的部分是盹舞,我稱象棋為毀滅性的游戲述雾,游戲開始的時候,所有的棋子都在棋盤上了碰酝,隨著游戲的進行,棋子被對方吃掉爽航,棋子數(shù)目不斷減少氏义,游戲也變得越來越簡單。相反筋岛,圍棋是個建設性的游戲贪磺,開始的時候,棋盤是空的,慢慢的下棋雙方把棋盤填滿。
因此,如果你準備在中場判斷一下當前形勢,在象棋里沮榜,你只需看現(xiàn)在的棋盤振愿,就能告訴你大致情況;在圍棋里,你必須評估未來可能會發(fā)生什么潭陪,才能評估當前局勢宿百,所以相比較而言,圍棋難得多逛尚。也有很多人試著將DeepBlue的技術應用在圍棋上件缸,但是結(jié)果并不理想,這些技術連一個專業(yè)的圍棋手都打不贏俏脊,更別說世界冠軍了爷贫。
所以大家就要問了补憾,連電腦操作起來都這么難,人類是怎樣解決這個問題的卷员?其實余蟹,人類是靠直覺的,而圍棋一開始就是一個靠直覺而非計算的游戲子刮。所以威酒,如果你問一個象棋選手,為什么這步這樣走挺峡,他會告訴你,這樣走完之后橱赠,下一步和下下一步會怎樣走尤仍,就可以達到什么樣的目的。這樣的計劃狭姨,有時候也許不盡如人意宰啦,但是起碼選手是有原因的。
然而圍棋就不同了饼拍,如果你去問世界級的大師赡模,為什么走這一步,他們經(jīng)呈Τ回答你直覺告訴他這么走漓柑,這是真的,他們是沒法描述其中的原因的叨吮。我們通過用加強學習的方式來提高人工神經(jīng)網(wǎng)絡算法辆布,希望能夠解決這一問題。我們試圖通過深度神經(jīng)網(wǎng)絡模仿人類的這種直覺行為茶鉴,在這里锋玲,需要訓練兩個神經(jīng)網(wǎng)絡,一種是決策網(wǎng)絡涵叮,我們從網(wǎng)上下載了成百萬的業(yè)余圍棋游戲惭蹂,通過監(jiān)督學習,我們讓阿爾法狗模擬人類下圍棋的行為围肥;我們從棋盤上任意選擇一個落子點剿干,訓練系統(tǒng)去預測下一步人類將作出的決定蜂怎;系統(tǒng)的輸入是在那個特殊位置最有可能發(fā)生的前五或者前十的位置移動穆刻;這樣,你只需看那5-10種可能性杠步,而不用分析所有的200種可能性了氢伟。
一旦我們有了這個榜轿,我們對系統(tǒng)進行幾百萬次的訓練,通過誤差加強學習朵锣,對于贏了的情況谬盐,讓系統(tǒng)意識到,下次出現(xiàn)類似的情形時诚些,更有可能做相似的決定飞傀。相反,如果系統(tǒng)輸了诬烹,那么下次再出現(xiàn)類似的情況砸烦,就不會選擇這種走法。我們建立了自己的游戲數(shù)據(jù)庫绞吁,通過百萬次的游戲幢痘,對系統(tǒng)進行訓練,得到第二種神經(jīng)網(wǎng)絡家破。選擇不同的落子點颜说,經(jīng)過置信區(qū)間進行學習,選出能夠贏的情況汰聋,這個幾率介于0-1之間门粪,0是根本不可能贏,1是百分之百贏烹困。
通過把這兩個神經(jīng)網(wǎng)絡結(jié)合起來(決策網(wǎng)絡和數(shù)值網(wǎng)絡)庄拇,我們可以大致預估出當前的情況。這兩個神經(jīng)網(wǎng)絡樹韭邓,通過蒙特卡洛算法措近,把這種本來不能解決的問題,變得可以解決女淑。我們網(wǎng)羅了大部分的圍棋下法瞭郑,然后和歐洲的圍棋冠軍比賽,結(jié)果是阿爾法狗贏了鸭你,那是我們的第一次突破屈张,而且相關算法還被發(fā)表在《自然》科學雜志。
接下來袱巨,我們在韓國設立了100萬美元的獎金阁谆,并在2016年3月,與世界圍棋冠軍李世石進行了對決愉老。李世石先生是圍棋界的傳奇场绿,在過去的10年里都被認為是最頂級的圍棋專家。我們與他進行對決嫉入,發(fā)現(xiàn)他有非常多創(chuàng)新的玩法焰盗,有的時候阿爾法狗很難掌控璧尸。比賽開始之前,世界上每個人(包括他本人在內(nèi))都認為他一定會很輕松就打贏這五場比賽熬拒,但實際結(jié)果是我們的阿爾法狗以4:1獲勝爷光。圍棋專家和人工智能領域的專家都稱這具有劃時代的意義。對于業(yè)界人員來說澎粟,之前根本沒想到蛀序。
4.棋局哪個關鍵區(qū)域被人類忽視了?
這對于我們來說也是一生僅有一次的偶然事件活烙。這場比賽哼拔,全世界28億人在關注,35000多篇關于此的報道瓣颅。整個韓國那一周都在圍繞這個話題倦逐。真是一件非常美妙的事情。對于我們而言宫补,重要的不是阿爾法狗贏了這個比賽檬姥,而是了解分析他是如何贏的,這個系統(tǒng)有多強的創(chuàng)新能力粉怕。阿爾法狗不僅僅只是模仿其他人類選手的下法健民,他在不斷創(chuàng)新。在這里舉個例子 贫贝,這是第二局里的一個情況秉犹,第37步,這一步是我整個比賽中最喜歡的一步稚晚。在這里崇堵,黑棋代表阿爾法狗,他將棋子落在了圖中三角標出的位置客燕。為什么這步這么關鍵呢?為什么大家都被震驚到了鸳劳。
其實在圍棋中有兩條至關重要的分界線,從右數(shù)第三根線傍妒。如果在第三根線上移動棋子幔摸,意味著你將占領這個線右邊的領域。而如果是在第四根線上落子颤练,意味著你想向棋盤中部進軍既忆,潛在的,未來你會占棋盤上其他部分的領域,可能和你在第三根線上得到的領域相當尿贫。
所以在過去的3000多年里,人們認為在第三根線上落子和第四根線上落子有著相同的重要性踏揣。但是在這場游戲中庆亡,大家看到在這第37步中,阿爾法狗落子在了第五條線捞稿,進軍棋局的中部區(qū)域又谋。與第四根線相比,這根線離中部區(qū)域更近娱局。這可能意味著彰亥,在幾千年里,人們低估了棋局中部區(qū)域的重要性衰齐。
有趣的是任斋,圍棋就是一門藝術,是一種客觀的藝術耻涛。我們坐在這里的每一個人废酷,都可能因為心情好壞產(chǎn)生成千上百種的新想法,但并不意味著每一種想法都是好的抹缕。而阿爾法狗卻是客觀的澈蟆,他的目標就是贏得游戲。
5.阿爾法狗拿下李世石靠哪幾個絕招卓研?
大家看到在當前的棋局下趴俘,左下角那兩個用三角標出的棋子看起來好像陷入了困難,而15步之后奏赘,這兩個棋子的力量擴散到了棋局中心寥闪,一直延續(xù)到棋盤的右邊,使得這第37步恰恰落在這里磨淌,成為一個獲勝的決定性因素橙垢。在這一步上阿爾法狗非常具有創(chuàng)新性。我本人是一個很業(yè)余的棋手伦糯,讓我們看看一位世界級專家Michael Redmond對這一步的評價柜某。 Michael是一位9段選手(圍棋最高段),就像是功夫中的黑段一樣敛纲,他說:“這是非常令人震驚的一步喂击,就像是一個錯誤的決定∮傧瑁”在實際模擬中翰绊,Michael其實一開始把棋子放在了另外一個地方,根本沒想到阿爾法狗會走這一步。像這樣的創(chuàng)新监嗜,在這個比賽中谐檀,阿爾法狗還有許多。在這里裁奇,我特別感謝李世石先生桐猬,其實在我們贏了前三局的時候,他下去了刽肠。
那是三場非常艱難的比賽音五,尤其是第一場惫撰。因為我們需要不斷訓練我們的算法,阿爾法狗之前打贏了歐洲冠軍躺涝,經(jīng)過這場比賽厨钻,我們知道了歐洲冠軍和世界冠軍的差別。理論上來講坚嗜,我們的系統(tǒng)也進步了莉撇。但是當你訓練這個系統(tǒng)的時候,我們不知道有多少是過度擬合的惶傻,因此棍郎,在第一局比賽結(jié)束之前,系統(tǒng)是不知道自己的統(tǒng)計結(jié)果的银室。所以涂佃,其實第一局,我們非常緊張蜈敢,因為如果第一局輸了辜荠,很有可能我們的算法存在巨大漏洞,有可能會連輸五局抓狭。但是如果我們第一局贏了伯病,證明我們的加權(quán)系統(tǒng)是對的。
不過否过,李世石先生在第四場的時候午笛,回來了,也許壓力緩解了許多苗桂,他做出了一步非常創(chuàng)新性的舉動药磺,我認為這是歷史上的創(chuàng)新之舉。這一步迷惑了阿爾法狗煤伟,使他的決策樹進行了錯誤估計癌佩,一些中國的專家甚至稱之為“黃金之舉”木缝。通過這個例子,我們可以看到多少的哲理蘊含于圍棋中围辙。這些頂級專家我碟,用盡必生的精力,去找出這種黃金之舉姚建。
其實矫俺,在這步里,阿爾法狗知道這是非常不尋常的一步桥胞,他當時估計李世石通過這步贏的可能性是0.007%恳守,阿爾法狗之前沒有見過這樣的落子方式考婴,在那2分鐘里贩虾,他需要重新搜索決策計算。我剛剛已經(jīng)提到過這個游戲的影響:28億人觀看沥阱,35000相關文章的媒體報道缎罢,在西方網(wǎng)售的圍棋被一搶而空,我聽說MIT(美國麻省理工學院)還有其他很多高校考杉,許多人新加入了圍棋社策精。
我剛才談到了直覺和創(chuàng)新咽袜,直覺是一種含蓄的表達,它是基于人類的經(jīng)歷和本能的一種思維形式枕稀,不需要精確計算询刹。這一決策的準確性可以通過行為進行評判。在圍棋里很簡單萎坷,我們給系統(tǒng)輸入棋子的位置凹联,來評估其重要性。阿爾法狗就是在模擬人類這種直覺行為哆档。創(chuàng)新蔽挠,我認為就是在已有知識和經(jīng)驗的基礎上,產(chǎn)生一種原始的瓜浸,創(chuàng)新的觀點澳淑。阿爾法狗很明顯的示范了這兩種能力。
6.神秘棋手Master究竟是不是阿爾法狗插佛?
那么我們今天的主題是“超越人類認知的極限”偶惠,下一步應該是什么呢?從去年三月以來朗涩,我們一直在不斷完善和改進阿爾法狗忽孽,大家肯定會問,既然我們已經(jīng)是世界冠軍了,還有什么可完善的兄一? 其實厘线,我們認為阿爾法狗還不是完美的,還需要做更多的研究出革。
首先造壮,我們想要繼續(xù)研究剛才提到的和李世石的第四局的比賽,來填充知識的空白骂束;這個問題其實已經(jīng)被解決了耳璧,我們建立了一個新的阿爾法狗分系統(tǒng),不同于主系統(tǒng)展箱,這個分支系統(tǒng)是用來困惑主系統(tǒng)的旨枯。我們也優(yōu)化了系統(tǒng)的行為,以前我們需要花至少3個月來訓練系統(tǒng)混驰,現(xiàn)在只需要一周時間攀隔。
第二,我們需要理解阿爾法狗所采取的決定栖榨,并對其進行解釋昆汹;阿爾法狗這樣做的原因是什么,是否符合人類的想法等等婴栽;我們通過對比人類大腦對于不同落子位置的反應以及阿爾法狗對于棋子位置的反應满粗,以期找到一些新的知識;本質(zhì)上就是想讓系統(tǒng)更專業(yè)愚争。我們在網(wǎng)絡上與世界頂級的專家對決焦匈,一開始我們使用了一個假名(Master)既穆,在連勝之后被大家猜出是阿爾法狗撤缴。這些都是頂級的專家捐顷,我們至今已贏了60位大師了。如果你做個簡單的貝葉斯分析狸膏,你會發(fā)現(xiàn)阿爾法狗贏不同對手的難易也不一樣沟饥。而且,阿爾法狗也在不斷自我創(chuàng)新湾戳,比如說圖中右下角這個棋子(圓圈標處)贤旷,落在第二根線里,以往我們并不認為這是個有效的位置砾脑。實際上幼驶,韓國有的團隊預約了這些游戲,想研究其中新的意義和信息韧衣。
柯潔,既是中國的圍棋冠軍氏淑,也是目前的世界圍棋冠軍勃蜘,他才19歲。他也在網(wǎng)上和阿爾法狗對決過假残,比賽之后他說人類已經(jīng)研究圍棋研究了幾千年了缭贡,然而人工智能卻告訴我們,我們甚至連其表皮都沒揭開辉懒。他也說人類和人工智能的聯(lián)合將會開創(chuàng)一個新紀元阳惹,將共同發(fā)現(xiàn)圍棋的真諦。異曲同工眶俩,柯潔提到了圍棋的真理莹汤,我們在這里談的是科學的真理。
那么圍棋的新紀元是否真的到來了呢嗽仪?圍棋史上這樣的劃時代事件曾經(jīng)發(fā)生過兩次,第一次是發(fā)生在1600年左右的日本柒莉,20世紀30-40年代的日本闻坚,日本一位當時非常杰出的圍棋高手吳清源提出了一個全新的關于圍棋的理論,將圍棋提升到了一個全新的境界兢孝。大家說如今窿凤,阿爾法狗帶來的是圍棋界的第三次變革。
7.為什么人工智能“下圍棋”強于“下象棋”跨蟹?
我想解釋一下雳殊,為什么人工智能在圍棋界所作出的貢獻,要遠大于象棋界窗轩。如果我們看看當今的世界國際象棋冠軍芒努斯·卡爾森夯秃,他其實和之前的世界冠軍沒什么大的區(qū)別,他們都很優(yōu)秀痢艺,都很聰明仓洼。但為什么當人工智能出現(xiàn)的時候,他們可以遠遠超越人類堤舒?我認為其中的原因是色建,國際象棋更注重戰(zhàn)術,而阿爾法狗更注重戰(zhàn)略舌缤。如今世界頂級的國際象棋程序再不會犯技術性的錯誤箕戳,而在人類身上某残,不可能不犯錯。
第二陵吸,國際象棋有著巨大的數(shù)據(jù)庫驾锰,如果棋盤上少于9個棋子的時候,通過數(shù)學算法就可以計算出誰勝誰敗了走越。計算機通過成千上萬的迭代算法椭豫,就可以計算出來了。因此旨指,當棋盤上少于九個棋子的時候赏酥,下象棋時人類是沒有辦法獲勝的。
因此谆构,國際象棋的算法已經(jīng)近乎極致裸扶,我們沒有辦法再去提高它。然而圍棋里的阿爾法狗搬素,在不斷創(chuàng)造新的想法呵晨,這些全新的想法,在和真人對決的時候熬尺,頂級的棋手也可以把其納入到考慮的范疇摸屠,不斷提高自己。
就如歐洲圍棋冠軍樊麾(第一位與阿爾法狗對陣的人類職業(yè)棋手)所說的那樣粱哼,在和阿爾法狗對決的過程中季二,機器人不斷創(chuàng)新的下法,也讓人類不斷跳出自己的思維局限揭措,不斷提高自己胯舷。大家都知道,經(jīng)過專業(yè)圍棋學校里30多年的磨練绊含,他們的很多思維已經(jīng)固化桑嘶,機器人的創(chuàng)新想法能為其帶來意想不到的靈感。我真的相信如果人類和機器人結(jié)合在一起躬充,能創(chuàng)造出許多不可思議的事情逃顶。我們的天性和真正的潛力會被真正釋放出來。
8.阿爾法狗不為了贏取比賽又是為了什么麻裳?
就像是天文學家利用哈勃望遠鏡觀察宇宙一樣口蝠,利用阿爾法狗,圍棋專家可以去探索他們的未知世界津坑,探索圍棋世界的奧秘妙蔗。我們發(fā)明阿爾法狗,并不是為了贏取圍棋比賽疆瑰,我們是想為測試我們自己的人工智能算法搭建一個有效的平臺眉反,我們的最終目的是把這些算法應用到真實的世界中昙啄,為社會所服務。
當今世界面臨的一個巨大挑戰(zhàn)就是過量的信息和復雜的系統(tǒng)寸五,我們怎么才能找到其中的規(guī)律和結(jié)構(gòu)梳凛,從疾病到氣候,我們需要解決不同領域的問題梳杏。這些領域十分復雜韧拒,對于這些問題,即使是最聰明的人類也無法解決的十性。
我認為人工智能是解決這些問題的一個潛在方式叛溢。在如今這個充斥著各種新技術的時代,人工智能必須在人類道德基準范圍內(nèi)被開發(fā)和利用劲适。本來楷掉,技術是中性的,但是我們使用它的目的和使用它的范圍霞势,大大決定了其功能和性質(zhì)烹植,這必須是一個讓人人受益的技術才行。
我自己的理想是通過自己的努力愕贡,讓人工智能科學家或者人工智能助理和醫(yī)藥助理成為可能草雕,通過該技術,我們可以真正加速技術的更新和進步颂鸿。
(本文作者系英國劍橋大學神經(jīng)學博士生促绵,AlphaGo之父哈薩比斯在劍橋大學的校友)
免費參加InnoTalk沙龍-InnoTalk-從人工智能在金融領域的應用創(chuàng)新看未來發(fā)展機會: