在游戲世界里,可以重新來過隶债,可以復盤腾它,還有經(jīng)驗可積累。因此燃异,如果“拐彎”后遇到了“堵車”携狭,下次就另外選路好了。
文/張書樂
有朋友問我回俐,游戲程序是死的逛腿,人工智能應該就是活的,那么如果人工智能在游戲里和設定好的程序進行對決仅颇,結果會如何呢单默?
乍一聽,這就是個詭辯式的命題:兩段代碼之間的戰(zhàn)爭忘瓦?當時聽到這個問題時搁廓,我自然而然地想到了電影《復仇者聯(lián)盟2:奧創(chuàng)紀元》里人工智能奧創(chuàng)用光電攻擊鋼鐵俠的管家那一幕。這個想法太過科幻耕皮,至少在現(xiàn)實世界里境蜕,人工智能對戰(zhàn)游戲程序,已經(jīng)悄然展開凌停。開路先鋒依然是這個開發(fā)了“阿爾法狗”粱年、擊敗李世石的谷歌人工智能團隊DeepMind。
就在這場著名的圍棋人機大戰(zhàn)前一年罚拟,2015年3月台诗,DeepMind曾對外透露說,他們開發(fā)出一項單一算法赐俗,能學會49種不同電子游戲拉队,其中包括19世紀70年代的經(jīng)典游戲“乒乓”(Pong)和“太空侵略者”(Space Invaders)。這臺電腦對半數(shù)以上的游戲已經(jīng)相當熟練阻逮,足以擊敗專業(yè)的人類玩家粱快。如果用更通俗的說法來解讀,就是他們搞了個人工智能程序叔扼,會玩游戲事哭,而且玩得還特別“溜”。這則新聞當時并沒有多少人關注币励,反倒是圍棋人機大戰(zhàn)結束后,爆出“阿爾法狗”將在《星際爭霸》中再次挑戰(zhàn)人類的新聞時珊拼,許多媒體因為不知道那則舊聞的存在食呻,還在津津樂道于“阿爾法狗”到底是“潛入”到電腦里和玩家在游戲里作戰(zhàn),還是操控游戲臂、用“眼睛”識別屏幕上的戰(zhàn)局仅胞,像個電競玩家一樣面對面決斗每辟。
實際上,這個會玩游戲的人工智能程序早在2013年就已經(jīng)對外發(fā)布了干旧,官方對它的注釋是“首個能基于極少量起始信息從頭開始學習各種任務的人工智能系統(tǒng)”渠欺,這個解釋太復雜,讓人看不太懂椎眯。其實說簡單點挠将,它就和科幻片里那些人工智能程序一樣,不用人教编整,自己試著玩下游戲舔稀,就能自動在一款陌生游戲里慢慢生存下來,并逐步通關掌测,也就是說内贮,它與人類玩游戲的過程差不多。
那么汞斧,這個會玩游戲的人工智能程序夜郁,在學習能力上如何呢?筆者沒見過實物或者視頻粘勒,但根據(jù)媒體報道竞端,它往往花上幾小時學習一款游戲,然后就“精通”了仲义。這樣的學習速度不可謂不快婶熬!只是人工智能玩家和人類玩家還有一個明顯的不同,即精通一款游戲并不能使目前的系統(tǒng)更擅長下一款游戲埃撵。說白了赵颅,它其實并不知道自己是在玩游戲,而只是在根據(jù)自己在游戲中尋找出路的時候不斷積累經(jīng)驗暂刘,最后形成最佳通關路徑饺谬,從而擊敗只能“直行”、不會“拐彎”的游戲程序谣拣。當然募寨,這已經(jīng)是極大的進步了。我們也可以對人工智能和傳統(tǒng)程序做個簡單的區(qū)分森缠,只會“直行”(執(zhí)行)的叫程序拔鹰,能夠根據(jù)路況變化而“拐彎”的就是人工智能。
這也算是一種思考能力吧贵涵,盡管只處于人類嬰幼兒的智力階段列肢。畢竟恰画,在游戲世界里,可以重新來過瓷马,可以復盤拴还,還有經(jīng)驗可積累。因此欧聘,如果“拐彎”后遇到了“堵車”片林,下次就另外選路好了』持瑁可在現(xiàn)實世界中费封,有多少錯誤可以重來呢?按照新聞的說法晒喷,這個缺陷使它還無法精通“吃豆人”之類的迷宮游戲孝偎,因為以它的聯(lián)想能力,還無法真正把自己的當前行動與深遠的后果聯(lián)系起來凉敲。