圍棋之后，游戲領(lǐng)域人機(jī)大戰(zhàn)的序幕開(kāi)啟

自AlphaGo徹底在圍棋領(lǐng)域戰(zhàn)勝人類(lèi)后拧咳，包括DeepMind在內(nèi)的諸多科技公司開(kāi)始把目光轉(zhuǎn)移到游戲領(lǐng)域伯顶。相較棋牌類(lèi)而言，對(duì)戰(zhàn)游戲中涉及的信息處理和決策選擇呛踊，稱得上難度劇增，如果真的能夠徹底在這些方面戰(zhàn)勝人類(lèi)啦撮，可以說(shuō)AI的實(shí)力又攀升了一個(gè)階段谭网。

關(guān)注相關(guān)消息的朋友，應(yīng)該留意到近期兩件游戲領(lǐng)域ai相關(guān)的消息赃春，一件是DeepMind和暴雪發(fā)布了用于星際爭(zhēng)霸2（SC2）的機(jī)器學(xué)習(xí)平臺(tái)SC2LE愉择，另一件是Openai的bot在dota2單人solo賽上完虐了職業(yè)選手。

先來(lái)說(shuō)說(shuō)SC2的织中，這游戲相對(duì)來(lái)說(shuō)有些年頭锥涕，目前是在國(guó)外尤其韓國(guó)流行，身邊可能在玩的玩家相對(duì)少一些狭吼，但是這毫不影響SC2是一款成熟優(yōu)秀的即時(shí)戰(zhàn)略游戲层坠。所謂即時(shí)戰(zhàn)略，即需要即時(shí)進(jìn)行決策刁笙，并進(jìn)行宏觀上的排兵布陣以及資源分配破花。拿圍棋對(duì)比的話，圍棋每一步要進(jìn)行的選擇是300多疲吸，而在星際2中座每，僅在一個(gè)84*84的屏幕范圍內(nèi)操作，就有大約1億個(gè)可能的操作摘悴。而在游戲中峭梳，不僅僅是操作一個(gè)行為正確即可，戰(zhàn)略體現(xiàn)在有時(shí)做出的決定往往是在十幾分鐘甚至更久后才會(huì)產(chǎn)生效果蹂喻。同時(shí)葱椭，玩家只能看到自己當(dāng)前觀察的地圖部分捂寿，即全局信息是不完整的。綜上可見(jiàn)挫以，一個(gè)玩家在進(jìn)行游戲時(shí)者蠕，除了需要準(zhǔn)確操作外，還需要對(duì)有限的信息進(jìn)行推測(cè)判斷掐松，并有所計(jì)劃地安排當(dāng)前的操作踱侣，以在后續(xù)的過(guò)程中獲得優(yōu)勢(shì)。

其實(shí)玩過(guò)游戲的朋友都知道游戲里很早就有傳統(tǒng)的電腦AI可供對(duì)戰(zhàn)大磺，所謂人機(jī)對(duì)戰(zhàn)似乎也沒(méi)什么新奇抡句。傳統(tǒng)的AI是通過(guò)api數(shù)據(jù)接口的形式來(lái)獲取場(chǎng)上的信息，比如在雙方部隊(duì)交戰(zhàn)時(shí)杠愧，無(wú)需去點(diǎn)選敵方的每一個(gè)部隊(duì)單位待榔，就已經(jīng)通過(guò)api獲取了敵方的所有血量\藍(lán)量等信息，再通過(guò)接口的形式指揮己方單位來(lái)進(jìn)行交戰(zhàn)流济。DeepMind所要挑戰(zhàn)的方式卻并非通過(guò)api接口來(lái)獲取數(shù)據(jù)和操作锐锣，而是完全模仿玩家所能獲取的信息，并依靠鍵盤(pán)鼠標(biāo)進(jìn)行操作绳瘟。如下圖中指揮一個(gè)農(nóng)民建造房子的過(guò)程雕憔。

如此要求之下，DeepMind和暴雪努力的這一年里糖声，在嘗試了隨機(jī)策略斤彼、隨機(jī)搜索、全聯(lián)接卷積蘸泻、全聯(lián)結(jié)LSTM后琉苇，也就僅僅能比較好地完成上圖的造房子造農(nóng)民。但是對(duì)戰(zhàn)的話悦施，連傳統(tǒng)的簡(jiǎn)單難度AI都不贏并扇，甚至把一場(chǎng)游戲打完的能力都沒(méi)有。抡诞。拜马。可想而知，這次的挑戰(zhàn)在當(dāng)前的深度學(xué)習(xí)和增強(qiáng)學(xué)習(xí)算法支持下沐绒，可能是無(wú)法完成的俩莽。于是乎DeepMind和暴雪就聯(lián)合發(fā)布了游戲輸入輸出的API，并做了基于Python的封裝乔遮，同時(shí)承諾會(huì)持續(xù)發(fā)布對(duì)戰(zhàn)replay作為訓(xùn)練數(shù)據(jù)扮超。算是把這個(gè)難題推給了全球的算法研究愛(ài)好者們，期待會(huì)有優(yōu)秀的方法帶來(lái)突破吧。

再來(lái)說(shuō)說(shuō)TI7賽場(chǎng)上亮相的Openai出刷，主辦方挺有心的約來(lái)人氣選手DENDI來(lái)做“展示用小白鼠”璧疗，和bot打一場(chǎng)公開(kāi)的solo表演賽。最后的場(chǎng)面是DENDI被完虐馁龟，第一局0:2人頭告負(fù)崩侠，第二局被擊殺一次后直接打出GG，并拒絕再打第三局坷檩。

Dota2 OpenAI Solo Bot_騰訊視頻

3分鐘20秒開(kāi)始比賽却音，之前有SumaiL、Arteezy 等選手在賽前測(cè)試時(shí)被完虐時(shí)的場(chǎng)景

刀塔的完整游戲是5V5的moba型游戲矢炼，即由兩隊(duì)各5名玩家操作一個(gè)英雄來(lái)進(jìn)行對(duì)戰(zhàn)系瓢。而本次openai挑戰(zhàn)的是solo比賽，是刀塔玩家很喜歡用來(lái)比較操作基本功的1V1模式句灌。該模式下主要比拼的是玩家的操作基本功夷陋，包括卡位、補(bǔ)刀胰锌、壓制對(duì)方骗绕、仇恨控制等。

根據(jù)Openai在比賽前后的宣傳文章來(lái)看资昧，他們?cè)谶M(jìn)行bot訓(xùn)練時(shí)酬土，并沒(méi)有使用任何玩家對(duì)戰(zhàn)的replay數(shù)據(jù)，而是純靠自對(duì)戰(zhàn)提升的方式榛搔，大約20小時(shí)的時(shí)間后就達(dá)到了目前的水平诺凡。而數(shù)據(jù)獲取方面东揣，Openai使用的應(yīng)該還是刀塔2提供的接口方式践惑，只不過(guò)對(duì)AI進(jìn)行了限制，讓AI的apm(單位時(shí)間內(nèi)平均有效操作次數(shù))和人類(lèi)平均水平相同嘶卧。

兩件事情出來(lái)之后尔觉，就有有心之人開(kāi)始想搞個(gè)大新聞了，片面的說(shuō)Openai的實(shí)力遠(yuǎn)超DeepMind之類(lèi)來(lái)造噱頭芥吟，實(shí)在是不負(fù)責(zé)任了侦铜。

上文中其實(shí)已經(jīng)大致說(shuō)明了原因，首先是二者所要挑戰(zhàn)的任務(wù)難度差別很大钟鸵，Openai面對(duì)的1V1任務(wù)極大簡(jiǎn)化了所要分析決策的內(nèi)容钉稍，他們自己的文章上也指出仍無(wú)法完成5V5的挑戰(zhàn)。其次是數(shù)據(jù)獲取與執(zhí)行操作的方式棺耍，api接口下任務(wù)相對(duì)簡(jiǎn)化贡未，而Deepmind和暴雪反而是挖了一個(gè)深坑，基本的數(shù)據(jù)獲取就在進(jìn)行圖像的處理分析，從簡(jiǎn)化的2D特征圖開(kāi)始俊卤。另外就是目的的不同了嫩挤，功利的角度看，Openai更希望能夠有所成績(jī)宣傳自家消恍，而不像已在圍棋方面獲得聲望的Deepmind更有些挑戰(zhàn)極限的意味岂昭。

但是不過(guò)無(wú)論怎樣，不能否認(rèn)兩家公司都在做出讓人欽佩的工作狠怨，能夠認(rèn)識(shí)到目前的算法領(lǐng)域约啊，已經(jīng)在把攻克戰(zhàn)略游戲當(dāng)做一個(gè)挑戰(zhàn)性的目標(biāo)，富有挑戰(zhàn)以及價(jià)值取董。這一目標(biāo)被徹底達(dá)成時(shí)棍苹，真正的強(qiáng)人工智能也就不遠(yuǎn)了。在那時(shí)的背景下茵汰，許多行業(yè)尤其重復(fù)性邏輯性強(qiáng)的行業(yè)枢里，都會(huì)受到影響與沖擊，畢竟蹂午，人工智能能夠很好完成工作內(nèi)容時(shí)栏豺，所需考慮的就只是時(shí)間和成本了吧。

最后編輯于：2017.12.10 01:22:32

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末豆胸，一起剝皮案震驚了整個(gè)濱河市奥洼，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌晚胡，老刑警劉巖灵奖，帶你破解...
沈念sama閱讀 222,590評(píng)論 6贊 517
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異估盘，居然都是意外死亡瓷患，警方通過(guò)查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 95,157評(píng)論 3贊 399
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)遣妥，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)擅编，“玉大人，你說(shuō)我怎么就攤上這事箫踩“” “怎么了？”我有些...
開(kāi)封第一講書(shū)人閱讀 169,301評(píng)論 0贊 362
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵境钟，是天一觀的道長(zhǎng)锦担。經(jīng)常有香客問(wèn)我，道長(zhǎng)慨削，這世上最難降的妖魔是什么洞渔？我笑而不...
開(kāi)封第一講書(shū)人閱讀 60,078評(píng)論 1贊 300
?港島之戀（遺憾婚禮）
正文為了忘掉前任鱼的，我火速辦了婚禮，結(jié)果婚禮上痘煤，老公的妹妹穿的比我還像新娘凑阶。我一直安慰自己，他們只是感情好衷快，可當(dāng)我...
茶點(diǎn)故事閱讀 69,082評(píng)論 6贊 398
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布宙橱。她就那樣靜靜地躺著，像睡著了一般蘸拔。火紅的嫁衣襯著肌膚如雪师郑。梳的紋絲不亂的頭發(fā)上，一...
開(kāi)封第一講書(shū)人閱讀 52,682評(píng)論 1贊 312
城市分裂傳說(shuō)
那天调窍，我揣著相機(jī)與錄音宝冕，去河邊找鬼。笑死邓萨，一個(gè)胖子當(dāng)著我的面吹牛地梨，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播缔恳，決...
沈念sama閱讀 41,155評(píng)論 3贊 422
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼宝剖，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來(lái)了歉甚？” 一聲冷哼從身側(cè)響起万细，我...
開(kāi)封第一講書(shū)人閱讀 40,098評(píng)論 0贊 277
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎纸泄，沒(méi)想到半個(gè)月后赖钞，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 46,638評(píng)論 1贊 319
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡聘裁，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 38,701評(píng)論 3贊 342
?白月光啟示錄
正文我和宋清朗相戀三年雪营，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片咧虎。...
茶點(diǎn)故事閱讀 40,852評(píng)論 1贊 353
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡卓缰，死狀恐怖计呈，靈堂內(nèi)的尸體忽然破棺而出砰诵，到底是詐尸還是另有隱情，我是刑警寧澤捌显，帶...
沈念sama閱讀 36,520評(píng)論 5贊 351
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布茁彭，位于F島的核電站，受9級(jí)特大地震影響扶歪，放射性物質(zhì)發(fā)生泄漏理肺。R本人自食惡果不足惜摄闸，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 42,181評(píng)論 3贊 335
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望妹萨。院中可真熱鬧年枕，春花似錦、人聲如沸乎完。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 32,674評(píng)論 0贊 25
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)树姨。三九已至摩桶，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間帽揪，已是汗流浹背硝清。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 33,788評(píng)論 1贊 274
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留转晰，地道東北人芦拿。一個(gè)月前我還...
沈念sama閱讀 49,279評(píng)論 3贊 379
代替公主和親
正文我出身青樓，卻偏偏與公主長(zhǎng)得像查邢，于是被迫代替她去往敵國(guó)和親防嗡。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,851評(píng)論 2贊 361

圍棋之后外永，游戲領(lǐng)域人機(jī)大戰(zhàn)的序幕開(kāi)啟

圍棋之后，游戲領(lǐng)域人機(jī)大戰(zhàn)的序幕開(kāi)啟

推薦閱讀更多精彩內(nèi)容