圍棋之后,游戲領(lǐng)域人機(jī)大戰(zhàn)的序幕開(kāi)啟

自AlphaGo徹底在圍棋領(lǐng)域戰(zhàn)勝人類(lèi)后拧咳,包括DeepMind在內(nèi)的諸多科技公司開(kāi)始把目光轉(zhuǎn)移到游戲領(lǐng)域伯顶。相較棋牌類(lèi)而言,對(duì)戰(zhàn)游戲中涉及的信息處理和決策選擇呛踊,稱得上難度劇增,如果真的能夠徹底在這些方面戰(zhàn)勝人類(lèi)啦撮,可以說(shuō)AI的實(shí)力又攀升了一個(gè)階段谭网。

關(guān)注相關(guān)消息的朋友,應(yīng)該留意到近期兩件游戲領(lǐng)域ai相關(guān)的消息赃春,一件是DeepMind和暴雪發(fā)布了用于星際爭(zhēng)霸2(SC2)的機(jī)器學(xué)習(xí)平臺(tái)SC2LE愉择,另一件是Openai的bot在dota2單人solo賽上完虐了職業(yè)選手。


先來(lái)說(shuō)說(shuō)SC2的织中,這游戲相對(duì)來(lái)說(shuō)有些年頭锥涕,目前是在國(guó)外尤其韓國(guó)流行,身邊可能在玩的玩家相對(duì)少一些狭吼,但是這毫不影響SC2是一款成熟優(yōu)秀的即時(shí)戰(zhàn)略游戲层坠。所謂即時(shí)戰(zhàn)略,即需要即時(shí)進(jìn)行決策刁笙,并進(jìn)行宏觀上的排兵布陣以及資源分配破花。拿圍棋對(duì)比的話,圍棋每一步要進(jìn)行的選擇是300多疲吸,而在星際2中座每,僅在一個(gè)84*84的屏幕范圍內(nèi)操作,就有大約1億個(gè)可能的操作摘悴。而在游戲中峭梳,不僅僅是操作一個(gè)行為正確即可,戰(zhàn)略體現(xiàn)在有時(shí)做出的決定往往是在十幾分鐘甚至更久后才會(huì)產(chǎn)生效果蹂喻。同時(shí)葱椭,玩家只能看到自己當(dāng)前觀察的地圖部分捂寿,即全局信息是不完整的。綜上可見(jiàn)挫以,一個(gè)玩家在進(jìn)行游戲時(shí)者蠕,除了需要準(zhǔn)確操作外,還需要對(duì)有限的信息進(jìn)行推測(cè)判斷掐松,并有所計(jì)劃地安排當(dāng)前的操作踱侣,以在后續(xù)的過(guò)程中獲得優(yōu)勢(shì)。

其實(shí)玩過(guò)游戲的朋友都知道游戲里很早就有傳統(tǒng)的電腦AI可供對(duì)戰(zhàn)大磺,所謂人機(jī)對(duì)戰(zhàn)似乎也沒(méi)什么新奇抡句。傳統(tǒng)的AI是通過(guò)api數(shù)據(jù)接口的形式來(lái)獲取場(chǎng)上的信息,比如在雙方部隊(duì)交戰(zhàn)時(shí)杠愧,無(wú)需去點(diǎn)選敵方的每一個(gè)部隊(duì)單位待榔,就已經(jīng)通過(guò)api獲取了敵方的所有血量\藍(lán)量等信息,再通過(guò)接口的形式指揮己方單位來(lái)進(jìn)行交戰(zhàn)流济。DeepMind所要挑戰(zhàn)的方式卻并非通過(guò)api接口來(lái)獲取數(shù)據(jù)和操作锐锣,而是完全模仿玩家所能獲取的信息,并依靠鍵盤(pán)鼠標(biāo)進(jìn)行操作绳瘟。如下圖中指揮一個(gè)農(nóng)民建造房子的過(guò)程雕憔。


如此要求之下,DeepMind和暴雪努力的這一年里糖声,在嘗試了隨機(jī)策略斤彼、隨機(jī)搜索、全聯(lián)接卷積蘸泻、全聯(lián)結(jié)LSTM后琉苇,也就僅僅能比較好地完成上圖的造房子造農(nóng)民。但是對(duì)戰(zhàn)的話悦施,連傳統(tǒng)的簡(jiǎn)單難度AI都不贏并扇,甚至把一場(chǎng)游戲打完的能力都沒(méi)有。抡诞。拜马。可想而知,這次的挑戰(zhàn)在當(dāng)前的深度學(xué)習(xí)和增強(qiáng)學(xué)習(xí)算法支持下沐绒,可能是無(wú)法完成的俩莽。于是乎DeepMind和暴雪就聯(lián)合發(fā)布了游戲輸入輸出的API,并做了基于Python的封裝乔遮,同時(shí)承諾會(huì)持續(xù)發(fā)布對(duì)戰(zhàn)replay作為訓(xùn)練數(shù)據(jù)扮超。算是把這個(gè)難題推給了全球的算法研究愛(ài)好者們,期待會(huì)有優(yōu)秀的方法帶來(lái)突破吧。


再來(lái)說(shuō)說(shuō)TI7賽場(chǎng)上亮相的Openai出刷,主辦方挺有心的約來(lái)人氣選手DENDI來(lái)做“展示用小白鼠”璧疗,和bot打一場(chǎng)公開(kāi)的solo表演賽。最后的場(chǎng)面是DENDI被完虐馁龟,第一局0:2人頭告負(fù)崩侠,第二局被擊殺一次后直接打出GG,并拒絕再打第三局坷檩。


Dota2 OpenAI Solo Bot_騰訊視頻

3分鐘20秒開(kāi)始比賽却音,之前有SumaiL、Arteezy 等選手在賽前測(cè)試時(shí)被完虐時(shí)的場(chǎng)景

刀塔的完整游戲是5V5的moba型游戲矢炼,即由兩隊(duì)各5名玩家操作一個(gè)英雄來(lái)進(jìn)行對(duì)戰(zhàn)系瓢。而本次openai挑戰(zhàn)的是solo比賽,是刀塔玩家很喜歡用來(lái)比較操作基本功的1V1模式句灌。該模式下主要比拼的是玩家的操作基本功夷陋,包括卡位、補(bǔ)刀胰锌、壓制對(duì)方骗绕、仇恨控制等。

根據(jù)Openai在比賽前后的宣傳文章來(lái)看资昧,他們?cè)谶M(jìn)行bot訓(xùn)練時(shí)酬土,并沒(méi)有使用任何玩家對(duì)戰(zhàn)的replay數(shù)據(jù),而是純靠自對(duì)戰(zhàn)提升的方式榛搔,大約20小時(shí)的時(shí)間后就達(dá)到了目前的水平诺凡。而數(shù)據(jù)獲取方面东揣,Openai使用的應(yīng)該還是刀塔2提供的接口方式践惑,只不過(guò)對(duì)AI進(jìn)行了限制,讓AI的apm(單位時(shí)間內(nèi)平均有效操作次數(shù))和人類(lèi)平均水平相同嘶卧。


兩件事情出來(lái)之后尔觉,就有有心之人開(kāi)始想搞個(gè)大新聞了,片面的說(shuō)Openai的實(shí)力遠(yuǎn)超DeepMind之類(lèi)來(lái)造噱頭芥吟,實(shí)在是不負(fù)責(zé)任了侦铜。

上文中其實(shí)已經(jīng)大致說(shuō)明了原因,首先是二者所要挑戰(zhàn)的任務(wù)難度差別很大钟鸵,Openai面對(duì)的1V1任務(wù)極大簡(jiǎn)化了所要分析決策的內(nèi)容钉稍,他們自己的文章上也指出仍無(wú)法完成5V5的挑戰(zhàn)。其次是數(shù)據(jù)獲取與執(zhí)行操作的方式棺耍,api接口下任務(wù)相對(duì)簡(jiǎn)化贡未,而Deepmind和暴雪反而是挖了一個(gè)深坑,基本的數(shù)據(jù)獲取就在進(jìn)行圖像的處理分析,從簡(jiǎn)化的2D特征圖開(kāi)始俊卤。另外就是目的的不同了嫩挤,功利的角度看,Openai更希望能夠有所成績(jī)宣傳自家消恍,而不像已在圍棋方面獲得聲望的Deepmind更有些挑戰(zhàn)極限的意味岂昭。

但是不過(guò)無(wú)論怎樣,不能否認(rèn)兩家公司都在做出讓人欽佩的工作狠怨,能夠認(rèn)識(shí)到目前的算法領(lǐng)域约啊,已經(jīng)在把攻克戰(zhàn)略游戲當(dāng)做一個(gè)挑戰(zhàn)性的目標(biāo),富有挑戰(zhàn)以及價(jià)值取董。這一目標(biāo)被徹底達(dá)成時(shí)棍苹,真正的強(qiáng)人工智能也就不遠(yuǎn)了。在那時(shí)的背景下茵汰,許多行業(yè)尤其重復(fù)性邏輯性強(qiáng)的行業(yè)枢里,都會(huì)受到影響與沖擊,畢竟蹂午,人工智能能夠很好完成工作內(nèi)容時(shí)栏豺,所需考慮的就只是時(shí)間和成本了吧。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末豆胸,一起剝皮案震驚了整個(gè)濱河市奥洼,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌晚胡,老刑警劉巖灵奖,帶你破解...
    沈念sama閱讀 222,590評(píng)論 6 517
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異估盘,居然都是意外死亡瓷患,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,157評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門(mén)遣妥,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)擅编,“玉大人,你說(shuō)我怎么就攤上這事箫踩“” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 169,301評(píng)論 0 362
  • 文/不壞的土叔 我叫張陵境钟,是天一觀的道長(zhǎng)锦担。 經(jīng)常有香客問(wèn)我,道長(zhǎng)慨削,這世上最難降的妖魔是什么洞渔? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 60,078評(píng)論 1 300
  • 正文 為了忘掉前任鱼的,我火速辦了婚禮,結(jié)果婚禮上痘煤,老公的妹妹穿的比我還像新娘凑阶。我一直安慰自己,他們只是感情好衷快,可當(dāng)我...
    茶點(diǎn)故事閱讀 69,082評(píng)論 6 398
  • 文/花漫 我一把揭開(kāi)白布宙橱。 她就那樣靜靜地躺著,像睡著了一般蘸拔。 火紅的嫁衣襯著肌膚如雪师郑。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 52,682評(píng)論 1 312
  • 那天调窍,我揣著相機(jī)與錄音宝冕,去河邊找鬼。 笑死邓萨,一個(gè)胖子當(dāng)著我的面吹牛地梨,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播缔恳,決...
    沈念sama閱讀 41,155評(píng)論 3 422
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼宝剖,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了歉甚?” 一聲冷哼從身側(cè)響起万细,我...
    開(kāi)封第一講書(shū)人閱讀 40,098評(píng)論 0 277
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎纸泄,沒(méi)想到半個(gè)月后赖钞,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,638評(píng)論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡聘裁,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,701評(píng)論 3 342
  • 正文 我和宋清朗相戀三年雪营,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片咧虎。...
    茶點(diǎn)故事閱讀 40,852評(píng)論 1 353
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡卓缰,死狀恐怖计呈,靈堂內(nèi)的尸體忽然破棺而出砰诵,到底是詐尸還是另有隱情,我是刑警寧澤捌显,帶...
    沈念sama閱讀 36,520評(píng)論 5 351
  • 正文 年R本政府宣布茁彭,位于F島的核電站,受9級(jí)特大地震影響扶歪,放射性物質(zhì)發(fā)生泄漏理肺。R本人自食惡果不足惜摄闸,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,181評(píng)論 3 335
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望妹萨。 院中可真熱鬧年枕,春花似錦、人聲如沸乎完。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,674評(píng)論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)树姨。三九已至摩桶,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間帽揪,已是汗流浹背硝清。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,788評(píng)論 1 274
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留转晰,地道東北人芦拿。 一個(gè)月前我還...
    沈念sama閱讀 49,279評(píng)論 3 379
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像查邢,于是被迫代替她去往敵國(guó)和親防嗡。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,851評(píng)論 2 361

推薦閱讀更多精彩內(nèi)容