過(guò)去十年夯接,我們用了哪些即時(shí)戰(zhàn)略游戲訓(xùn)練AI?

譯者 | 李夢(mèng)

編輯 | Vincent

AI前線出品| ID:ai-front

AI 前線導(dǎo)語(yǔ):“在 RTS 游戲中進(jìn)行 AI 研究有著悠久的歷史纷妆。在過(guò)去的十多年里盔几,研究人員一直致力于構(gòu)建能打敗最強(qiáng)人類玩家的機(jī)器人,但是要走的路還很長(zhǎng)掩幢。在 2016 年的暴雪嘉年華逊拍,DeepMind 和暴雪宣布合作上鞠,將為星際爭(zhēng)霸 2 的 AI 研究開放 API。

本文旨在討論 RTS 游戲的一些發(fā)展進(jìn)程芯丧,以及 AI 研究在其中的貢獻(xiàn)芍阎。要想詳細(xì)了解 RTS 游戲相關(guān)研究,還請(qǐng)查看 Onta?on缨恒、Robertson 和 Watson 等人的文章”谴咸。(詳見文末)

過(guò)去的十年里,研究人員已經(jīng)從在 RTS 游戲中獨(dú)立研究不同的 AI 技術(shù)過(guò)渡到了在更復(fù)雜的游戲中通過(guò)合作和競(jìng)爭(zhēng)將不同的技術(shù)相互匹配肿轨。為了這項(xiàng)工作順利進(jìn)行寿冕,需要以下條件:

1、研究人員構(gòu)建和評(píng)估機(jī)器人的開放 API

2椒袍、可以讓研究人員對(duì)比不同技術(shù)的競(jìng)賽

3驼唱、用于訓(xùn)練學(xué)習(xí)算法的錄制回放

4、人類選手對(duì)機(jī)器人的性能進(jìn)行評(píng)估

在 2009 年發(fā)布的母巢之戰(zhàn) API 中以上大部分的條件都得到了滿足驹暑,但由于平臺(tái)的封閉特性使研究人員很難將 AI 系統(tǒng)的訓(xùn)練過(guò)程自動(dòng)化玫恳。隨著星際爭(zhēng)霸 2 環(huán)境的公開,研究人員將有機(jī)會(huì)開發(fā)一種能夠在 RTS 游戲中表現(xiàn)出專家級(jí)性能的系統(tǒng)优俘。下面一些是我認(rèn)為的在朝著這一目標(biāo)的發(fā)展歷程中的重大事件京办。如果有疏漏還請(qǐng)?jiān)谠u(píng)論里留言。

1998

星際爭(zhēng)霸 1 的發(fā)布

星際爭(zhēng)霸原作是在 1998 年 3 月發(fā)布的帆焕,資料片母巢之戰(zhàn)也于同年 11 月發(fā)布惭婿。它迅速風(fēng)靡全球,并在韓國(guó)引發(fā)了職業(yè)游戲的熱潮叶雹。

Freecraft

在星際爭(zhēng)霸之前财饥,1995 年發(fā)布了魔獸爭(zhēng)霸 2。魔獸爭(zhēng)霸 2 的克隆版 Freecraft 也在 1998 年首次發(fā)布折晦,它后來(lái)更名為 Wargus钥星。這個(gè)克隆版構(gòu)建在 Stratagus 游戲引擎上。Freecraft 是 RTS AI 研究的一個(gè)重要項(xiàng)目满着,因?yàn)榇蟛糠值某跏脊ぷ鞫家?Wargus 作為實(shí)驗(yàn)平臺(tái)谦炒。

2001

學(xué)術(shù)界對(duì)游戲 AI 的興趣

游戲 AI 的一篇重要文章是 John Laird 和 Michael van 在 2001 年發(fā)表于《AI Magazine》的文章 Human-Level AI’s Killer Application Interactive Computer Games。這篇文章意義重大风喇,因?yàn)樗?AAAI 的出版物中第一批認(rèn)識(shí)到實(shí)時(shí)游戲可以作為 AI 研究的良好環(huán)境宁改。它還改變了學(xué)術(shù)研究人員試圖將現(xiàn)有方法應(yīng)用于游戲的心態(tài),轉(zhuǎn)而考慮為游戲構(gòu)建全新的和專門的方法响驴。

2002

魔獸爭(zhēng)霸 3 發(fā)布

魔獸爭(zhēng)霸 3 的一大特色是高度可擴(kuò)展的地圖編輯器透且,它被用來(lái)創(chuàng)建獨(dú)特的內(nèi)容,比如最初版本的 DOTA豁鲤。地圖編輯器還擁有一些腳本功能秽誊,可以用來(lái)編寫自定義 AI。然而琳骡,以這種方式編寫的 AI 僅局限于單一地圖锅论,腳本語(yǔ)言也僅向作者提供了一個(gè)命令子集。研究人員可以在這個(gè)框架內(nèi)實(shí)現(xiàn)他們的 AI 技術(shù)楣号,但不可能用不同的機(jī)器人互相測(cè)試最易。

2003

RTS 游戲被推薦為 AI 測(cè)試平臺(tái)

2003 年,Michael Buro 和 Timothy Furtak 發(fā)表了一篇文章稱 RTS 游戲提出了許多構(gòu)建人類水平的 AI 時(shí)需要解決的新穎問(wèn)題炫狱。他們還提議開發(fā)一個(gè)開源的 RTS 游戲引擎提供給 AI 研究社區(qū)使用藻懒。

星際爭(zhēng)霸中的狀態(tài)估計(jì)

2004

ORTS 發(fā)布

接下來(lái)一年,Michael Buro 就發(fā)布了第一個(gè)版本的開源 RTS 引擎——ORTS视译。這個(gè)游戲在圖形和非圖形模式下都可以運(yùn)行嬉荆,這讓機(jī)器人可以在成千上萬(wàn)的游戲過(guò)程中快速訓(xùn)練。而使用 ORTS 的一個(gè)主要挑戰(zhàn)是酷含,雖然它為人類玩家提供了一個(gè)交互界面鄙早,但是沒(méi)有專家級(jí)的人類玩家對(duì)機(jī)器人進(jìn)行對(duì)抗評(píng)估。

ORTS 游戲引擎


第一次 Wargus 研究

Freecraft 更名為 Wargus椅亚,它使用 Stratagus 游戲引擎限番。Wargus 的主要優(yōu)勢(shì)之一是它的開源,這為研究人員打開了一個(gè)平臺(tái)呀舔,讓他們可以使用任何技術(shù)進(jìn)行探索弥虐。Wargus 面臨的挑戰(zhàn)是缺乏可以用來(lái)分析的錄制回放,它沒(méi)有活躍的玩家基礎(chǔ)媚赖,而且在測(cè)試機(jī)器人的互相對(duì)抗受到網(wǎng)絡(luò)代碼的限制霜瘪。在使用 Wargus 作為 AI 測(cè)試平臺(tái)的文章中,Marc Ponsen 是最早的發(fā)表者之一省古。

TIELT 的提出

在 2004 年提出的另一個(gè) AI 項(xiàng)目是 TIELT 系統(tǒng)粥庄,它是一個(gè) AI 框架,為多個(gè)游戲主題提供統(tǒng)一的 API豺妓。該系統(tǒng)的目標(biāo)之一是讓研究人員可以為一款游戲開發(fā) AI 并將學(xué)到的知識(shí)轉(zhuǎn)移到新的游戲中惜互。例如,在 Wargus 中學(xué)到的領(lǐng)域知識(shí)可能適用于其他 RTS 游戲琳拭。我在這里討論 TIELT 正是因?yàn)?DeepMind 和暴雪的合作成果之一就是一個(gè) API 和潛在的樣本數(shù)據(jù)集训堆。對(duì)于這個(gè) API 來(lái)說(shuō),重要的是不要為 AI 的操作做出假設(shè)白嘁。TIELT 面臨的挑戰(zhàn)在于它沒(méi)有提供直接進(jìn)入游戲狀態(tài)的權(quán)限坑鱼,這也就限制了可以利用它的 AI 技術(shù)的數(shù)量。這個(gè)系統(tǒng)許多目標(biāo)現(xiàn)在都已經(jīng)在 Facebook 的 ELF 平臺(tái)實(shí)現(xiàn)了。

TIELT 架構(gòu)

2005

Wargus 中的增強(qiáng)學(xué)習(xí)

Wargus 迅速成為研究人員開發(fā) RTS AI 的環(huán)境鲁沥。2005 年呼股,研究人員開始探索強(qiáng)化學(xué)習(xí)技術(shù),這正是 AlphaGo 使用的策略之一画恰。最終由于研究人員無(wú)法對(duì)彼此的工作進(jìn)行對(duì)抗評(píng)估導(dǎo)致 Wargus 的工作停滯不前彭谁,他們太過(guò)依賴一小部分硬編碼腳本的性能。

2006

第一次 ORTS 競(jìng)賽

在 2005 年公布了第一次 ORTS AI 競(jìng)賽允扇,該活動(dòng)在舉辦于斯坦福的 AIIDE 2006 大會(huì)上舉行缠局。第一次比賽有 4 個(gè)參賽項(xiàng)目,比賽規(guī)模逐年增加考润,直到 2009 年結(jié)束狭园。

2007

IICup 啟動(dòng)

International Cyber Cup 是星際爭(zhēng)霸的第三方服務(wù)器平臺(tái)。這個(gè)服務(wù)器對(duì) AI 研究非常重要糊治,因?yàn)槟憧梢栽谶@個(gè)服務(wù)器上運(yùn)行機(jī)器人唱矛,不過(guò)它不是暴雪官方服務(wù)器。這個(gè)服務(wù)器的另一個(gè)優(yōu)點(diǎn)是為玩家提供了一個(gè)字母評(píng)分俊戳,玩家可以用來(lái)輕松地交流技術(shù)揖赴。例如,我在 2010 年認(rèn)真玩的時(shí)候最高拿到了 D+抑胎。

2008

第一次星際爭(zhēng)霸 AI 研究

我所知道的第一篇關(guān)于星際爭(zhēng)霸 AI 構(gòu)建的文章是在 2008 年發(fā)表的燥滑。Hsieh 和 Sun 通過(guò)挖掘數(shù)千的游戲錄制構(gòu)建了一個(gè)模型來(lái)預(yù)測(cè)玩家會(huì)生產(chǎn)什么建筑和單位。

星際爭(zhēng)霸建造指令預(yù)測(cè)

2009

母巢之戰(zhàn) API 發(fā)布

在 2009 年阿逃,我發(fā)現(xiàn)了一個(gè)叫做 BWAPI(母巢之戰(zhàn) API)的 Goole 代碼項(xiàng)目铭拧,它提供了星際爭(zhēng)霸的編程接口。該庫(kù)使用了一個(gè)第三方 DDL 工具將 API 注入到星際爭(zhēng)霸的運(yùn)行環(huán)境并提供一系列調(diào)用游戲內(nèi)部函數(shù)的掛鉤恃锉。自此之后搀菩,該項(xiàng)目的貢獻(xiàn)者規(guī)模不斷增長(zhǎng)并且被移植到了多種語(yǔ)言。它現(xiàn)在托管在 GitHub 上并且有一個(gè) Java 版本破托。

2010

星際爭(zhēng)霸 2 發(fā)布

在 2010 年肪跋,星際爭(zhēng)霸 2 自由之翼發(fā)布,母巢之戰(zhàn)的競(jìng)賽也繼續(xù)活躍了幾年土砂。2013 年又發(fā)布了蟲族之心資料片州既,2015 年發(fā)布了虛空之遺。

第一屆星際爭(zhēng)霸競(jìng)賽

第一屆星際爭(zhēng)霸 AI 競(jìng)賽在 AIIDE 2010 舉辦萝映。其主要賽事由伯克利 Overmind 團(tuán)隊(duì)獲勝吴叶。競(jìng)賽中還出現(xiàn)了人對(duì)抗機(jī)器的表演賽,人類選手輕易地?fù)魯×?AI 對(duì)手序臂。

伯克利 Overmind 團(tuán)隊(duì)


2011

第二屆 AIIDE 星際爭(zhēng)霸競(jìng)賽

艾伯塔大學(xué)的 Dave Churchill 主辦了第二屆以及后續(xù)的 AIIDE 星際爭(zhēng)霸競(jìng)賽蚌卤。他編寫了一個(gè)錦標(biāo)賽框架,可以自動(dòng)運(yùn)行錦標(biāo)賽,并修改了一些規(guī)則以促進(jìn)合作逊彭,比如要求必須開源提交咸灿。

學(xué)生星際爭(zhēng)霸 AI 錦標(biāo)賽

第二屆星際爭(zhēng)霸錦標(biāo)賽開始后,學(xué)生的提交成為重點(diǎn)诫龙。錦標(biāo)賽不再與每年的大會(huì)聯(lián)系在一起析显,而是每年舉辦好幾次鲫咽。

https://sscaitournament.com/


2013

星際爭(zhēng)霸母巢之戰(zhàn)機(jī)器人天梯

Krasi0 為星際機(jī)器人開發(fā)了一個(gè)全天候運(yùn)行的天梯系統(tǒng)签赃。這為研究人員提供了一個(gè)評(píng)估不同 AI 方法的環(huán)境。

2014

星際爭(zhēng)霸 2 自動(dòng)化玩家

Matt Webcorner 演示了一個(gè)星際爭(zhēng)霸 2 機(jī)器人分尸,它可以通過(guò)攔截 DirectX 命令來(lái)推斷游戲狀態(tài)锦聊。這種方法的主要限制之一是該機(jī)器人只能訪問(wèn)當(dāng)前顯示在屏幕上的游戲狀態(tài)。

2016

AlphGo 擊敗李世石

2016 年 3 月箩绍,DeepMind 的 AlphaGo 系統(tǒng)擊敗了圍棋世界冠軍李世石孔庭。這次勝利之后,許多人認(rèn)為星際爭(zhēng)霸將是 DeepMind 的下一個(gè)挑戰(zhàn)目標(biāo)材蛛。

Facebook 加入

2016 年 Facebook 的 AI 研究人員開始使用星際爭(zhēng)霸作為強(qiáng)化學(xué)習(xí)測(cè)試平臺(tái)圆到。他們發(fā)表了一篇關(guān)于星際爭(zhēng)霸中的微觀管理的文章。他們的機(jī)器人參加了 AIIDE2017 競(jìng)賽卑吭,但是它的學(xué)習(xí)模式表現(xiàn)不如重點(diǎn)關(guān)注腳本的機(jī)器人芽淡。

暴雪嘉年華公告

在 2016 暴雪嘉年華,DeepMind 宣布他們正與暴雪合作開發(fā)一個(gè) AI 的開放平臺(tái)《股停現(xiàn)在 Google 與 Facebook 競(jìng)相開發(fā)專業(yè)級(jí)星際爭(zhēng)霸游戲的機(jī)器人挣菲,競(jìng)爭(zhēng)也變得日趨激烈。

2017

星際爭(zhēng)霸 2 API 發(fā)布

暴雪在 8 月 9 日發(fā)布了用于編寫機(jī)器人的星際爭(zhēng)霸 2API掷邦,同時(shí)揭曉了一個(gè)編寫機(jī)器人的工作室白胀。

查看原文

https://towardsdatascience.com/a-history-of-rts-ai-research-72339bcaa3ee

參考資料

[1]:

https://hal.archives-ouvertes.fr/hal-00871001/document

[2]:https://www.cs.auckland.ac.nz/research/gameai/publications/Robertson_Watson_AIMag14.pdf

-全文完-

人工智能已不再停留在大家的想象之中,各路大牛也都紛紛抓住這波風(fēng)口抚岗,投入AI創(chuàng)業(yè)大潮或杠。那么,2017年宣蔚,到底都有哪些AI落地案例呢向抢?機(jī)器學(xué)習(xí)、深度學(xué)習(xí)件已、NLP笋额、圖像識(shí)別等技術(shù)又該如何用來(lái)解決業(yè)務(wù)問(wèn)題?

2018年1月11-14日篷扩,AICon全球人工智能技術(shù)大會(huì)上兄猩,一些大牛將首次分享AI在金融、電商、教育枢冤、外賣鸠姨、搜索推薦、人臉識(shí)別淹真、自動(dòng)駕駛讶迁、語(yǔ)音交互等領(lǐng)域的最新落地案例,應(yīng)該能學(xué)到不少東西核蘸。目前大會(huì)8折報(bào)名倒計(jì)時(shí)巍糯,更多精彩可點(diǎn)擊閱讀原文詳細(xì)了解。

http://t.cn/Rl2MftP

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末客扎,一起剝皮案震驚了整個(gè)濱河市祟峦,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌徙鱼,老刑警劉巖宅楞,帶你破解...
    沈念sama閱讀 219,110評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異袱吆,居然都是意外死亡厌衙,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,443評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門绞绒,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)婶希,“玉大人,你說(shuō)我怎么就攤上這事处铛∷乔鳎” “怎么了?”我有些...
    開封第一講書人閱讀 165,474評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵撤蟆,是天一觀的道長(zhǎng)奕塑。 經(jīng)常有香客問(wèn)我,道長(zhǎng)家肯,這世上最難降的妖魔是什么龄砰? 我笑而不...
    開封第一講書人閱讀 58,881評(píng)論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮讨衣,結(jié)果婚禮上换棚,老公的妹妹穿的比我還像新娘。我一直安慰自己反镇,他們只是感情好固蚤,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,902評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著歹茶,像睡著了一般夕玩。 火紅的嫁衣襯著肌膚如雪你弦。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,698評(píng)論 1 305
  • 那天燎孟,我揣著相機(jī)與錄音禽作,去河邊找鬼。 笑死揩页,一個(gè)胖子當(dāng)著我的面吹牛旷偿,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播爆侣,決...
    沈念sama閱讀 40,418評(píng)論 3 419
  • 文/蒼蘭香墨 我猛地睜開眼萍程,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了累提?” 一聲冷哼從身側(cè)響起尘喝,我...
    開封第一講書人閱讀 39,332評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎斋陪,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體置吓,經(jīng)...
    沈念sama閱讀 45,796評(píng)論 1 316
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡无虚,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,968評(píng)論 3 337
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了衍锚。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片友题。...
    茶點(diǎn)故事閱讀 40,110評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖戴质,靈堂內(nèi)的尸體忽然破棺而出度宦,到底是詐尸還是另有隱情,我是刑警寧澤告匠,帶...
    沈念sama閱讀 35,792評(píng)論 5 346
  • 正文 年R本政府宣布戈抄,位于F島的核電站,受9級(jí)特大地震影響后专,放射性物質(zhì)發(fā)生泄漏划鸽。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,455評(píng)論 3 331
  • 文/蒙蒙 一戚哎、第九天 我趴在偏房一處隱蔽的房頂上張望裸诽。 院中可真熱鬧,春花似錦型凳、人聲如沸丈冬。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,003評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)埂蕊。三九已至实夹,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間粒梦,已是汗流浹背亮航。 一陣腳步聲響...
    開封第一講書人閱讀 33,130評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留匀们,地道東北人缴淋。 一個(gè)月前我還...
    沈念sama閱讀 48,348評(píng)論 3 373
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像泄朴,于是被迫代替她去往敵國(guó)和親重抖。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,047評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • 學(xué)院:研究生院 學(xué)號(hào):1600030060 姓名:楊世聰 【嵌牛導(dǎo)讀】:新浪科技訊 4月19日上午消息祖灰,百度今日宣...
    楊世聰閱讀 335評(píng)論 0 1
  • ——如果你相信一夜暴富的神話局扶,10天減10斤的黃瓜雞蛋法恨统,一天改變命運(yùn)的方法,你還不如等著天上掉毛爺爺來(lái)的實(shí)際三妈⌒舐瘢—...
    依米拾光閱讀 563評(píng)論 5 1
  • N年前退伍以后軍人情結(jié)爆表的我爸一直希望我考到軍隊(duì)做軍官...然后我終于表了態(tài)...表示我對(duì)此毫無(wú)興趣~ “以前你...
    尼克威芃閱讀 296評(píng)論 0 0
  • 文/冬至 戀戀不忘 “我們無(wú)法忘記一個(gè)人,往往不是因?yàn)閷?duì)方有多難忘畴蒲,而是因?yàn)槲覀冇卸嘁缿俸蛨?zhí)著悠鞍。當(dāng)你執(zhí)著的時(shí)候,連...
    你好哇冬至閱讀 2,697評(píng)論 1 1
  • 今天周末模燥,按原計(jì)劃是戶外徒步咖祭,這次浩各選的是國(guó)家登山健身步道江油鷹嘴巖木棧道。 按計(jì)劃早七點(diǎn)半出發(fā)蔫骂,我卻賴在床上起...
    蘿卜英閱讀 424評(píng)論 5 2