他們推出了一項(xiàng)面向公眾的新工具
? ? ? ?谷歌链峭,在嘗試用擁有DeepMindAI的機(jī)器人Go吊打人類玩家之后,又在去年秋季把他的計(jì)算機(jī)智能裝到了暴雪的視頻游戲星際爭(zhēng)霸II上。這看上去更像是一種炫技:如今,在訓(xùn)練AI玩星際戰(zhàn)略游戲上浪谴,谷歌開發(fā)出了一整套的研究體系,并向公眾開放因苹。每個(gè)人都能通過DeepMind的新工具集(SC2LE)來對(duì)AI做出改進(jìn)以減輕他們的研究工作苟耻。
? ? ? ?這個(gè)工具包囊括了GitHub上的許多開發(fā)包:首先就是暴雪的機(jī)器學(xué)習(xí)API,其最初是一個(gè)Linux工具扶檐,最后發(fā)展成了名為PySC2的DeepMind工具集凶杖。暴雪還提供了一些額外的好玩意,像一系列匿名的1V1游戲?qū)?zhàn)回放供程序員分析款筑,還有一些示例代碼與演示機(jī)器人智蝠。DeepMind同樣提供了一份參考白皮書。
? ? ? ?為什么是星際爭(zhēng)霸II奈梳?DeepMind公布了原因杈湾,在你按序思考需要作出多少種選擇時(shí),任何時(shí)刻都會(huì)有上百萬種可能采取的策略攘须。這就給你的AI訓(xùn)練提供了大量的可能性:
“星際爭(zhēng)霸的行動(dòng)池展現(xiàn)了一個(gè)挑戰(zhàn)漆撞,甚至能做出的基本行動(dòng)種類就超過了300種。跟一些Atari游戲相比于宙,那些游戲只有大概十種操作(比如說上下左右等等)浮驳。基于此捞魁,星際爭(zhēng)霸中的行動(dòng)是分層的至会,它能夠自定義,能夠強(qiáng)化谱俭,很多行動(dòng)都需要在屏幕上進(jìn)行點(diǎn)擊奉件。就算以一塊84x84的小屏幕來說宵蛀,也大概會(huì)有100萬種可能采取的行動(dòng)∑柯欤”