用AI打星际有多“硬核”?难点和挑战在哪?

《星际争霸ii》作为游戏玩家心目中即时战略游戏的经典之作,它的“即时”和“战略”特性,使其成为深度强化学习和博弈决策智能算法研究的重要平台。通过游戏研究agi技术,英国有deepmind,美国有openai,那么中国呢?
“二十年后,伴你遨游太空、探索星际的是人?还是ai?
或许是这位星际指挥官。”
《星际争霸ii》作为游戏玩家心目中即时战略游戏的经典之作,它的“即时”和“战略”特性,使其成为深度强化学习和博弈决策智能算法研究的重要平台。
包括deepmind在内的世界顶尖ai团队也在攻坚《星际争霸ii》。其背后拥有一个共同的终极目标——进一步拓展ai边界,并为最终达到通用人工智能(agi)探索道路。
ai打星际有多“硬核”?
星际是有史以来电子竞技领域最经典的游戏之一,也被认为是最有挑战的即时战略(rts)游戏。今天,之所以成为ai研究的主要平台和工具,是因为其蕴含了下述多方面的挑战,一旦取得技术突破,将拥有广泛的应用场景。
那么,用ai打星际有多“硬核”?难点和挑战在哪?
挑战一:层次化的体系博弈
星际实质上蕴含了一套层次化的博弈体系,它包括宏观经济实力的比拼、科技与兵种的相互克制、战役战术上的指挥对战、各编队单位的微观操控等。如何能让ai学会并进行上述多层次的决策,而不是在某一层级上进行学习,是个非常大的挑战。
挑战二:决策空间复杂度巨大
围棋的决策动作空间不超过361,而星际的决策动作空间是10的26次方,由决策时机、决策指令、决策主体、决策目标等多维度的决策因素组合而成。
挑战三:非完全信息动态博弈
对比围棋或者象棋等完全信息下的博弈,星际拥有“战争迷雾”机制,你无法在任意时刻得知对手完整的信息,必须通过主动侦察和对手建模来推测对手策略。相对于德扑的非完全信息博弈,星际又体现了动态性,上一时刻侦察所获取的信息,下一时刻又可能变化了。
挑战四:大规模多单位协作
星际的战斗部分需要指挥多兵种、上百个单位进行协作配合。相对来讲,《dota2》、《王者荣耀》游戏ai只需要5个单位进行协作配合。
挑战五:毫秒级实时决策
星际作为即时战略游戏,要和职业选手(平均每分钟300次操作)进行对抗,要求ai能够在一秒钟之内做出多次快速决策,这对ai算法模型的性能、工程实现的效率带来非常大的挑战。
中国的“星际之王”是谁?
通过游戏研究agi技术,英国有deepmind,美国有openai,中国呢?
启元世界希望是一个答案。
启元世界自2017年成立,便开始基于《星际争霸ii》研究决策智能、开发智能体,探索agi之路。
继2018年5月在北大acm总决赛期间发布基于星际的人机协作对抗赛、11月在加拿大aiide策略博弈研讨会展示自学习战术指挥官、12月获得neurips多智能体竞赛learning组冠军之后,2019年以来启元星际指挥官又实现了重要突破。
目前启元“星际指挥官”(简称“星指”),已能够在全场游戏(full game)中与业余高手过招较量,从宏观到微观博弈上展现出若干智能行为:如因地制宜地发展经济与科技、有条不紊地安排建造与布局、审时度势地进行侦察和攻击、指挥上百个单位进行协同作战等。
启元与星际指挥官成长历程
“星指”要挑战职业玩家,你敢不敢来?
实现高水平的《星际争霸ii》对弈,代表了ai在复杂电子游戏中取得的重大突破。但对于启元世界来说,星际ai的作用远不止于打打游戏如此简单,最终的目标是将其中研发的技术应用到现实世界,从博弈决策到网络调度,从数字娱乐到机器人控制,都不乏应用场景。
启元“星际指挥官”今年9月正式在北京亮相,开始挑战职业玩家!届时将举办一系列线下比赛和线上直播,现场抽取星际发烧友与星指面对面切磋,感受ai智能体的激情与魅力,感兴趣的朋友可以点击阅读原文报名哦~

电机跳闸跟电容有关系吗
光突发交换(Optical Burst Switching,
五种常见的通讯协议
Michael I. Jordan:要透过现象看本质
华为鸿蒙系统已满岁 你对鸿蒙系统了解有多深
用AI打星际有多“硬核”?难点和挑战在哪?
红外感应开关有什么用 浅析红外感应开关种类
酸价过氧化值检测仪产品说明简介
挡不住的西引力 | GSIE 2024专“蜀” 限定,从“蓉”突围!
无人机ESC及其高速无传感器FOC参考设计
M1 芯片: “苹果有史以来最强大的芯片”
HD300A电容电流测试仪电力系统中PT连接方式及PT变比测量方法
智能音箱大盘点:到底该买哪一款智能音箱好?
大数据可视化系统助力四川某5A级景区打造智慧旅游大数据中心
iPhone SE2即将发布,真机意外曝光?
惯性式传感器动作捕捉系统原理
关于电阻温度系数、测量和结构影响 这篇文章说透了!
电磁干扰屏蔽简易方法分享
ChromeBook操作系统销量首次超过Mac
哈工现代与51CLOUD合作打造出了工业机器人在线监测平台