《星际争霸2》决策智能技术首次公开展示


《星际争霸2》决策智能技术首次公开展示
【《星际争霸2》决策智能技术首次公开展示】《星际争霸2》前中国冠军、商汤科技智慧决策与游戏事业部技术研发负责人周航昨天现身斗鱼直播间 , 向公众揭开了目前已开源项目中实力最强的《星际争霸2》AI(人工智能)模型DI-star的神秘面纱 , 并首次公开展示了DI-star与人类顶尖职业玩家在游戏中的对决成果 。
在演示的多场对局中 , DI-star均表现出人类最高段位——宗师分段的竞技水平 , 与全球一线职业选手水平相当 , 为探索决策AI技术在游戏领域的应用提供了成功案例 。
人机对战的历史由来已久 , 从国际象棋到围棋 , 人工智能已具备超越人类顶尖选手的决策能力 。 如今 , 《星际争霸2》这款业界公认的具有超高游戏难度和公平竞技性的即时战略游戏 , 成为诸多AI争相挑战的“珠峰” 。
DI-star靠精细微操建立前期优势 。
《星际争霸2》的空间复杂度高达10的1685次方 , 远超围棋10的170次方复杂度 。 在庞大状态空间中进行复杂的策略博弈 , 使这款游戏成为检验AI决策能力的绝佳舞台 。
凭借原创技术研究 , 商汤在决策智能领域积累了深厚技术实力 。 本次直播中 , 周航通过多个对战演示片段 , 充分展现了DI-star灵活多变的决策能力 , 能屡次在复杂对局中快速找到最优策略 。
DI-star使用女王前压这样的人类不常见战术出奇制胜 。
据介绍 , DI-star融合了监督学习、强化学习等多项前沿技术 。 通过监督学习 , DI-star让AI反复观摩人类职业玩家对战的高质量录像 , 通过学习快速掌握资源采集、单位生产以及战斗过程中成百上千步的决策行为 。 在监督学习的基础上 , DI-star通过强化学习让AI以“自我博弈”方式进行大量对局 , 持续提升全局的决策能力 。
SenseCore商汤AI大装置为DI-star的模型建立、训练和验证提供了强大的算法和算力基础 , 让它用更短的时间能媲美甚至战胜人类专业高手 。 依托AI大装置 , DI-star仅用5周的时间 , 就完成了大约一亿局对战 , 最终达到了人类宗师分段的竞技水平 。
尽管AI已经在《星际争霸2》上取得了显著的成果 , 但是对于这款游戏的理解尚未超越人类 , 例如存在选用不同种族对战成绩差异较大的问题 , 在寻找游戏最优策略方面也有很大的提升空间 。 未来 , 商汤将依托AI大装置 , 持续深化决策AI技术的研发 , 不断提升多智能体在复杂环境中的相互竞争和协调合作能力 。
目前 , DI-star及其背后的决策智能平台OpenDILab已在GitHub开源 , 让有兴趣的AI研发人员和游戏玩家能深入其中 , 探索决策AI技术的开发与应用 , 一同构建决策AI创新生态 。
据悉 , 在技术创新与市场需求的双向促进下 , 游戏产业正在快速步入AI时代 。 基于此 , 商汤在2021年成立了智慧决策与游戏事业部 , 促进AI与游戏产业的融合创新与发展 。 商汤智慧决策与游戏事业部总经理兼高级研究总监刘宇表示:“随着游戏规模越来越庞大 , 游戏元素越来越多样化 , 游戏开发商需要质量和效率兼具的创作方式 。 决策智能技术的快速发展 , 让玩家对AI在更多类型游戏中的竞技水平抱有更高期待 。 ”商汤正在以全面的AI技术能力 , 围绕游戏研发、游戏运营、游戏玩法等多个层面 , 全面赋能游戏产业发展 。

推荐阅读