第三届腾讯「开悟」大赛启动，利用游戏复杂环境提升AI研究能力

感谢阅读腾讯 AI Lab 微信号第 151 篇文章。本文将介绍第三届腾讯“开悟”大赛启动情况。

8月18日，腾讯宣布

第三届「腾讯开悟多智能体强化学习大赛」

（下称「大赛」）正式启动。本届大赛由王者荣耀、腾讯 AI Lab、腾讯新文创总部、腾讯云计算中心、腾讯高校合作、腾讯游戏学堂等共同发起，旨在促进产学研合作，推动人工智能研究的发展。

「开悟」是腾讯自主研发的 AI 开放研究平台。

开悟具有首个高挑战MOBA模拟环境、自研AI框架及算法、高性能计算平台等，正逐步成为产学研结合的AI科研通用工具。同时，开悟平台依托于腾讯太极机器学习平台，可以实现更高效的资源调度，为使用者提供全栈打通的科研验证环境和辅助管理服务。

「开悟大赛」基于开悟平台而运行，为研究者开放

王者荣耀游戏核心集群（Gamecore）及研究资源

，并提供

计算平台、评估工具以及其他研究支持服务

，让参赛者得以测试并提升 AI 在 MOBA 游戏对战场景下的应用水平。

为了更好地支持开悟大赛，基于遨驰分布式云操作系统的新一代全球领先的异构加速引擎技术，腾讯云遨驰异构计算平台也为本届AI大赛提供了必不可少的资源及技术支持。

今年赛事延续往届邀请赛制，将参赛队伍数量扩大到 37 支，参赛队伍需要在指定的时间内，在给定的资源下训练出最优模型，并在王者荣耀 1v1、3v3 游戏测试环境中完成对局挑战。

此外，为进一步帮助更多研究者与爱好者降低研究门槛，开悟平台将于今年下半年启动分赛道「开悟成渝高校公开赛」的公开招募，成渝地区的高校学生均可报名，参与万元奖金角逐。

第二届开悟大赛决赛对局

大赛鼓励参赛团队对

解决方案、模型结构设计、强化学习算法设计和训练方式

持续探索，本届赛事还致力于推动研究智能体研究领域的热门课题

「模型泛化性」

——即模型在从未见过的数据面前，仍然保持一定适用性的能力。

以一个「识别猫图像」模型为例，如果其训练数据仅有狸花猫的图片，它很可能在「识别狸花猫图像」任务上取得很好的结果，但却无法识别其他品种的猫。提高模型的泛化性，有助于以更低的成本，训练出能够应对更复杂问题的智能体，例如智能体可以使用之前从未见过的工具完成任务。

当前业界主要关注在单智能体在相近任务上的表现，主要分为两个方向：1) 在不同但相似的任务中迁移；2) 在相同任务不同智能体之间迁移。如 Meta World 和 RLBench 提出在模拟环境中控制机械手臂完成多个不同的动作任务，例如开窗通风、开门、取球等。

本届开悟大赛将模型泛化性问题融入到赛题中，能提升参赛团队在强化学习基础学术水平，同时激励他们的创新性思维碰撞，寻找提升模型泛化性的全新思路。

2019年至今，「开悟」AI 开放研究平台取得了多项成果：已成功主办两届「开悟多智能体强化学习大赛」、承办了成都大运会「世界大学生数智竞技邀请赛」AI赛道，并与国内多所顶级高校老师团队打造了创新课程合作项目等。

腾讯承办成都大运会数智竞技邀请赛

在赛事之外，「开悟」AI 开放研究平台也在沉淀高校合作成果：北京大学、电子科技大学、清华大学、中国科学技术大学等 4 所高校教师团队，基于开悟平台打造的多智能体及强化学习创新专业课程已正式开课。系列课程有助于帮助学生通过更有趣的方式掌握机器学习、强化学习、多智能体决策等关键知识点。截至今年，已有 19 所高校参与到了这个计划中。

据悉，中国科学科技大学参赛团队基于「开悟」赛事期间成果所产出的四篇游戏 AI 和强化学习相关论文，今年先后被 IEEE 学术会议及期刊收录。

腾讯人工智能科教联盟

基于「开悟」平台，腾讯 AI Lab 和王者荣耀将与学界、业界携手，共同利用游戏环境不断提升AI能力，并寻找 AI 技术解决更多问题的可能性，在机器人、医疗、工业、交通等领域发挥更大作用。

* 欢迎转载，请注明来自腾讯AI Lab微信（tencent_ailab）

你可能也喜欢