感谢阅读腾讯 AI Lab 微信号第 151 篇文章。本文将介绍第三届腾讯“开悟”大赛启动情况。
8月18日,腾讯宣布
第三届「腾讯开悟多智能体强化学习大赛」
(下称「大赛」)正式启动。本届大赛由王者荣耀、腾讯 AI Lab、腾讯新文创总部、腾讯云计算中心、腾讯高校合作、腾讯游戏学堂等共同发起,旨在促进产学研合作,推动人工智能研究的发展。
「开悟」是腾讯自主研发的 AI 开放研究平台。
开悟具有首个高挑战MOBA模拟环境、自研AI框架及算法、高性能计算平台等,正逐步成为产学研结合的AI科研通用工具。同时,开悟平台依托于腾讯太极机器学习平台,可以实现更高效的资源调度,为使用者提供全栈打通的科研验证环境和辅助管理服务。
「开悟大赛」基于开悟平台而运行,为研究者开放
王者荣耀游戏核心集群(Gamecore)及研究资源
,并提供
计算平台、评估工具以及其他研究支持服务
,让参赛者得以测试并提升 AI 在 MOBA 游戏对战场景下的应用水平。
为了更好地支持开悟大赛,基于遨驰分布式云操作系统的新一代全球领先的异构加速引擎技术,腾讯云遨驰异构计算平台也为本届AI大赛提供了必不可少的资源及技术支持。
今年赛事延续往届邀请赛制,将参赛队伍数量扩大到 37 支,参赛队伍需要在指定的时间内,在给定的资源下训练出最优模型,并在王者荣耀 1v1、3v3 游戏测试环境中完成对局挑战。
此外,为进一步帮助更多研究者与爱好者降低研究门槛,开悟平台将于今年下半年启动分赛道「开悟成渝高校公开赛」的公开招募,成渝地区的高校学生均可报名,参与万元奖金角逐。
第二届开悟大赛决赛对局
大赛鼓励参赛团队对
解决方案、模型结构设计、强化学习算法设计和训练方式
持续探索,本届赛事还致力于推动研究智能体研究领域的热门课题
「模型泛化性」
——即模型在从未见过的数据面前,仍然保持一定适用性的能力。
以一个「识别猫图像」模型为例,如果其训练数据仅有狸花猫的图片,它很可能在「识别狸花猫图像」任务上取得很好的结果,但却无法识别其他品种的猫。提高模型的泛化性,有助于以更低的成本,训练出能够应对更复杂问题的智能体,例如智能体可以使用之前从未见过的工具完成任务。
当前业界主要关注在单智能体在相近任务上的表现,主要分为两个方向:1) 在不同但相似的任务中迁移;2) 在相同任务不同智能体之间迁移。如 Meta World 和 RLBench 提出在模拟环境中控制机械手臂完成多个不同的动作任务,例如开窗通风、开门、取球等。
本届开悟大赛将模型泛化性问题融入到赛题中,能提升参赛团队在强化学习基础学术水平,同时激励他们的创新性思维碰撞,寻找提升模型泛化性的全新思路。
2019年至今,「开悟」AI 开放研究平台取得了多项成果:已成功主办两届「开悟多智能体强化学习大赛」、承办了成都大运会「世界大学生数智竞技邀请赛」AI赛道,并与国内多所顶级高校老师团队打造了创新课程合作项目等。
腾讯承办成都大运会数智竞技邀请赛
在赛事之外,「开悟」AI 开放研究平台也在沉淀高校合作成果:北京大学、电子科技大学、清华大学、中国科学技术大学等 4 所高校教师团队,基于开悟平台打造的多智能体及强化学习创新专业课程已正式开课。系列课程有助于帮助学生通过更有趣的方式掌握机器学习、强化学习、多智能体决策等关键知识点。截至今年,已有 19 所高校参与到了这个计划中。
据悉,中国科学科技大学参赛团队基于「开悟」赛事期间成果所产出的四篇游戏 AI 和强化学习相关论文,今年先后被 IEEE 学术会议及期刊收录。
腾讯人工智能科教联盟
基于「开悟」平台,腾讯 AI Lab 和王者荣耀将与学界、业界携手,共同利用游戏环境不断提升AI能力,并寻找 AI 技术解决更多问题的可能性,在机器人、医疗、工业、交通等领域发挥更大作用。
* 欢迎转载,请注明来自腾讯AI Lab微信(tencent_ailab)