1997年深蓝超级计算机第一次在国际象棋比赛中击败人类,已经是24年前的往事。而这24年间,AI技术早已突飞猛进。
时至今日,各国对AI的竞争早已由硬件竞争转入对人才培养的竞争。而培养AI人才最好的方式无疑是让他们来一场真刀真枪的算法对决。
9月1日,由腾讯AI Lab、王者荣耀、腾讯高校合作、腾讯游戏学院等共同发起的“第二届腾讯‘开悟’多智能体强化学习大赛”便是基于这一理念而筹办的比赛。
高校学霸逐鹿AI“王者”
这场比赛基于“开悟”AI开放研究平台举办。平台依托腾讯太极机器学习平台,拥有算法、算力、脱敏数据等资源优势,以腾讯云计算提供底层资源支持,以《王者荣耀》作为竞技舞台,为学术研究人员和算法开发者开放国际一流的研究与应用探索平台。
参赛队伍需要在指定的时间内,在给定的资源下训练出最优模型,并最终部署好使用最优模型的AI服务器,提交平台完成对局挑战。
本届比赛本着更开放、更轻量、更易用的原则。在首届比赛成功举办的基础上,继续采用邀请赛制,进一步扩大了参赛队伍的邀请范围。不但有北大、清华、中科大等国内顶尖高校队伍参加,还邀请到数支海外高校队伍参与,参赛队伍扩到20+。
从9月1日起,这些顶尖高校的学霸们将通过积分赛的形式争夺10个出线名额,在11月进入复赛阶段,而后进入决赛圈的4支队伍将于次年角逐总冠军。赛事方通过循序渐进的赛程设置,意在凸显各参赛队伍的技术成长与创新实践。队伍之间也可以通过直观的游戏对局结果甄别各自在算法效率上的优劣,通过比赛验证学习与教研成果。
本次比赛所依托的“开悟”AI开放研究平台也大有来头。据王者荣耀执行制作人、腾讯天美L1总经理黄蓝枭介绍:“我们将自己在做多智能体研究的过程中所沉淀的技术资产开放出来,建设了‘开悟’开放平台,打造利用‘王者’的核心技术构建的,对使用者低成本的多智能体人工智能算法研究、教学和验证的科研教学平台。我们开放了《王者荣耀》的核心机制,提供标准接口、脱敏的测试数据、评估工具和计算集群等,给老师和同学们进行多智能体的机器学习算法研究、学习成果交流、对算法成果反复迭代升级。”
腾讯AI Lab总经理杨巍也指出:“开悟平台承载了技术、资源、人才等生态原料,始于又不止于竞赛。开悟将逐步发展为竞赛-课程-科教联盟-科创联合体的生态聚集地,未来会进一步延展平台承载力,推进AI与教育融合,提高学生的创造力与研究才能,为生态贡献跨学科技术、跨界人才和多方资源。”
为什么是《王者荣耀》?
随着AI技术的发展,传统的棋牌游戏已经无法满足AI训练的需要。玩法机制更为复杂的电子游戏成为AI训练的新宠。王者荣耀之所以能够从众多电子游戏中脱颖而出成为本届大赛的指定游戏,原因有二:对局环境优势以及研究平台的开放性优势。
首先,《王者荣耀》由于多人竞技的游戏特色,对局环境非常复杂,这对于AI训练是绝佳的舞台。
在5V5团队竞技游戏中,复数的AI并非共享“大脑”,而是互相独立的个体,AI们不但要考虑如何理解敌人的行为逻辑,还必须要明白队友的行为逻辑。同时此类游戏还拥有庞大的英雄阵容与不同的英雄定位,AI之间的博弈从选择阵容时便已经开始。
据统计,在王者荣耀单局比赛中,玩家的动作状态空间可以达到惊人的10的20000次方,甚至超过全宇宙原子数量的总和10的80次方。如此巨大的复杂度对AI的学习能力与适应能力,尤其是对AI之间的协同提出了更高的要求。这也是“多智能体强化学习大赛”中“多智能体”的应有之意。
《王者荣耀》的另外一个优势,就是其依托于“开悟”平台的开放性优势。
王者荣耀团队与腾讯AI Lab的合作由来已久。早在2019年,双方便合作推出多智能体产品“绝悟”。据黄蓝枭介绍:“‘绝悟’在2020年公开用户测试过程中体现出高超的战略决策能力和战术执行能力,体现出了不输于、甚至超越顶级人类玩家的复杂场景决策能力。这再一次证明了《王者荣耀》对技术研究和模拟是非常适合的。”
此后,王者荣耀团队与腾讯AI Lab决定将AI研究成果开放出来,共同搭建“开悟”AI开放研究平台。这种开放性给高校团队在算法研究方面提供了绝佳的实操机会,解决了高校在算法研究过程中缺乏真实数据与硬件基础的痛点。这也是众多高校与本届大赛一拍即合的原因。
“开悟”平台的野望
腾讯对AI研究的重视由来已久。早在2016年腾讯AI Lab技术团队便已经深入AI领域,研发的围棋AI“绝艺”现已成为中国国家围棋队训练专用AI;2017年与王者荣耀团队合作开始研发的“绝悟”AI则是一路迭代,在2019年达到《王者荣耀》职业水平,在2020年不但多次入驻游戏接受玩家组队挑战,还于2021年参展世界人工智能大会奉献精彩的表现赛。其相关算法研究也收录于顶级学术期刊,可谓成果斐然。
2019年腾讯AI Lab宣布与王者荣耀共同建设“开悟”AI研究平台,利用游戏的拟真环境与复杂机制为学术研究人员和算法开发者提供独一无二的研究与应用探索平台。一年之后,首届“‘开悟’AI+游戏高校大赛”便在“开悟”平台的支持下召开。
在今年的第二届大赛上,“开悟”平台秉持更开放、更轻量、更易用的理念,不但将参赛团队扩展到20支以上,也将合作模式延伸到比赛之外。“开悟”平台不但给高校团队建立安全易用的开发环境,也致力寻找与高校教学研究的长期合作机会。
“开悟”平台的野望不仅仅停留在让AI算法学会“打游戏”之上,更在于打通教育、研究与产业落地之间的通路,让AI通过在游戏中学习去解决现实中的问题,为医疗、工业、农业、交通等现实场景中的AI落地提供助力。同时“开悟”平台也希望能够和高校与科研团队建立长期合作,将现实问题“请”到游戏之中,通过低成本的游戏环境去模拟和解决现实问题。
“未来,我们希望王者荣耀开悟AI开放平台,可以通过持续的迭代建设,为中国自主知识产权的人工智能底层技术研究、人工智能应用场景拓展等贡献绵薄之力。”腾讯天美L1总经理黄蓝枭对“开悟”平台如是期许。
届时,游戏便不再只是游戏,而能够变成腾讯所畅想的虚拟真实世界——超级数字场景的一环。