基于大模型的人形机器人仿真挑战赛
目录
形式:人形机器人多智能体与单智能体仿真赛(线上与线下规则一致)
赛道负责单位及硬件:燕山大学
基于大模型的人形仿真挑战赛
1.规则概述
1.1 竞赛内容
人形机器人(Humanoid Robot)作为具身智能(Embodied Intelligence)的重要载体,正在推动人工智能从虚拟算法走向物理世界的交互,本赛项正是聚焦于人形机器人这一领域,希望通过球类比赛的形式,搭建起一个开放的竞技平台,共同推动具身智能发展。比赛要求参赛团队使用九格4B大模型并通过算法控制仿真环境下的机器人完成点球比赛。本次比赛的旨在激发参赛团队在算法优化、模型训练等方面的创新思维,推动具身智能理论和技术的突破,为未来的人型机器人技术发展培养更多优秀的人才。
2.比赛环境及队伍要求
2.1 比赛环境
比赛利用Google Football虚拟环境,比赛使用仿真环境按照真实足球场尺寸进行等比例调整,并配有环境俯视图以便进行观察(图中黄衣球队和蓝衣球队在俯视图中分别以白色和黑色表示)。该环境实现了标准规则下的完整足球比赛,这些规则包括门球、边球、角球、黄牌和红牌、越位、手球和点球。比赛的长度以帧数衡量,一场完整的比赛的默认时间是3000(每秒10帧,持续5分钟)。
环境状态包括球信息(坐标、速度、方向等)、队伍信息(球员位置、球员速度、球员疲劳、球员是否有黄牌/红牌等)、控制信息(控制球员信息、带球球员信息、可执行动作信息等)、比赛信息(得分、剩余步数、比赛状态等)。环境动作分为等待动作、移动动作、传球/射门动作,其他动作等。参赛队伍需要使用九格大模型对环境状态进行分析,并为每位球员提供当前状态的最优动作策略,以确保球队在进攻和防守情况下都能高效决策,有效得分。环境状态和环境动作的具体环境的使用方法可见Google Football的官网。
2.2 队伍要求
由两个球员(队员,守门员)之间进行的1对1对抗赛,参赛队员必须使用九格大模型控制队员进行点球射门,守门员使用环境中固定的配置,同时参赛队伍可自行设计控制算法进一步优化九格大模型的控制。
3.参赛要求
3.1 参赛技术要求
本次比赛参赛选手需要独立进行编码工作,并生成可在官方平台加载运行的策略程序(.py文件)。在本项目中,一方使用一个球员。一方使用一个守门员进行比赛,全场比赛一共进行五轮。
本次比赛全程在官方比赛平台Google Football机器人仿真软件上进行。比赛选手需要使用九格大模型提交球员控制策略,并与谷歌足球提供的守门员进行对决。
策略提交。参赛选手需在规定时间内在比赛平台提交规定格式的策略文件,提交后系统会对策略文件进行格式、接口、重复度三项检测,三项检测全部通过即代表提交成功,策略提交成功方可进行自动比赛与排位。
策略查重。主办方会对队伍提交的策略文件进行相似度审核,若文件出现以下情况:1.策略与互联网上的开源策略相似度过高;2.策略与官方提供的样例策略相似度过高;3.不同参赛选手的策略互相之间相似度过高(一般策略相似度≥80%视为策略重复)。若出现策略重复,由赛项负责人公布处理办法。
策略故障。若比赛中有一方队伍策略出现加载失败、报错、异常等情况,先出现故障的一方判负,比分显示为"异常"。
比赛全程自动进行,每场比赛结束均可下载比赛回放数据(策略故障则无比赛数据)。
3.2 设备要求
1)必须使用Google Football仿真环境。
2)严禁更换九格大模型,仅允许优化语义理解、目标识别(也可更换九格多模态大模型)及路径规划算法(主办方提供基础demo及培训),除允许的更换、优化内容,其他内容禁止更换。
4.比赛过程
4.1 赛程赛制
比赛进行七轮,排名根据具体的进球数决定。在进球数相同情况下根据进球时间的快慢决定。
(1)点球比赛进行七轮,选手统计进球数量与进球时间;参赛队伍的排名由具体的进球数决定。在进球数相同情况下根据进球时间的快慢决定。
4.2 评分标准(共100分)
表4-1 人形机器人点球赛道计分表
轮次 | 是否进球 | 用时 | 备注 |
---|---|---|---|
1 | |||
2 | |||
3 | |||
4 | |||
5 | |||
6 | |||
7 |
(3)多智能体人形机器人足球赛
1.规则概述
1.1 竞赛内容
本赛项聚焦九格4B大模型与人形机器人的协同创新,本赛项要求参赛队通过九格4B大模型驱动人形机器人代理完成多智能体足球赛。比赛重点考核对于九格大模型的理解与应用,以及对强化学习、多智能体协同、决策博弈等人工智能理论的认识与掌握情况,实现对人形机器人代理的精准控制。
2.比赛场地要求
2.1 场地要求
比赛利用Google Football虚拟环境,该仿真环境按照真实足球场尺寸进行等比例调整,并配有环境俯视图以便进行观察(图中黄衣球队和蓝衣球队在俯视图中分别以白色和黑色表示)。该环境实现了标准规则下的完整足球比赛,这些规则包括门球、边球、角球、黄牌和红牌、越位、手球和点球。比赛的长度以帧数衡量,一场完整的比赛的默认时间是3000(每秒10帧,持续5分钟)。
环境状态包括球信息(坐标、速度、方向等)、队伍信息(球员位置、球员速度、球员疲劳、球员是否有黄牌/红牌等)、控制信息(控制球员信息、带球球员信息、可执行动作信息等)、比赛信息(得分、剩余步数、比赛状态等)。环境动作分为等待动作、移动动作、传球/射门动作,其他动作等。
图4-2 人形机器人足球赛环境图
任务序号 大模型任务
任务1 选定控制球员
任务2 大模型+策略优化算法计算球员最佳动作
任务3 做出动作环境变化,大模型重新观测
任务4 大模型重新选定球员并重复上述决策
任务5 进球计算得分
3.参赛要求
3.1 参赛人数
每队≤5人,指导教师≤2人。
3.2 设备规范
1)主办方提供宇树人形机器人及仿真环境,选手无需自备硬件。
2)严禁更换九格大模型,仅允许优化策略动作选择算法、语义理解、目标识别(也可更换九格多模态大模型)及路径规划算法(主办方提供基础demo及培训),除允许的更换、优化内容,其他内容禁止更换。
3.3 机器人技术要求
(1)机器人数量
足球人形机器人将在仿真环境中自动生成,共计11台,选手无须自备。
(2)安全性
由于本比赛项目完全在线上进行,故参赛队伍使用机器人的安全性有绝对保证。
(3)独立性
比赛队伍应保证自己所用机器人策略技术为独立完成,不得出现重复抄袭借用现象。
(4)特别说明
比赛开始前至少一小时,裁判组将对各参赛队的策略算法及大模型优化策略进行查重,若赛前检查未通过,将不允许继续进行比赛。
4.比赛过程
4.1 赛程赛制
(1)根据参赛队伍的数量,决定比赛的轮次。在时间允许的前提下,可进行两轮比赛(如果时间不允许,则比赛为一轮)。
(2)每位选手提交策略后,首先与主办方AI进行对决,根据对决结果确定其初始排名。若在对决中胜出,则根据得分情况和已有排名情况,插入到相应位置;若在对决中失败,则置于最后一名。若该选手已有名次,则再次提交策略后,将重新与主办方AI对决,并根据已取得的最好结果调整排名。比赛全程由官方比赛平台进行自动判罚与排位。
(3)此外参赛队伍应准备好技术讲解PPT来对自己的策略技术进行讲解。此外参赛队伍需要将源代码,PPT等资源上传,上传格式为项目名称团队名称EAICON2025。
4.2 比赛任务
比赛环境是由两个球队(每个球队由11个机器人构成)之间进行的11对11对抗赛,每个球队由1名守门员、3-5名后卫、2-3名中场球员以及3-5名前锋组成,具体的阵容配置可能会根据球队的比赛策略、球员能力和教练战术而有所不同。其中,参赛队伍使用九格大模型并结合多智能体策略算法作为足球教练训练团队策略。
本次比赛参赛选手需要独立进行编码工作,并生成可在官方平台加载运行的策略程序(.py文件)。在本项目中,双方各有十一个机器人作为球员,全场比赛一共3000步。比赛开始后,双方需要通过后卫、中场和前锋等不同球员间的配合将球射入对手球门,并在防守过程中守住己方球门。期间,电子裁判会根据规则对球员的行为进行判罚,若违规则进行相应惩罚。
注意参赛选手需在规定时间内在比赛平台提交规定格式的策略文件,提交后系统会对策略文件进行格式、接口、重复度三项检测,三项检测全部通过即代表提交成功,策略提交成功方可进行自动比赛与排位。
表4-2 人形机器人多智能体足球赛道流程
注:(1)九格大模型语义解析为必选项,未使用者直接判0分(2)若比赛中有一方队伍策略出现加载失败、报错、异常等情况,先出现故障的一方判负,比分显示为"异常"。
4.3 评分标准(共100分)
比赛在11_VS_11标准足球赛进行,一场比赛时长为5分钟,最终得分按照现实足球比赛规则,球队将球踢入对方球门得1分,比赛时间结束后,得分高者胜利。
最终比赛形式为线上比赛,最终得分足球赛成绩70分,技术汇报30分加权计算总成绩。比赛最终需上传源代码,若未提供源码不得分,任务实现与源码呈现不同该任务不得分。
4.4 违规处理
1)技术违规:擅自修改禁止项(如更换大模型),直接取消成绩。
2)操作违规:未及时报告设备故障或干扰他队,扣10分/次。
3)重复率过高:若是最终提高策略重复率超过80%,直接取消比赛成绩。
轮次是否进球用时备注1234567任务序号大模型任务任务1选定控制球员任务2大模型+策略优化算法计算球员最佳动作任务3做出动作环境变化,大模型重新观测任务4大模型重新选定球员并重复上述决策任务5进球计算得分