懂能帝首页 懂能帝首页
|
首页能源头条推荐资讯详情

打破“外挂式”改良,大晓机器人Kairos开源模型登顶全球四项权威评测

2026-06-13 18:14
发布者:冬天的蝉
来源:冬天的蝉
标签:大晓机器人Kairos开源模型具身智能
0
0
0
分享

在全球针对世界模型视频生成和状态预测的最新具身智能评测中,大晓机器人(ACE ROBOTICS)自主研发的开源“开悟世界模型”(Kairos)迎来重大技术突破。该模型在 RoboTwin 2.0、LIBERO-Plus、WorldModelBench Robot 以及 DreamGen 四大国际权威基准测试中均斩获全球第一。

评测数据显示,Kairos 的性能指标全面超越了 Cosmos3、PI、MotuBrain、being-H0.7、Abot、Fast-WAM 和 Wan2.2 等全球主流世界模型,在具身视频生成、任务指令追随、泛化能力及复杂环境鲁棒性等维度实现全方位领先。

一、创新一体化架构与全链路闭环落地

为了克服行业普遍基于视频生成模型做后训练所导致的物理缺失、因果匮乏与推理延迟等痛点,大晓机器人于 2025 年 12 月推出了创新的原生统一世界模型架构,即“多模态理解—生成—预测”一体化架构。研发团队摒弃了传统的外挂式改良路线,坚持自主设计网络架构与预训练范式,深度融合了理解、生成与预测三大核心能力。模型通过自研的混合线性注意力算子和全局状态共享机制实现了全链路的高效协同,这一技术路线也与英伟达最新发布的 Cosmos 3.0 同源。

在数据与模型开发层面,Kairos 广泛汇聚了十余万小时以人类为中心(human-centric)的实景数据,以及数百万小时互联网真实世界视频,全面覆盖数百类职业场景。通过将显式模仿学习与隐空间强化学习相结合,模型成功打通了从数据感知到深度理解的闭环,在场景认知、时序因果推演与泛化适配方面取得了突破。

基于此架构与高质量数据,大晓机器人推出了轻量化的 Kairos-4B 模型。作为全球首款可端侧直驱机器人本体的具身世界模型,Kairos-4B 打通了世界理解与状态预测的端到端闭环,消除了中间层转译所带来的运行延迟,在提升机器人实时响应与作业精度方面开辟了全新路径。

这一技术成果依托于大晓机器人首创的 ACE 研发范式,构建起“环境式数据采集—开悟世界模型3.0(Kairos 3.0)—泛化具身模组”的全链路技术体系。大晓机器人由商汤科技联合创始人、执行董事王晓刚出任董事长,世界级 AI 科学家陶大程院士担任首席科学家。为解决具身智能行业目前面临的数据荒、常识差、泛化难、通用性不足等核心挑战,公司同步推出了“具身超级大脑模组A1”,通过与芯片厂商、硬件厂商、云服务商及垂直场景伙伴的战略合作,积极推动其在安防、巡检、服务等多元场景的规模化与商业化落地。

二、四大权威基准测试数据验证

在四项全球权威的具身智能评测基准中,开悟世界模型(Kairos)通过详实的数据展示了其在复杂操作、鲁棒性、物理建模和真实场景泛化等维度的技术实力:

RoboTwin 2.0(复杂双臂操作评测): 该基准由上海交通大学、香港大学及上海人工智能实验室等研究团队共同推出,包含 50 项复杂的协作任务。评测结果显示,Kairos 以 96.1% 的平均成功率位列所有参评方法第一。其中,模型在标准(Clean)场景下取得 96.9 分,在随机化(Randomized)场景下取得 95.2 分,全面超越了 AIM(93.1 分)、Fast-WAM(91.8 分)、MotuBrain(96.0 分)等主流世界模型,以及 G0.5(93.2 分)和 starVLA(88.3 分)等传统 VLA 模型。

LIBERO-Plus(场景级泛化能力评测): 该基准由上海创智学院、复旦大学、同济大学和新加坡国立大学的研究团队共同提出,通过模拟相机视角、光照条件、背景环境和噪声干扰等 7 种真实场景变量测试模型鲁棒性。数据显示,Kairos 以 89.0 分的总成绩登顶全球榜首。模型大幅超越了同为世界模型的 Being-H0.7(84.8 分),以及 ACoT-VLA(88.0 分)、Pi 0.5(85.7 分)和 ProGAL-VLA(85.5 分)等主流 VLA 模型。在核心子维度上,Kairos 在光照(97.7)、背景(95.8)、噪声(96.8)三大维度上均接近满分。

WorldModelBench Robot(世界建模能力测试): 该基准由加州大学伯克利分校、加州大学圣迭戈分校、英伟达和麻省理工学院联合推出,核心评估指令遵循和未来帧生成能力。Kairos-4B 仅用 4B 参数便全面超越了 28B 参数的 Lingbot、16B 参数的 Cosmos3、14B 参数的 Abot-Physworld 以及 5B 参数的 Wan2.2,以 9.30 分的总成绩夺冠。其指令遵循得分达 2.36,与 16B 参数的 Cosmos3 并列全球第一;在物理遵循维度上取得 4.96 分,其牛顿力学、重力两大核心物理规律维度及时序质量指标均斩获 1.00 分满分。

DreamGen Bench(真实场景泛化评测): 该评测由英伟达联合华盛顿大学、加州大学伯克利分校、加州大学洛杉矶分校等多所顶尖高校提出。Kairos 一举夺得平均物理遵循(AVG_PA 0.538)和总平均分(AVG_Score 0.618)两项全球第一。在核心三大泛化场景中,Kairos 在物理遵循维度上的新行为执行得分 0.489、新环境适配得分 0.581 均位居全球第一;在指令遵循维度上,新行为执行得分 0.745 亦斩获第一,全面领先 Cosmos3、Lingbot 和 Wan2.2 等主流模型。

声明:以上信息仅代表发布者自身观点,并不代表本平台赞同其观点,也不代表本平台对其真实性负责。
评论 0
网友评论仅供其表达个人看法,并不表明平台立场。
全部评论
懂能帝AI助手
服务商入驻
服务商入驻
资讯投稿
资讯发布
视频发布
视频发布
在线客服
平台客服