Back to Feed
总结
1月1日,智元具身研究中心宣布推出第二代一体化具身大小脑系统GenieReasoner,瞄准VLA模型语义推理与动作控制的模态对齐难题,提出支持统一离散化预训练的架构,并用流匹配(Flow-matching)缓解传统离散Tokenizer带来的动作精度瓶颈。同时开源面向真机操控全流程的具身推理评测基准ERIQ,用于解耦量化评估不同维度的推理能力。实验称该系统在推理能力与跨本体真机泛化上均达SOTA,并显示更强推理可提升端到端动作执行表现;后续将推进逻辑深度与执行精度,并探索与世界模型和真机强化学习闭环协同。
正文
IT之家 1 月 1 日消息,智元具身研究中心今日宣布推出第二代一体化具身大小脑系统 GenieReasoner 。 针对 VLA 模型中语义推理与动作控制的模态对齐难题,智元具身研究中心提出了一种支持 统一离散化预训练 的模型架构,并通过 流匹配(Flow-matching) 缓解了传统离散 Tokenizer 的动作精度瓶颈。 同时具身研究中心开源了 ERIQ -聚焦于真机操控全流程的具身推理评测基准,用以解耦量化评估 VLA 中具身大脑不同维度的推理能力。 实验表明,GenieReasoner 不仅在推理能力上达到 SOTA, 更在跨本体真机实验中展现了 SOTA 级别的泛化性 。进一步的对比实验证实:VLA 模型更强的具身推理能力可显著提升其端到端动作执行表现,从而验证了 ERIQ 的评估价值。 下一步,智元具身研究中心将从"逻辑深度"与"执行精度"两个维度持续推进,并致力于实现具身大小脑、世界模型(World Model)与真机强化学习(Real-world RL)的闭环协同。 智元具身研究中心已将 ERIQ Benchmark 完全开源,IT之家附项目地址如下: https://geniereasoner.github.io/GenieReasoner/
发布时间: