跳到正文
Back to Feed

总结

智元具身研究中心近期发布第二代一体化具身大小脑系统GenieReasoner,聚焦VLA(视觉-语言-动作)模型在语义推理与动作控制之间存在的模态对齐难题。该系统提出支持“统一离散化预训练”的模型架构,尝试在同一离散表征体系中同时学习推理与控制,并引入流匹配方法缓解传统离散Tokenizer在动作表示与控制精度上的瓶颈。相关方案旨在提升从语义理解到动作执行的连贯性与可控性,为具身智能训练与落地提供新的技术路径。

正文

智元具身研究中心推出第二代一体化具身大小脑系统 GenieReasoner,针对 VLA 模型中语义推理与动作控制的模态对齐难题,提出支持统一离散化预训练的模型架构,并用流匹配缓解传统离散 Tokenizer 的动作精度瓶颈。
发布时间: