最新标签话题

Magic NewsRoom - AI-Powered News Aggregation

智元发布SOP在线后训练系统（2026年1月）

Routine

国内 · 科技

智元发布SOP在线后训练系统（2026年1月）

分布式训练

+2

智元具身研究中心于1月6日提出SOP（Scalable Online Post-training）在线后训练系统，面向机器人在真实世界的规模化部署。该框架将VLA后训练从“离线、单机、顺序”重构为“在线、集群、并行”，采用Actor-Learner异步架构，多机器人并行采集经验、云端集中在线更新并分钟级回传参数。官方称SOP可即插即用多种后训练算法，并以HG-DAgger与RECAP验证：商超场景综合性能提升33%，多任务成功率普遍达94%以上，纸盒装配98%，并展示36小时连续操作的稳定性；更多机器人规模可提升学习效率并缩短达标时间。

No more articles