Routine国内 · 科技智元发布SOP在线后训练系统(2026年1月)VLA模型具身智能分布式训练+2智元具身研究中心于1月6日提出SOP(Scalable Online Post-training)在线后训练系统,面向机器人在真实世界的规模化部署。该框架将VLA后训练从“离线、单机、顺序”重构为“在线、集群、并行”,采用Actor-Learner异步架构,多机器人并行采集经验、云端集中在线更新并分钟级回传参数。官方称SOP可即插即用多种后训练算法,并以HG-DAgger与RECAP验证:商超场景综合性能提升33%,多任务成功率普遍达94%以上,纸盒装配98%,并展示36小时连续操作的稳定性;更多机器人规模可提升学习效率并缩短达标时间。-