Routine国内 · 科技智元发布SOP在线后训练系统具身智能在线后训练在线学习+2智元具身研究中心提出SOP(Scalable Online Post-training)在线后训练系统,面向通用机器人在真实世界的规模化部署与智能化运行。该方案被描述为业界首次在物理世界VLA后训练中系统性融合在线学习、分布式架构与多任务通才性,使机器人集群能在真实环境中持续进化,并将个体在执行与交互中获得的经验在群体内高效复用,从而把设备规模与数据规模转化为可累积的智能增益与更快的能力迭代。-
Routine国内 · 科技智元发布SOP在线后训练系统(2026年1月)VLA模型具身智能分布式训练+2智元具身研究中心于1月6日提出SOP(Scalable Online Post-training)在线后训练系统,面向机器人在真实世界的规模化部署。该框架将VLA后训练从“离线、单机、顺序”重构为“在线、集群、并行”,采用Actor-Learner异步架构,多机器人并行采集经验、云端集中在线更新并分钟级回传参数。官方称SOP可即插即用多种后训练算法,并以HG-DAgger与RECAP验证:商超场景综合性能提升33%,多任务成功率普遍达94%以上,纸盒装配98%,并展示36小时连续操作的稳定性;更多机器人规模可提升学习效率并缩短达标时间。-
Notable国内 · 科技智元发布SOP在线后训练系统人形机器人具身智能在线后训练+2据智元官微消息,智元具身研究中心发布SOP(Scalable Online Post-training)在线后训练系统,面向真实世界部署场景,强调在物理环境下对VLA等模型的后训练中系统性融合在线学习、分布式架构与多任务通才能力。该方案旨在让机器人集群在真实环境中持续进化,并将单个机器人的经验在群体中高效复用,以把规模化部署带来的数据与经验积累转化为整体智能提升。-