跳到正文
Back to Feed

总结

1月14日,面壁智能宣布,清华大学自然语言处理实验室、中国人民大学、面壁智能与OpenBMB开源社区联合研发智能体模型AgentCPM-Explore。该模型基于约4B参数,研发方称其有望把大模型的长程任务处理能力部署到端侧,并在GAIA、HLE、Browsercomp、WebWalker、FRAMES、Xbench-DeepResearch等多项智能体评测中实现较高参数效率:同尺寸模型取得SOTA,并在部分基准上追平或超过8B级甚至部分30B以上及闭源模型表现。项目同时宣布开源,并公开从Base到SOTA的全流程代码与仓库链接。

正文

IT之家 1 月 14 日消息,面壁智能今日宣布,清华大学自然语言处理实验室、中国人民大学、面壁智能与 OpenBMB 开源社区联合研发 AgentCPM-Explore 智能体模型, 基于仅 4B 参数的模型 ,有望让大模型的长程任务处理能力部署于端侧。 AgentCPM-Explore 在 GAIA、HLE、Browsercomp、Browsercomp (ZH)、WebWalker、FRAMES、Xbench-DeepResesarch、Seal-0 智能体评测基准上均展现出参数效能比,不仅取得同尺寸模型 SOTA, 而且越级赶上甚至超越两倍参数量(8B 级)SOTA 模型、比肩部分 30B 级以上和闭源大模型的效果 。 在 Xbench-DeepResearch 中,AgentCPM-Explore 的表现超越了 OpenAI-o3、Claude-4.5-Sonnet 等闭源大模型,超越了不同量级 SOTA 模型的表现趋势线,展现出了更高的能力密度。 AgentCPM-Explore 模型宣布开源,并开源了从 Base 模型(GAIA 25.24%)进化至 SOTA 模型(GAIA 63.90%)的全流程代码。 IT之家附开源地址如下: https://github.com/OpenBMB/AgentCPM
发布时间: