Back to Feed
总结
阿里云于1月8日推出面向AI硬件的多模态交互开发套件,集成通义体系的千问、万相、百聆三款基础大模型,并预置十多款Agent与MCP工具,支持“听、看、思考”等多模态能力与工具调用,进而实现与物理世界的交互。该套件主要面向AI眼镜等硬件设备的应用开发,意在以统一的模型与工具链降低多模态交互与智能体构建门槛,帮助硬件厂商与开发者更快完成原型验证与产品化落地,推动相关终端生态扩展。
正文
阿里云发布多模态交互开发套件,集成千问、万相、百聆三款通义基础大模型,预置十多款 Agent 和 MCP 工具,能听、看、思考并与物理世界交互,可应用于 AI 眼镜等硬件设备。
发布时间: