Vidu 上线 AI 一键生成 MV 功能：只需提供音乐 + 参考图 + 指令，其余交给"虚拟制片厂"

Back to Feed

Routine

国内 · 科技

人工智能推理

总结

生数科技1月14日通过官方公众号称，Vidu AI开放平台上线“一键生成MV”功能。用户只需上传音乐、最多7张参考图并给出文本指令，系统以多智能体协作完成导演解析音乐与歌词、生成分镜脚本、按参考图保持角色与风格一致的连续画面，并进行剪辑合成、卡点转场及逐帧歌词字幕同步，分钟级输出最长约5分钟的成片。官方称该端到端“虚拟制片厂”可提供工业级稳定品质，降低MV制作门槛。

正文

IT之家 1 月 14 日消息，今天下午，生数科技通过官方公众号宣布，Vidu AI 开放平台上线"一键生成 MV"功能。该工具是一个深度协同的多智能体（Multi-Agent）系统。用户仅需提交音乐、参考图像与文本指令，系统即可全自动输出叙事连贯、音画同步的高完成度 MV，号称拥有工业级稳定品质。 IT之家从官方介绍获悉，用户简单的指令（音乐 + 图 + 文）一经输入，便可在系统内部触发一场精密协作。导演智能体：解析音乐结构与歌词，规划整体叙事脉络与情绪曲线。分镜脚本智能体：将叙事转化为包含景别、运镜、时长描述的详细分镜脚本。视觉生成智能体：基于参考图与分镜，生成并严格保持角色、场景、风格一致性的连续画面。剪辑与合成智能体：负责镜头节奏卡点、转场特效，并生成与歌词逐帧同步的动态字幕。整个过程无需人工干预，在分钟级时间内输出完整成片。这不再是工具的集合，而是一个为生产 MV 而专门设计的、端到端的虚拟制片厂。根据介绍，Vidu 的"多图参考生视频"技术，允许创作者上传至多 7 张参考图作为视觉锚点，系统便能以此为基准，在长达五分钟的视频中精确复刻人物特征与美学风格。

发布时间：-