Back to Feed
总结
生数科技1月14日通过官方公众号称,Vidu AI开放平台上线“一键生成MV”功能。用户只需上传音乐、最多7张参考图并给出文本指令,系统以多智能体协作完成导演解析音乐与歌词、生成分镜脚本、按参考图保持角色与风格一致的连续画面,并进行剪辑合成、卡点转场及逐帧歌词字幕同步,分钟级输出最长约5分钟的成片。官方称该端到端“虚拟制片厂”可提供工业级稳定品质,降低MV制作门槛。
正文
IT之家 1 月 14 日消息,今天下午,生数科技通过官方公众号宣布,Vidu AI 开放平台上线"一键生成 MV"功能。 该工具是一个深度协同的多智能体(Multi-Agent)系统。用户仅需提交音乐、参考图像与文本指令,系统即可全自动输出叙事连贯、音画同步的高完成度 MV,号称拥有 工业级稳定品质 。 IT之家从官方介绍获悉,用户简单的指令(音乐 + 图 + 文)一经输入,便可在系统内部触发一场精密协作。 导演智能体: 解析音乐结构与歌词,规划整体叙事脉络与情绪曲线。 分镜脚本智能体: 将叙事转化为包含景别、运镜、时长描述的详细分镜脚本。 视觉生成智能体: 基于参考图与分镜,生成并严格保持角色、场景、风格一致性的连续画面。 剪辑与合成智能体: 负责镜头节奏卡点、转场特效,并生成与歌词逐帧同步的动态字幕。整个过程无需人工干预,在分钟级时间内输出完整成片。这不再是工具的集合,而是一个为生产 MV 而专门设计的、端到端的虚拟制片厂。 根据介绍,Vidu 的"多图参考生视频"技术,允许创作者上传至多 7 张参考图作为视觉锚点,系统便能以此为基准,在长达五分钟的视频中精确复刻人物特征与美学风格。
发布时间: