美国哥伦比亚大学科学家设计出一种新型框架，使人形机器人面部能够根据音频生成逼真的唇部动作，实现与人类语音的同步。该技术还展示了较强的泛化能力，可推广至...

Back to Feed

Routine

国际 · 科技

哥伦比亚大学发布音频驱动人形机器人唇形同步框架

总结

美国哥伦比亚大学研究团队提出一种新型框架，可让人形机器人面部根据输入音频生成逼真的唇部动作，与人类语音实现同步。论文发表于最新一期《科学·机器人学》，称该方法具有较强泛化能力，能推广到法语、汉语、阿拉伯语等未出现在训练数据中的语言。研究人员认为，这一进展有望推动机器人从“能做事”迈向“能交流”，在教育、老年护理等场景具应用潜力，同时强调后续设计需谨慎，防止技术被滥用。

正文

美国哥伦比亚大学科学家设计出一种新型框架，使人形机器人面部能够根据音频生成逼真的唇部动作，实现与人类语音的同步。该技术还展示了较强的泛化能力，可推广至包括法语、汉语和阿拉伯语在内的多种语言，即使这些语言并未出现在训练数据中。研究团队在发表于最新一期《科学·机器人学》上的论文中指出，这一进展是朝着构建不仅能执行功能，还能进行人性化交流的机器人迈出的重要一步。研究团队推测，这类人形机器人在教育、老年护理等领域具有应用潜力。但他们也强调，未来的设计工作需格外谨慎，以防止技术被滥用。（科技日报）

发布时间：-