Back to Feed
总结
美国哥伦比亚大学研究团队提出一种新型框架,可让人形机器人面部根据输入音频生成逼真的唇部动作,与人类语音实现同步。论文发表于最新一期《科学·机器人学》,称该方法具有较强泛化能力,能推广到法语、汉语、阿拉伯语等未出现在训练数据中的语言。研究人员认为,这一进展有望推动机器人从“能做事”迈向“能交流”,在教育、老年护理等场景具应用潜力,同时强调后续设计需谨慎,防止技术被滥用。
正文
美国哥伦比亚大学科学家设计出一种新型框架,使人形机器人面部能够根据音频生成逼真的唇部动作,实现与人类语音的同步。该技术还展示了较强的泛化能力,可推广至包括法语、汉语和阿拉伯语在内的多种语言,即使这些语言并未出现在训练数据中。研究团队在发表于最新一期《科学·机器人学》上的论文中指出,这一进展是朝着构建不仅能执行功能,还能进行人性化交流的机器人迈出的重要一步。研究团队推测,这类人形机器人在教育、老年护理等领域具有应用潜力。但他们也强调,未来的设计工作需格外谨慎,以防止技术被滥用。(科技日报)
发布时间: