跳到正文
Back to Feed

总结

美国哥伦比亚大学科学家提出一套新框架,使人形机器人面部能够根据输入音频自动生成逼真的唇部动作,并与人类语音实现同步。研究显示该方法具有较强的泛化能力,可推广到法语、汉语、阿拉伯语等多种语言,即便这些语言未出现在训练数据中。团队在《科学·机器人学》发表论文称,这一进展有助于提升机器人自然交流与拟人化交互能力,向“能沟通的功能型机器人”迈进一步。

正文

人形机器人可完成多语言逼真唇形动作 美国哥伦比亚大学科学家设计出一种新型框架,使人形机器人面部能够根据音频生成逼真的唇部动作,实现与人类语音的同步。该技术还展示了较强的泛化能力,可推广至包括法语、汉语和阿拉伯语在内的多种语言,即使这些语言并未出现在训练数据中。研究团队在发表于最新一期《科学·机器人学》上的论文中指出,这一进展是朝着构建不仅能执行功能,还能进行人性化交流的机器人迈出的重要一步。
发布时间: