人形机器人可完成多语言逼真唇形动作

Back to Feed

Notable

国际 · 科技

哥伦比亚大学发布多语言唇形同步人形机器人框架

总结

美国哥伦比亚大学科学家提出一套新框架，使人形机器人面部能够根据输入音频自动生成逼真的唇部动作，并与人类语音实现同步。研究显示该方法具有较强的泛化能力，可推广到法语、汉语、阿拉伯语等多种语言，即便这些语言未出现在训练数据中。团队在《科学·机器人学》发表论文称，这一进展有助于提升机器人自然交流与拟人化交互能力，向“能沟通的功能型机器人”迈进一步。

正文

人形机器人可完成多语言逼真唇形动作美国哥伦比亚大学科学家设计出一种新型框架，使人形机器人面部能够根据音频生成逼真的唇部动作，实现与人类语音的同步。该技术还展示了较强的泛化能力，可推广至包括法语、汉语和阿拉伯语在内的多种语言，即使这些语言并未出现在训练数据中。研究团队在发表于最新一期《科学·机器人学》上的论文中指出，这一进展是朝着构建不仅能执行功能，还能进行人性化交流的机器人迈出的重要一步。

发布时间：-