微软刚刚发布了一个新的人工智能(AI)技术称为Vall-E,甚至可以复制一个人的声音只有3秒钟的音频。

微软Vall-E利用深度学习算法来帮助分析和繁殖人类的声音的特性包括口音,音高,甚至说话风格。

相关的

如您所料,一旦学会了一个人如何谈判,它现在可以用它来表示其他短语,句子,等更引人注目的是,它能够在几秒钟内。

声音克隆语音合成地区预计将是有益的。第一,它可以让电影,广告,或者任何视频生产容易得多,因为它可以创建自然配音。它也可以用来制造模仿名人更有说服力。

除了在娱乐领域,开发人员还可以使用个性化的虚拟助手之类的东西。

这项技术也可以用于卫生部门,尤其是言语病理学帮助人们患有语言障碍的康复。

微软的语音克隆技术可用Azure云平台,这意味着它可以很容易地访问其他公司和开发人员对自己的实验。



留下你的评论

你的电子邮件地址将不会被发表。必填字段标记*