作者博客地址:https://yanglinwei.blog.csdn.net
博主最近在逛Github,发现一个刚推出的Star指数迅速上升的Github开源项目,该项目可实现提取少量部分语音片段即可仿照说话者的特色去生成不同语言、情感、口音、韵律、停顿和语调的 实时语音,也就是使用它可以细致地调控提供声音样本说话者的语音风格。这个项目是myshell-ai开源的OpenVoice项目。

项目地址:https://github.com/myshell-ai/OpenVoice

OpenVoice除了灵活的语音风格控制外,还实现了零样本跨语言语音克隆,也就是不需要庞大说话者训练集中的语言,与先前的方法不同,先前的方法通常需要为所有语言提供大规模说话者多语言(MSML)数据集,而OpenVoice可以在没有该语言的大规模说话者训练数据的情况下将语音克隆到新语言中,下面展示它的功能:

文档更新时间: 2024-01-05 20:04   作者:admin