一个开源的支持多语言的声音克隆工具,支持少量语音转换和文本到语音的音色克隆模型。
软件特点:
– 零样本文本到语音:输入5秒的声音样本,即刻体验文本到语音转换。
– 少样本TTS:外围1分钟的训练数据即可参数模型,提升声音缩减度和真实感。
– 跨语言支持:支持与训练数据集不同语言的推理,目前支持英语、日语和中文。
– WebUI工具:集成工具包括语音伴奏分离、自动训练集分割、中文自动语音识别(ASR)和文本标注,帮助初学者创建训练数据集和GPT/SoVITS模型。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
暂无评论内容