clone-voice(CV声音克隆工具)是一个强大的声音模拟工具,它能够精准捕捉并复制任何人类音色特征,并基于此将文本内容转化为相应音色的语音输出,甚至能够实现不同人声之间的相互转换。对于那些在声音创作上有特殊需求,如需要合成多种音色、进行音频制作或者个性化定制声音的用户来说,Clone-Voice无疑是一个理想的选择。
软件说明
Clone-Voice是一款利用网页界面技术进行声音克隆的尖端工具。它能够使用任何人类音色,将一段文字合成为使用该音色说话的声音,或者将一个声音使用该音色转换为另一个声音。此工具支持包括中文、英语、日语、韩语、法语、德语和意大利语在内的 16 种语言。它提供了文字到语音和声音到声音转换的功能,以易用性、多语言支持和在线录制声音的灵活性而著称。目前,该产品免费使用。
该技术广泛应用于声音合成领域,为用户提供无与伦比的声音再造能力。无论是为视频项目配音、制作播客节目,还是创造具有独特个性的声音元素,Clone-Voice都能发挥重要作用,极大地丰富了声音艺术的表现形式和应用范围。
使用说明
使用非常简单,没有N卡GPU也可以使用,下载预编译版本,双击 app.exe 打开一个web界面,鼠标点点就能用。
支持中、英、日、韩、法、德、意等16种语言,可在线从麦克风录制声音。
为保证合成效果,建议录制时长5秒到20秒,发音清晰准确,不要存在背景噪声。
英文效果很棒,中文效果还凑合。
window预编译版使用方法(其他系统可源码部署)
下载预编译版主文件和模型
下载后解压到某处,比如 E:/clone-voice 下
双击 app.exe ,等待自动打开web窗口,请仔细阅读cmd窗口的文字提示,如有错误,均会在此显示
模型下载后解压到软件目录下的 tts 文件夹内,解压后效果如图
转换操作步骤
选择【文字->声音】按钮,在文本框中输入文字、或点击导入srt字幕文件,然后点击“立即开始”。
选择【声音->声音】按钮,点击或拖拽要转换的音频文件(mp3/wav/flac),然后从“要使用的声音文件”下拉框中选择要克隆的音色,如果没有满意的,也可以点击“本地上传”按钮,选择已录制好的5-20s的wav/mp3/flac声音文件。或者点击“开始录制”按钮,在线录制你自己的声音5-20s,录制完成点击使用。然后点击“立即开始”按钮
如果机器拥有N卡GPU,并正确配置了CUDA环境,将自动使用CUDA加速
实际应用
Clone-Voice的实际应用多种多样:
内容创作:对于视频配音和播客,Clone-Voice可以节省时间、精力和金钱,同时允许即时修改。
音频编辑:简化错误情况下的音频记录修改。
提高可及性:将书面内容转换为音频格式,增加视觉障碍听众或偏好音频的用户的可及性。
个性化:为企业或创作者提供在与客户或粉丝互动中加入个性化内容的机会。
功能说明
AI声音克隆的关键功能
自然之声:AI克隆的声音听起来自然,能模仿口音和情绪。
多种语言可供选择:提供用数百种语言克隆声音的选项,不仅限于英语。
改变设置的能力:允许更改音调和速度等设置以更接近原声。
更新说明
增加语音速度调节选项,0.1-2.0
split_sentences参数默认改为 False,以取得更好合成效果
增加 .env 代理设置