使用Voicebox进行语音克隆 ElevenLabs 的免费开源替代方案。


崧峻
原创
发布时间: 2026-04-25 10:42:06 | 阅读数 0收藏数 0评论数 0
封面
Voicebox 是一款以本地化为核心的语音克隆工作室,是 ElevenLabs 的免费开源替代方案。它可以从几秒钟的音频中克隆语音,使用 7 个 TTS 引擎生成 23 种语言的语音,应用后期处理效果,并使用时间线编辑器创作多语音项目。
1

什么是Voicebox

Voicebox 是一款以本地化为核心的语音克隆工作室,是 ElevenLabs 的免费开源替代方案。它可以从几秒钟的音频中克隆语音,使用 7 个 TTS 引擎生成 23 种语言的语音,应用后期处理效果,并使用时间线编辑器创作多语音项目。

2

下载Voicebox

https://docs.voicebox.sh/ 这个地址是他的官网 我们进去他的官网 在里面根据我们的系统下载我们的版本 我是macos系统所以下载mac版本

3

录制初始声音

  1. 我们先点击进入这个软件
  2. 然后点击上方创建声音 要是有现成的声音点导入声音也行 如图2
  3. 点击进来之后是如图3的页面 然后我们点击左侧的录制进行录音 并把说的话放到参考文本中 在右侧选择chinese 如图4所示
  4. 然后点击创建即可
4

生成声音

  1. 我们选择我们刚刚录制好的语音 然后底部选择chinese 模型我这边选择的是qwen1.7b的tts 如图1所示
  2. 然后我们输入想要生成的文本 如图2所示
  3. 然后我们点击生成 他会先进行模型的下载 如图3 下载完之后才会进行生成 如图4
  4. 然后等待生成即可
5

下载音频

我们可以点击右侧三个点 然后点击导出音频 然后选择位置点击确定即可

6

使用api

Voicebox是通过发起http网络请求进行调用 我这边就先用postman进行演示


  1. 首先是创建profile 如图1所示 zh是中文 name就是profile的名称 profile就是如图2所示圈出来的这个 我们也可以直接在软件中创建
  2. 然后查询profile 的id get请求 http://localhost:17493/profiles 如图3所示
  3. 然后我们把上一步的id复制下来进行创建语音 post请求 http://localhost:17493/generate json实体如下
{
"text": "你好",
"profile_id": "0fd12a84-72d9-403c-8353-5b7b6770f97b",
"language": "zh"
}
  1. 如图4所示就是生成成功了 然后我们的软件就有了如图5 要是没有可以刷新一下或者重启软件
阅读记录0
点赞0
收藏0
禁止 本文未经作者允许授权,禁止转载
猜你喜欢
评论/提问(已发布 0 条)
评论 评论
收藏 收藏
分享 分享
pdf下载 下载
pdf下载 举报