OmniVoice 语音克隆生成工具,目前速度最快的TTS工具

meiyouruguo · 发表于 2026-4-4 23:48:46

电脑要求: 英伟达8G显卡及其以上,支持50系列显卡
解压路径不要包含中文

OmniVoice 语音克隆生成工具使用说明
一、项目简介
OmniVoice 是一款支持 600+ 语种 的 AI 语音合成工具，提供两种界面：

界面	启动方式	特点
Web 界面	运行 webui_启动.exe	浏览器操作，简洁直观
软件界面	运行启动.exe	批量任务队列、音色库管理、多角色对话

二、核心功能
1. 声音克隆
上传一段参考音频（3~10秒为佳），即可复刻说话人的音色来朗读任意文本。

参考音频必须是 wav 格式
需要填写参考音频对应的文本内容,必须输入正确的参考文本内容,如果参考文本内容不准确,生成出来的音频会胡言乱语
使用背景噪声少、说话清晰的参考音频

2. 声音设计
无需参考音频，通过属性组合直接设计声音：

属性	可选项
性别	男、女
年龄	儿童、少年、青年、中年、老年
音调	极低、低、中、高、极高
风格	耳语
英文口音	美式、英式、澳大利亚、中国、印度、韩国、日本等
中文方言	四川话、东北话、河南话、陕西话、云南话、青岛话等

注意：英文口音和中文方言不能同时设置。

3. 自动音色
不提供任何音色条件，由模型自动选择一个声音进行合成。

三、Web 界面使用
启动
双击 webui_启动.exe，等待模型加载完成后，浏览器自动弹出窗口打开 http://127.0.0.1:7860。
声音克隆页

输入待合成文本
上传参考音频
填写参考音频文本
选择语种（可选，默认自动检测）
点击「开始合成」

声音设计页

输入待合成文本
选择语种
设置性别、年龄、音调等属性
点击「开始合成」

高级生成设置

参数	说明	默认值
语速	大于1更快，小于1更慢	1.0
固定时长	设置后忽略语速，按固定秒数生成	空
推理步数	越高质量越好，越低速度越快	32
引导系数（CFG）	控制生成多样性	2.0
降噪提示	在参考提示中加入降噪标记	开启
预处理参考音频	去静音、裁剪、补标点	开启
后处理输出音频	移除长静音、淡入淡出	开启

四、软件界面使用
软件界面提供更完整的批量处理和管理功能，分为三个页签。

页签一：创建任务
左右分栏布局：

左侧 - 输入区

文本输入框：手动输入或从文件导入
拆分方式：单任务 / 按空行拆分 / 按标点拆分
参考音频选择、音色库下拉
保存当前音色到音色库

右侧 - 配置区

生成模式切换（声音克隆 / 声音设计 / 自动音色）
语种选择（常用语种显示中文名称）
声音设计属性（性别、年龄、音调、口音、方言）
生成参数（步数、引导系数、语速、时长等）

底部操作

预览任务：查看即将生成的任务列表
添加到队列：加入任务列表等待批量处理
立即生成：添加并立刻开始生成

页签二：任务列表

查看所有任务的状态（等待处理 / 处理中 / 已完成 / 失败）
支持操作：处理选中、处理全部、重试失败、重新生成、停止处理
双击任务打开生成的音频文件
右键菜单：查看错误详情、打开结果等
合并已完成音频：将多段音频拼接为一个文件，可设置段落间静音时长
任务自动保存，关闭后重新打开不丢失

页签三：设置

模型目录：可切换不同模型路径，支持重新加载
输出目录：自定义音频输出位置
音色管理：查看、重命名、删除、导入已保存的音色

多角色对话模式
适合有声书、广播剧等场景：
勾选「多角色对话模式」
按格式输入文本：

小明: 你好，今天天气真好。
小红: 是啊，我们去公园吧。
小明: 好主意！

复制代码

点击「角色配置」为每个角色指定专属音色或声音设计
角色配置支持三种模式：
使用当前全局模式：沿用主界面设置
绑定已保存音色：为角色绑定音色库中的音色
角色声音设计：为角色单独设计声音属性
点击「立即生成」，自动按角色逐条生成

五、音色库管理
保存常用的参考音频，方便反复使用：

在「参考音频/音色库」区域选择音频文件
填写参考音频文本
输入音色名称，点击「保存当前音色」
之后在下拉列表中选择即可自动填充音频和文本

音色文件保存在 prompts 目录下（音频文件 + JSON 元数据）。

六、语种支持
支持 600+ 语种，常用语种已汉化显示：
中文、粤语、英语、日语、韩语、法语、德语、西班牙语、俄语、葡萄牙语、阿拉伯语、印地语、泰语、越南语、印尼语、马来语……
语种下拉框显示中文名称，提交给模型时会自动映射回原始英文参数。选择「自动检测」则由模型根据文本内容自动判断。

OmniVoice 语音克隆生成工具下载地址:
链接：https://pan.quark.cn/s/985a043147ff
解压密码: www.aibl.vip

本工具免费分享,无任何使用限制,本地离线可用

OmniVoice 语音克隆生成工具下载地址(此版本支持srt字幕):

付费内容

亲爱的游客您好！如果您要查看本帖隐藏内容请向楼主支付50灵石

立即购买

购买记录

guozhixin86 · 发表于 2026-4-5 18:23:24

谢谢大佬的无私分享，感谢感谢！

13703536077 · 发表于 2026-4-6 17:55:04

大佬，有没有支持山西这边方言的tts，下了好多tts，生成的都别扭的不行！~

1527530796 · 发表于 2026-4-11 20:56:02

666哈哈哈哈哈哈哈谢谢

shengcai · 发表于 2026-5-16 05:20:04

感觉不太礼貌的问一下：能不能公开代码，开源代码，方便研究学习，感谢！

myqfyl · 发表于 2026-5-19 14:41:34

付费内容是啥呢？

		自动登录	找回密码
密码			立即注册

OmniVoice 语音克隆生成工具,目前速度最快的TTS工具

突出会员

丹神