OmniVoice 语音克隆生成工具,目前速度最快的TTS工具

meiyouruguo 发表于 2026-4-4 23:48:46

电脑要求: 英伟达8G显卡及其以上,支持50系列显卡
解压路径不要包含中文

OmniVoice 语音克隆生成工具使用说明
一、项目简介
OmniVoice 是一款支持 600+ 语种的 AI 语音合成工具，提供两种界面：

界面
启动方式
特点

Web 界面
运行 webui_启动.exe
浏览器操作，简洁直观

软件界面
运行启动.exe
批量任务队列、音色库管理、多角色对话

二、核心功能
1. 声音克隆
上传一段参考音频（3~10秒为佳），即可复刻说话人的音色来朗读任意文本。

[*]参考音频必须是 wav 格式
[*]需要填写参考音频对应的文本内容,必须输入正确的参考文本内容,如果参考文本内容不准确,生成出来的音频会胡言乱语
[*]使用背景噪声少、说话清晰的参考音频
2. 声音设计
无需参考音频，通过属性组合直接设计声音：

属性
可选项

性别
男、女

年龄
儿童、少年、青年、中年、老年

音调
极低、低、中、高、极高

风格
耳语

英文口音
美式、英式、澳大利亚、中国、印度、韩国、日本等

中文方言
四川话、东北话、河南话、陕西话、云南话、青岛话等

注意：英文口音和中文方言不能同时设置。

3. 自动音色
不提供任何音色条件，由模型自动选择一个声音进行合成。

三、Web 界面使用
启动
双击 webui_启动.exe，等待模型加载完成后，浏览器自动弹出窗口打开 http://127.0.0.1:7860。
声音克隆页

[*]输入待合成文本
[*]上传参考音频
[*]填写参考音频文本
[*]选择语种（可选，默认自动检测）
[*]点击「开始合成」
声音设计页

[*]输入待合成文本
[*]选择语种
[*]设置性别、年龄、音调等属性
[*]点击「开始合成」
高级生成设置

参数
说明
默认值

语速
大于1更快，小于1更慢
1.0

固定时长
设置后忽略语速，按固定秒数生成
空

推理步数
越高质量越好，越低速度越快
32

引导系数（CFG）
控制生成多样性
2.0

降噪提示
在参考提示中加入降噪标记
开启

预处理参考音频
去静音、裁剪、补标点
开启

后处理输出音频
移除长静音、淡入淡出
开启

四、软件界面使用
软件界面提供更完整的批量处理和管理功能，分为三个页签。

页签一：创建任务
左右分栏布局：

左侧 - 输入区

[*]文本输入框：手动输入或从文件导入
[*]拆分方式：单任务 / 按空行拆分 / 按标点拆分
[*]参考音频选择、音色库下拉
[*]保存当前音色到音色库
右侧 - 配置区

[*]生成模式切换（声音克隆 / 声音设计 / 自动音色）
[*]语种选择（常用语种显示中文名称）
[*]声音设计属性（性别、年龄、音调、口音、方言）
[*]生成参数（步数、引导系数、语速、时长等）
底部操作

[*]预览任务：查看即将生成的任务列表
[*]添加到队列：加入任务列表等待批量处理
[*]立即生成：添加并立刻开始生成
页签二：任务列表

[*]查看所有任务的状态（等待处理 / 处理中 / 已完成 / 失败）
[*]支持操作：处理选中、处理全部、重试失败、重新生成、停止处理
[*]双击任务打开生成的音频文件
[*]右键菜单：查看错误详情、打开结果等
[*]合并已完成音频：将多段音频拼接为一个文件，可设置段落间静音时长
[*]任务自动保存，关闭后重新打开不丢失
页签三：设置

[*]模型目录：可切换不同模型路径，支持重新加载
[*]输出目录：自定义音频输出位置
[*]音色管理：查看、重命名、删除、导入已保存的音色
多角色对话模式
适合有声书、广播剧等场景：
勾选「多角色对话模式」
按格式输入文本：

小明: 你好，今天天气真好。
小红: 是啊，我们去公园吧。
小明: 好主意！
点击「角色配置」为每个角色指定专属音色或声音设计
角色配置支持三种模式：
使用当前全局模式：沿用主界面设置
绑定已保存音色：为角色绑定音色库中的音色
角色声音设计：为角色单独设计声音属性
点击「立即生成」，自动按角色逐条生成

五、音色库管理
保存常用的参考音频，方便反复使用：

[*]在「参考音频/音色库」区域选择音频文件
[*]填写参考音频文本
[*]输入音色名称，点击「保存当前音色」
[*]之后在下拉列表中选择即可自动填充音频和文本
音色文件保存在 prompts 目录下（音频文件 + JSON 元数据）。

六、语种支持
支持 600+ 语种，常用语种已汉化显示：
中文、粤语、英语、日语、韩语、法语、德语、西班牙语、俄语、葡萄牙语、阿拉伯语、印地语、泰语、越南语、印尼语、马来语……
语种下拉框显示中文名称，提交给模型时会自动映射回原始英文参数。选择「自动检测」则由模型根据文本内容自动判断。

OmniVoice 语音克隆生成工具下载地址:
链接：https://pan.quark.cn/s/985a043147ff
解压密码: www.aibl.vip

本工具免费分享,无任何使用限制,本地离线可用

OmniVoice 语音克隆生成工具下载地址(此版本支持srt字幕):

***本内容需购买可见***

guozhixin86 发表于 2026-4-5 18:23:24

谢谢大佬的无私分享，感谢感谢！

13703536077 发表于 2026-4-6 17:55:04

大佬，有没有支持山西这边方言的tts，下了好多tts，生成的都别扭的不行！~

1527530796 发表于 2026-4-11 20:56:02

666哈哈哈哈哈哈哈谢谢

shengcai 发表于 2026-5-16 05:20:04

感觉不太礼貌的问一下：能不能公开代码，开源代码，方便研究学习，感谢！

myqfyl 发表于 2026-5-19 14:41:34

付费内容是啥呢？

页: [1]

AIBL论坛's Archiver

OmniVoice 语音克隆生成工具,目前速度最快的TTS工具