meiyouruguo 发表于 2026-4-4 23:48:46

OmniVoice 语音克隆生成工具,目前速度最快的TTS工具

电脑要求: 英伟达8G显卡及其以上,支持50系列显卡
解压路径不要包含中文

OmniVoice 语音克隆生成工具 使用说明
一、项目简介
OmniVoice 是一款支持 600+ 语种 的 AI 语音合成工具,提供两种界面:

界面
启动方式
特点

Web 界面
运行 webui_启动.exe
浏览器操作,简洁直观

软件界面
运行 启动.exe
批量任务队列、音色库管理、多角色对话


二、核心功能
1. 声音克隆
上传一段参考音频(3~10秒为佳),即可复刻说话人的音色来朗读任意文本。


[*]参考音频必须是 wav 格式
[*]需要填写参考音频对应的文本内容,必须输入正确的参考文本内容,如果参考文本内容不准确,生成出来的音频会胡言乱语
[*]使用背景噪声少、说话清晰的参考音频
2. 声音设计
无需参考音频,通过属性组合直接设计声音:



属性
可选项

性别
男、女

年龄
儿童、少年、青年、中年、老年

音调
极低、低、中、高、极高

风格
耳语

英文口音
美式、英式、澳大利亚、中国、印度、韩国、日本等

中文方言
四川话、东北话、河南话、陕西话、云南话、青岛话等


注意:英文口音和中文方言不能同时设置。

3. 自动音色
不提供任何音色条件,由模型自动选择一个声音进行合成。


三、Web 界面使用
启动
双击 webui_启动.exe,等待模型加载完成后,浏览器自动弹出窗口打开 http://127.0.0.1:7860。
声音克隆页

[*]输入待合成文本
[*]上传参考音频
[*]填写参考音频文本
[*]选择语种(可选,默认自动检测)
[*]点击「开始合成」
声音设计页

[*]输入待合成文本
[*]选择语种
[*]设置性别、年龄、音调等属性
[*]点击「开始合成」
高级生成设置

参数
说明
默认值

语速
大于1更快,小于1更慢
1.0

固定时长
设置后忽略语速,按固定秒数生成


推理步数
越高质量越好,越低速度越快
32

引导系数(CFG)
控制生成多样性
2.0

降噪提示
在参考提示中加入降噪标记
开启

预处理参考音频
去静音、裁剪、补标点
开启

后处理输出音频
移除长静音、淡入淡出
开启


四、软件界面使用
软件界面提供更完整的批量处理和管理功能,分为三个页签。

页签一:创建任务
左右分栏布局:

左侧 - 输入区

[*]文本输入框:手动输入或从文件导入
[*]拆分方式:单任务 / 按空行拆分 / 按标点拆分
[*]参考音频选择、音色库下拉
[*]保存当前音色到音色库
右侧 - 配置区

[*]生成模式切换(声音克隆 / 声音设计 / 自动音色)
[*]语种选择(常用语种显示中文名称)
[*]声音设计属性(性别、年龄、音调、口音、方言)
[*]生成参数(步数、引导系数、语速、时长等)
底部操作

[*]预览任务:查看即将生成的任务列表
[*]添加到队列:加入任务列表等待批量处理
[*]立即生成:添加并立刻开始生成
页签二:任务列表

[*]查看所有任务的状态(等待处理 / 处理中 / 已完成 / 失败)
[*]支持操作:处理选中、处理全部、重试失败、重新生成、停止处理
[*]双击任务打开生成的音频文件
[*]右键菜单:查看错误详情、打开结果等
[*]合并已完成音频:将多段音频拼接为一个文件,可设置段落间静音时长
[*]任务自动保存,关闭后重新打开不丢失
页签三:设置

[*]模型目录:可切换不同模型路径,支持重新加载
[*]输出目录:自定义音频输出位置
[*]音色管理:查看、重命名、删除、导入已保存的音色
多角色对话模式
适合有声书、广播剧等场景:
勾选「多角色对话模式」
按格式输入文本:

小明: 你好,今天天气真好。
小红: 是啊,我们去公园吧。
小明: 好主意!
点击「角色配置」为每个角色指定专属音色或声音设计
角色配置支持三种模式:
使用当前全局模式:沿用主界面设置
绑定已保存音色:为角色绑定音色库中的音色
角色声音设计:为角色单独设计声音属性
点击「立即生成」,自动按角色逐条生成

五、音色库管理
保存常用的参考音频,方便反复使用:

[*]在「参考音频/音色库」区域选择音频文件
[*]填写参考音频文本
[*]输入音色名称,点击「保存当前音色」
[*]之后在下拉列表中选择即可自动填充音频和文本
音色文件保存在 prompts 目录下(音频文件 + JSON 元数据)。

六、语种支持
支持 600+ 语种,常用语种已汉化显示:
中文、粤语、英语、日语、韩语、法语、德语、西班牙语、俄语、葡萄牙语、阿拉伯语、印地语、泰语、越南语、印尼语、马来语……
语种下拉框显示中文名称,提交给模型时会自动映射回原始英文参数。选择「自动检测」则由模型根据文本内容自动判断。


OmniVoice 语音克隆生成工具下载地址:
链接:https://pan.quark.cn/s/985a043147ff
解压密码: www.aibl.vip

本工具免费分享,无任何使用限制,本地离线可用

OmniVoice 语音克隆生成工具下载地址(此版本支持srt字幕):

***本内容需购买可见***








markczc 发表于 2026-4-5 13:27:33

谢谢大佬分享!

guozhixin86 发表于 2026-4-5 18:23:24

谢谢大佬的无私分享,感谢感谢!

13703536077 发表于 2026-4-6 17:55:04

大佬,有没有支持山西这边方言的tts,下了好多tts,生成的都别扭的不行!~

1527530796 发表于 5 天前

666哈哈哈哈哈哈哈谢谢
页: [1]
查看完整版本: OmniVoice 语音克隆生成工具,目前速度最快的TTS工具