AIBL论坛

 找回密码
 立即注册
本论坛所有软件旨在帮助用户创建逼真且有趣的内容,帮助做自媒体的人制作原创有趣的视频或广告,如果使用别人的肖像,使用之前需获得同意和许可(建议使用AI生成的人脸),严禁使用本论坛发布的资源用于不符合当地法律法规的事情
查看: 35|回复: 0

OmniVoice 语音克隆生成工具,目前速度最快的TTS工具

[复制链接]
发表于 昨天 23:48 | 显示全部楼层 |阅读模式
电脑要求: 英伟达8G显卡及其以上
解压路径不要包含中文

OmniVoice 语音克隆生成工具 使用说明
一、项目简介
OmniVoice 是一款支持 600+ 语种 的 AI 语音合成工具,提供两种界面:
界面
启动方式
特点
Web 界面
运行 webui_启动.exe
浏览器操作,简洁直观
软件界面
运行 启动.exe
批量任务队列、音色库管理、多角色对话

二、核心功能
1. 声音克隆
上传一段参考音频(3~10秒为佳),即可复刻说话人的音色来朗读任意文本。

  • 参考音频必须是 wav 格式
  • 需要填写参考音频对应的文本内容,必须输入正确的参考文本内容,如果参考文本内容不准确,生成出来的音频会胡言乱语
  • 使用背景噪声少、说话清晰的参考音频
2. 声音设计
无需参考音频,通过属性组合直接设计声音:


属性
可选项
性别
男、女
年龄
儿童、少年、青年、中年、老年
音调
极低、低、中、高、极高
风格
耳语
英文口音
美式、英式、澳大利亚、中国、印度、韩国、日本等
中文方言
四川话、东北话、河南话、陕西话、云南话、青岛话等

注意:英文口音和中文方言不能同时设置。

3. 自动音色
不提供任何音色条件,由模型自动选择一个声音进行合成。


三、Web 界面使用
启动
双击 webui_启动.exe,等待模型加载完成后,浏览器自动弹出窗口打开 http://127.0.0.1:7860
声音克隆页
  • 输入待合成文本
  • 上传参考音频
  • 填写参考音频文本
  • 选择语种(可选,默认自动检测)
  • 点击「开始合成」
声音设计页
  • 输入待合成文本
  • 选择语种
  • 设置性别、年龄、音调等属性
  • 点击「开始合成」
高级生成设置
参数
说明
默认值
语速
大于1更快,小于1更慢
1.0
固定时长
设置后忽略语速,按固定秒数生成

推理步数
越高质量越好,越低速度越快
32
引导系数(CFG)
控制生成多样性
2.0
降噪提示
在参考提示中加入降噪标记
开启
预处理参考音频
去静音、裁剪、补标点
开启
后处理输出音频
移除长静音、淡入淡出
开启

四、软件界面使用
软件界面提供更完整的批量处理和管理功能,分为三个页签。

页签一:创建任务
左右分栏布局:

左侧 - 输入区
  • 文本输入框:手动输入或从文件导入
  • 拆分方式:单任务 / 按空行拆分 / 按标点拆分
  • 参考音频选择、音色库下拉
  • 保存当前音色到音色库
右侧 - 配置区
  • 生成模式切换(声音克隆 / 声音设计 / 自动音色)
  • 语种选择(常用语种显示中文名称)
  • 声音设计属性(性别、年龄、音调、口音、方言)
  • 生成参数(步数、引导系数、语速、时长等)
底部操作
  • 预览任务:查看即将生成的任务列表
  • 添加到队列:加入任务列表等待批量处理
  • 立即生成:添加并立刻开始生成
页签二:任务列表
  • 查看所有任务的状态(等待处理 / 处理中 / 已完成 / 失败)
  • 支持操作:处理选中、处理全部、重试失败、重新生成、停止处理
  • 双击任务打开生成的音频文件
  • 右键菜单:查看错误详情、打开结果等
  • 合并已完成音频:将多段音频拼接为一个文件,可设置段落间静音时长
  • 任务自动保存,关闭后重新打开不丢失
页签三:设置
  • 模型目录:可切换不同模型路径,支持重新加载
  • 输出目录:自定义音频输出位置
  • 音色管理:查看、重命名、删除、导入已保存的音色
多角色对话模式
适合有声书、广播剧等场景:
勾选「多角色对话模式」
按格式输入文本:

  1. 小明: 你好,今天天气真好。
  2. 小红: 是啊,我们去公园吧。
  3. 小明: 好主意!
复制代码

点击「角色配置」为每个角色指定专属音色或声音设计
角色配置支持三种模式:
使用当前全局模式:沿用主界面设置
绑定已保存音色:为角色绑定音色库中的音色
角色声音设计:为角色单独设计声音属性
点击「立即生成」,自动按角色逐条生成

五、音色库管理
保存常用的参考音频,方便反复使用:
  • 在「参考音频/音色库」区域选择音频文件
  • 填写参考音频文本
  • 输入音色名称,点击「保存当前音色」
  • 之后在下拉列表中选择即可自动填充音频和文本
音色文件保存在 prompts 目录下(音频文件 + JSON 元数据)。

六、语种支持
支持 600+ 语种,常用语种已汉化显示:
中文、粤语、英语、日语、韩语、法语、德语、西班牙语、俄语、葡萄牙语、阿拉伯语、印地语、泰语、越南语、印尼语、马来语……
语种下拉框显示中文名称,提交给模型时会自动映射回原始英文参数。选择「自动检测」则由模型根据文本内容自动判断。


OmniVoice 语音克隆生成工具下载地址:

链接:https://pan.quark.cn/s/985a043147ff
解压密码: www.aibl.vip
本工具本地离线可用,无任何使用限制





AIBL论坛免责申明
本论坛刊载的所有内容,包括图片、软件、模型等均在网上搜集。
论坛提供的内容仅用于个人学习、研究或欣赏。我们不保证内容的正确性。通过使用本站内容随之而来的风险与本站无关
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|AIBL论坛

GMT+8, 2026-4-5 08:13 , Processed in 0.044412 second(s), 23 queries , Gzip On.

Powered by AI技术论坛 X3.5

© 2001-2026 dfl论坛

快速回复 返回顶部 返回列表