OmniVoice 语音克隆生成工具,目前速度最快的TTS工具
电脑要求: 英伟达8G显卡及其以上,支持50系列显卡解压路径不要包含中文
OmniVoice 语音克隆生成工具 使用说明
一、项目简介
OmniVoice 是一款支持 600+ 语种 的 AI 语音合成工具,提供两种界面:
界面
启动方式
特点
Web 界面
运行 webui_启动.exe
浏览器操作,简洁直观
软件界面
运行 启动.exe
批量任务队列、音色库管理、多角色对话
二、核心功能
1. 声音克隆
上传一段参考音频(3~10秒为佳),即可复刻说话人的音色来朗读任意文本。
[*]参考音频必须是 wav 格式
[*]需要填写参考音频对应的文本内容,必须输入正确的参考文本内容,如果参考文本内容不准确,生成出来的音频会胡言乱语
[*]使用背景噪声少、说话清晰的参考音频
2. 声音设计
无需参考音频,通过属性组合直接设计声音:
属性
可选项
性别
男、女
年龄
儿童、少年、青年、中年、老年
音调
极低、低、中、高、极高
风格
耳语
英文口音
美式、英式、澳大利亚、中国、印度、韩国、日本等
中文方言
四川话、东北话、河南话、陕西话、云南话、青岛话等
注意:英文口音和中文方言不能同时设置。
3. 自动音色
不提供任何音色条件,由模型自动选择一个声音进行合成。
三、Web 界面使用
启动
双击 webui_启动.exe,等待模型加载完成后,浏览器自动弹出窗口打开 http://127.0.0.1:7860。
声音克隆页
[*]输入待合成文本
[*]上传参考音频
[*]填写参考音频文本
[*]选择语种(可选,默认自动检测)
[*]点击「开始合成」
声音设计页
[*]输入待合成文本
[*]选择语种
[*]设置性别、年龄、音调等属性
[*]点击「开始合成」
高级生成设置
参数
说明
默认值
语速
大于1更快,小于1更慢
1.0
固定时长
设置后忽略语速,按固定秒数生成
空
推理步数
越高质量越好,越低速度越快
32
引导系数(CFG)
控制生成多样性
2.0
降噪提示
在参考提示中加入降噪标记
开启
预处理参考音频
去静音、裁剪、补标点
开启
后处理输出音频
移除长静音、淡入淡出
开启
四、软件界面使用
软件界面提供更完整的批量处理和管理功能,分为三个页签。
页签一:创建任务
左右分栏布局:
左侧 - 输入区
[*]文本输入框:手动输入或从文件导入
[*]拆分方式:单任务 / 按空行拆分 / 按标点拆分
[*]参考音频选择、音色库下拉
[*]保存当前音色到音色库
右侧 - 配置区
[*]生成模式切换(声音克隆 / 声音设计 / 自动音色)
[*]语种选择(常用语种显示中文名称)
[*]声音设计属性(性别、年龄、音调、口音、方言)
[*]生成参数(步数、引导系数、语速、时长等)
底部操作
[*]预览任务:查看即将生成的任务列表
[*]添加到队列:加入任务列表等待批量处理
[*]立即生成:添加并立刻开始生成
页签二:任务列表
[*]查看所有任务的状态(等待处理 / 处理中 / 已完成 / 失败)
[*]支持操作:处理选中、处理全部、重试失败、重新生成、停止处理
[*]双击任务打开生成的音频文件
[*]右键菜单:查看错误详情、打开结果等
[*]合并已完成音频:将多段音频拼接为一个文件,可设置段落间静音时长
[*]任务自动保存,关闭后重新打开不丢失
页签三:设置
[*]模型目录:可切换不同模型路径,支持重新加载
[*]输出目录:自定义音频输出位置
[*]音色管理:查看、重命名、删除、导入已保存的音色
多角色对话模式
适合有声书、广播剧等场景:
勾选「多角色对话模式」
按格式输入文本:
小明: 你好,今天天气真好。
小红: 是啊,我们去公园吧。
小明: 好主意!
点击「角色配置」为每个角色指定专属音色或声音设计
角色配置支持三种模式:
使用当前全局模式:沿用主界面设置
绑定已保存音色:为角色绑定音色库中的音色
角色声音设计:为角色单独设计声音属性
点击「立即生成」,自动按角色逐条生成
五、音色库管理
保存常用的参考音频,方便反复使用:
[*]在「参考音频/音色库」区域选择音频文件
[*]填写参考音频文本
[*]输入音色名称,点击「保存当前音色」
[*]之后在下拉列表中选择即可自动填充音频和文本
音色文件保存在 prompts 目录下(音频文件 + JSON 元数据)。
六、语种支持
支持 600+ 语种,常用语种已汉化显示:
中文、粤语、英语、日语、韩语、法语、德语、西班牙语、俄语、葡萄牙语、阿拉伯语、印地语、泰语、越南语、印尼语、马来语……
语种下拉框显示中文名称,提交给模型时会自动映射回原始英文参数。选择「自动检测」则由模型根据文本内容自动判断。
OmniVoice 语音克隆生成工具下载地址:
链接:https://pan.quark.cn/s/985a043147ff
解压密码: www.aibl.vip
本工具免费分享,无任何使用限制,本地离线可用
OmniVoice 语音克隆生成工具下载地址(此版本支持srt字幕):
***本内容需购买可见***
谢谢大佬分享! 谢谢大佬的无私分享,感谢感谢! 大佬,有没有支持山西这边方言的tts,下了好多tts,生成的都别扭的不行!~ 666哈哈哈哈哈哈哈谢谢
页:
[1]