dots.tts声音克隆工具，支持SRT字幕多角色配音，本地离线整合包

meiyouruguo · 发表于昨天 16:33

dots.tts 文本转语音项目
声音克隆 · 批量任务 · SRT 字幕配音 · 48kHz 高音质 · 全程离线

📌 这是什么

dots.tts 是小红书开源的 2B 参数全连续自回归 TTS 模型，48kHz 采样率，零样本声音克隆效果在 Seed-TTS-Eval 等多个评测上达到开源第一梯队（中文 WER 0.94%）。

整合包本地离线，支持批量队列、音色库、SRT 字幕多角色配音。

✨ 功能特色

🚀 三步上手

🎬 SRT 多角色配音教程

字幕文本支持三种说话人标记写法，任选其一：

复制代码

自动匹配规则：先在「设置 → 音色库管理」里把角色声音按名字保存（音色就叫“张三”“李四”），之后导入 SRT 时同名说话人自动绑定对应音色，全部匹配上连弹窗都不弹，直接添加任务开跑。

整组字幕合成完毕后自动按时间轴混音输出 文件名_整轨.wav，丢进剪辑软件和字幕严丝合缝。

🎛 参数速查

克隆小技巧：参考音频选 3~10 秒、干净无背景音的人声，并务必填写参考音频的文字转写（continuation 克隆模式），相似度明显高于只传音频。

💻 配置要求与实测

❓ 常见问题

问：不传参考音频能用吗？答：能，但底模是随机音色，每次声音都不一样，正经用法是配参考音频克隆
问：SRT 某句配出来比字幕时长长怎么办？答：软件自动调用 ffmpeg 变速压缩进时间窗，任务详情里能看到压缩比；压缩比太狠（>1.3）建议精简那句文案
问：任务失败了怎么看原因？答：任务列表里双击该任务，详情里有完整错误信息
问：模型放哪？答：整合包已内置 pretrained_models\dots_tts_model，也可以在设置页指向自己微调过的模型目录

dots.tts声音克隆工具，支持SRT字幕多角色配音，本地离线整合包

下载地址：https://pan.quark.cn/s/1ed27fbd9ae8
解压密码： aibbs.fun

本工具免费分享,无任何使用限制,本地离线可用

声明：dots.tts 模型与代码均为 Apache-2.0 开源协议。声音克隆请勿用于伪造他人声音、诈骗等违法用途，AI 生成音频请显著标注。

jandown · 发表于昨天 18:33

长文本太慢了

		自动登录	找回密码
密码			立即注册