|
|
电脑要求: 显卡需要英伟达8G显存,显卡驱动更新到最新版本
8G显存使用方法: 语音识别使用 FireRedASR2S 模型, 翻译使用 云模型 翻译, 音频生成使用 qwen3TTS
使用教程: https://www.bilibili.com/video/BV19ofvBTEPZ/
使用文档: https://my.feishu.cn/wiki/GNnYwTYfVid1FckV3qxcTdrYngf
目前全网最好的翻译配音工具, 没有之一
https://www.bilibili.com/video/BV1C9foBUERq/
容易出错的地方: 解压路径不用包含中文, 视频名称不要包含特殊符号
批量视频翻译,尽量选择固定的参考音频, 这样TTS生成处理的音频效果更稳定
多音色3.9.5版本新增功能:
导出视频页面新增了 仅保留原视频非字幕时间戳的所有声音
音频分段间隔调整了部分功能
空译文源原音频片段默认保留原时长和原速,不参与分段音频变速,也不附加分段静音间隔。
新增 短句时也加速视频片段(仅策略5和策略6)功能, 当译文音频加当前适用间隔短于原时间槽时, 视频片段也会加速贴合更短配音。原生非字幕空白区与空译文音频片段仍保持原时长和原速。
多音色3.9.1版本新增功能:
修复了视频画面, 音频, 字幕随着时间偏移的bug , 现在翻译配音后的视频音频字幕时间戳对齐更精准
新增 fish-speech-TTS, 翻译配音工具现在支持80多种语言
中文 英语 推荐 indextts (需要12G)
日语、韩语、德语、法语、俄语、葡萄牙语、西班牙语、意大利语 推荐使用 qwen3TTS (8G显存可用)
其他语言使用fish-speech-TTS, 使用fish-speech-TTS需要24G显存才能使用
fishaudio/s2-pro支持80多语言
第一层级:日语 (ja)、英语 (en)、中文 (zh)
第二层级:韩语 (ko)、西班牙语 (es)、葡萄牙语 (pt)、阿拉伯语 (ar)、俄语 (ru)、法语 (fr)、德语 (de)
其他支持的语言:瑞典语 (sv)、意大利语 (it)、土耳其语 (tr)、挪威语 (no)、荷兰语 (nl)、威尔士语 (cy)、巴斯克语 (eu)、加泰罗尼亚语 (ca)、丹麦语 (da)、加利西亚语 (gl)、泰米尔语 (ta)、匈牙利语 (hu)、芬兰语 (fi)、波兰语 (pl)、爱沙尼亚语 (et)、印地语 (hi)、拉丁语 (la)、乌尔都语 (ur)、泰语 (th)、越南语 (vi)、爪哇语 (jw)、孟加拉语 (bn)、约鲁巴语 (yo)、斯洛文尼亚语 (sl)、捷克语 (cs)、斯瓦希里语 (sw)、新挪威语 (nn)、希伯来语 (he)、马来语 (ms)、乌克兰语 (uk)、印尼语 (id)、哈萨克语 (kk)、保加利亚语 (bg)、拉脱维亚语 (lv)、缅甸语 (my)、他加禄语 (tl)、斯洛伐克语 (sk)、尼泊尔语 (ne)、波斯语 (fa)、南非荷兰语 (af)、希腊语 (el)、藏语 (bo)、克罗地亚语 (hr)、罗马尼亚语 (ro)、修纳语 (sn)、毛利语 (mi)、意第绪语 (yi)、阿姆哈拉语 (am)、白俄罗斯语 (be)、高棉语 (km)、冰岛语 (is)、阿塞拜疆语 (az)、信德语 (sd)、布列塔尼语 (br)、阿尔巴尼亚语 (sq)、普什图语 (ps)、蒙古语 (mn)、海地克里奥尔语 (ht)、马拉雅拉姆语 (ml)、塞尔维亚语 (sr)、萨摩亚语 (sa)、泰卢固语 (te)、卡纳达语 (ka)、波斯尼亚语 (bs)、旁遮普语 (pa)、立陶宛语 (lt)、卡纳达语 (kn)、僧伽罗语 (si)、亚美尼亚语 (hy)、马拉地语 (mr)、阿萨姆语 (as)、古吉拉特语 (gu)、法罗语 (fo) 以及更多。
修复其他bug
多音色3.7版本新增功能:
视频翻译现在支持中文 英语 日语、韩语、德语、法语、俄语、葡萄牙语、西班牙语、意大利语
新增 CosyVoice3 和 Qwen3-TTS 语音生成模型
多音色3.6版本新增功能:
新增FireRedASR2S模型, srt字幕文本识别速度更快
多音色3.5版本新增功能:
新增音频分段倍速功能, 可整体加速翻译后的配音
多音色3.3版本新增功能:
为了确保翻译的准确率,新增deepseek, 豆包, kimi2.5以及千问模型的api设置, 用户设置好api key后可以用这些平台翻译, 同时软件也支持其他平台api设置
多音色3.2版本新增功能:
批量处理任务支持编辑功能,支持自定义修改
批量处理页面任务 右键 支持上传视频和字幕功能, 用户同时上传视频和字幕, 可以使用该字幕翻译并配音, 跳过识别步骤
批量处理页面任务 右键 支持上传视频和翻译后的字幕功能, 用户同时上传视频和翻译后的字幕, 可以使用该字幕配音, 跳过识别步骤和翻译步骤
多音色3.1版本更新介绍:
新增混元1.5翻译模型, 导出视频 "增加分段双向折中" 策略(音频加速+视频减速),增加保留原视频自定义声音保留功能, 例如原视频中的"哈哈""啊"等声音可以完美保留
新增批量处理功能, 视频识别使用了阿里最新发布的Qwen3-ASR1.7B模型和Qwen3-ForcedAligner-0.6B时间对齐模型,SRT字幕时间戳识别更准确
waterforest 视频翻译配音工具3.9.5版本:
链接:https://pan.baidu.com/s/1koZ6pLkeARCSggVvOh9w2g?pwd=1kfh
注意: checkpoints 模型文件夹全部下载, 放到 waterforest_3.9.1 目录下
电脑要求: 显卡需要英伟达8G显存,显卡驱动更新到最新版本
容易出错的地方: 解压路径不用包含中文, 视频名称不要包含特殊符号
|
|