AIBL论坛

 找回密码
 立即注册
本论坛所有软件旨在帮助用户创建逼真且有趣的内容,帮助做自媒体的人制作原创有趣的视频或广告,如果使用别人的肖像,使用之前需获得同意和许可(建议使用AI生成的人脸),严禁使用本论坛发布的资源用于不符合当地法律法规的事情
查看: 63|回复: 0

VoxCPM2.0.2语音克隆生成工具,支持30多种语言

[复制链接]
发表于 昨天 16:09 | 显示全部楼层 |阅读模式
VoxCPM 是一个无分词器的文本转语音系统,通过端到端扩散自回归架构直接生成连续语音表示,绕过离散分词化,实现高度自然且富有表现力的综合效果。
VoxCPM2 是最新的重大版本——一个2B参数模型,基于超过200万小时的多语言语音数据训练,现支持30种语言、语音设计、可控语音克隆和48kHz录音室级音频输出。基于MiniCPM-4骨干构建。
1.jpg 2.jpg
✨ 亮点
  • 🌍 30 语言多语 — 输入支持的 30 种语言中的任意文本,直接合成,无需语言标签
  • 🎨 声音设计——仅凭自然语言描述(性别、年龄、语调、情感、节奏等)创造全新的声音,无需参考音频
  • 🎛️ 可控克隆——从短参考片段中克隆任何声音,并可选择风格指导以引导情感、节奏和表情,同时保持原始音色
  • 🎙️ 终极克隆——再现每一个人声细微差别:同时提供参考音频及其文字记录,模型从参考无缝延续,忠实保存每一个声音细节——音色、节奏、情感和风格(与VoxCPM1.5相同)
  • 🔊 48kHz 高质量音频 — 接受 16kHz 参考音频,并通过 AudioVAE V2 的非对称编码/解码设计直接输出 48kHz 录音室品质音频,内置超分辨率——无需外部上采样器
  • 🧠 上下文感知综合——自动从文本内容推断适当的韵律和表现力
  • ⚡ 实时流媒体 — 在NVIDIA RTX 4090上最低为~0.3的RTF,通过Nano-VLLM加速的~0.13
  • 📜 完全开源且商业化准备——权重和代码以 Apache-2.0 许可证发布,商业使用免费
🌍 支持的语言(30种)
阿拉伯语、缅甸语、中文、丹麦语、荷兰语、英语、芬兰语、法语、德语、希腊语、希伯来语、印地语、印尼语、意大利语、日语、高棉语、韩语、老挝语、马来语、挪威语、波兰语、葡萄牙语、俄语、西班牙语、斯瓦希里语、瑞典语、他加禄语、泰语、土耳其语、越南语
中文方言:四川话、粤语、吴语、东北话、河南话、陕西话、山东话、天津话、闽南话

VoxCPM2.0.2语音克隆生成工具下载地址:
链接:https://pan.quark.cn/s/76dd372b8709
解压密码: www.aibl.vip

本工具免费分享,无任何使用限制,本地离线可用


AIBL论坛免责申明
本论坛刊载的所有内容,包括图片、软件、模型等均在网上搜集。
论坛提供的内容仅用于个人学习、研究或欣赏。我们不保证内容的正确性。通过使用本站内容随之而来的风险与本站无关
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|AIBL论坛

GMT+8, 2026-4-10 04:06 , Processed in 0.042443 second(s), 25 queries , Gzip On.

Powered by AI技术论坛 X3.5

© 2001-2026 dfl论坛

快速回复 返回顶部 返回列表