meiyouruguo 发表于 2024-11-12 12:13:54

CosyVoice解压即用整合包20241222更新

CosyVoice专注自然语音生成,支持多语言、音色和情感控制,支持中英日粤韩5种语言的生成,效果显著优于传统语音生成模型。
仅需要3~10s的原始音频,CosyVoice即可生成模拟音色,甚至包括韵律、情感等细节,包括跨语种语音生成
电脑配置要求:
1、英伟达显卡8G以上;
2、系统要求win10、win11;
使用过程中容易出错的地方:
软件路径不要包含中文

CosyVoice项目地址: https://github.com/FunAudioLLM/CosyVoice
视频演示: https://www.bilibili.com/video/BV1WgUAYCETi/




CosyVoice解压即用整合包20241222更新下载地址(整合包由刘悦的技术博客制作):
新版CosyVoice2整合包一键包: https://pan.quark.cn/s/ae879e9d5d04

CosyVoice解压即用整合包20241127更新下载地址:
链接: https://pan.baidu.com/s/1dqPU5NbikAdogA68pZLJng?pwd=ftn5
解压密码: www.aibl.vip










DFL小白02 发表于 2024-11-12 19:24:08

和GPT-SOVITS比起来哪个更好?

wo8155 发表于 2024-11-14 21:52:07

出来冒泡:)

wsguibu 发表于 2024-11-16 00:10:18

容易出错,点生成音频会一直生成中。一直数秒,但是不生成音频

meiyouruguo 发表于 2024-11-16 07:40:30

wsguibu 发表于 2024-11-16 00:10
容易出错,点生成音频会一直生成中。一直数秒,但是不生成音频

什么显卡,

wsguibu 发表于 2024-11-21 16:16:38

meiyouruguo 发表于 2024-11-16 07:40
什么显卡,

显卡是306012G

九曲离火 发表于 2024-11-23 16:38:04

感觉这个是不是不能生成长篇的音频啊,只能生成一段话,要一段一段生成了,下载了再自己拼起来。

meiyouruguo 发表于 2024-11-27 09:22:43

九曲离火 发表于 2024-11-23 16:38
感觉这个是不是不能生成长篇的音频啊,只能生成一段话,要一段一段生成了,下载了再自己拼起来。 ...

可以生成长篇文字, 长篇文字的话, 生成的结果是一段一段的音频, 在软件目录的 temp 文件夹里边, 按照修改时间排序, 有一段一段的短音频, 拼合到一起就行了

meiyouruguo 发表于 2024-11-27 09:23:26

wsguibu 发表于 2024-11-21 16:16
显卡是306012G

多摸索一下就知道如何用了

569649905 发表于 2024-11-28 10:37:02

又是英伟达专用····
页: [1] 2
查看完整版本: CosyVoice解压即用整合包20241222更新