AIBL论坛

 找回密码
 立即注册
本论坛所有软件旨在帮助用户创建逼真且有趣的内容,帮助做自媒体的人制作原创有趣的视频或广告,如果使用别人的肖像,使用之前需获得同意和许可(建议使用AI生成的人脸),严禁使用本论坛发布的资源用于不符合当地法律法规的事情
查看: 36|回复: 1

FireRedASR2S视频音频转录识别成srt字幕文本工具

[复制链接]
发表于 昨天 20:45 | 显示全部楼层 |阅读模式
FireRedASR2S 是一款最先进的(SOTA)、工业级一体化 ASR 系统,配备 ASR、VAD、LID 和 Punc 模块。所有模块均实现SOTA性能:
  • FireRedASR2:自动语音识别(ASR),支持中文(普通话、20+方言/口音)、英语、代码切换和歌词识别。普通话(4个测试集)平均CER为2.89%,汉语方言(19个测试)为11.55%,优于豆宝ASR、Qwen3-ASR-1.7B、Fun-ASR和Fun-ASR-Nano-2512。FireRedASR2-AED 还支持字级时间戳和置信度评分。
  • FireRedVAD:支持100+语言语音/歌唱/音乐的语音活动检测(VAD)。97.57%的F1表现优于Silero-VAD、TEN-VAD和FunASR-VAD。支持非流媒体/流媒体VAD和音频事件检测。
  • FireRedLID:口语识别(LID),支持100+种语言和20+种中文方言/口音。准确率97.18%,优于Whisper和SpeechBrain-LID。
  • FireRedPunc:中文和英文的标点预测(Punc)。78.90%的平均F1表现优于FunASR-Punc(62.77%)。

1.jpg

FireRedASR2S视频音频转录识别成srt字幕文本工具下载地址:
链接:https://pan.quark.cn/s/c9813896824c
解压密码: www.aibl.vip

AIBL论坛免责申明
本论坛刊载的所有内容,包括图片、软件、模型等均在网上搜集。
论坛提供的内容仅用于个人学习、研究或欣赏。我们不保证内容的正确性。通过使用本站内容随之而来的风险与本站无关
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

0

主题

14

回帖

56

积分

中级丹童

积分
56
发表于 昨天 22:37 来自手机 | 显示全部楼层
谢谢大佬分享!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|AIBL论坛

GMT+8, 2026-3-3 06:27 , Processed in 0.046984 second(s), 25 queries , Gzip On.

Powered by AI技术论坛 X3.5

© 2001-2026 dfl论坛

快速回复 返回顶部 返回列表