meiyouruguo 发表于 2025-12-21 19:42:43

Fun-ASR高精度语音识别解压即用整合包

整合包支持音频、视频和实时麦克风语音转文本,音频、视频支持批量转录功能
视频演示 : https://www.bilibili.com/video/BV1sWqSB6EJC/
https://www.bilibili.com/video/BV1rDBpBcErf/

Fun-ASR 是通义实验室推出的一款端到端语音识别大模型。它基于数千万小时的真实语音数据训练而成,具备强大的上下文理解能力和行业适应性。支持低延迟实时转写,覆盖31种语言。在教育、金融等垂直领域表现出色,能够精准识别专业术语和行业表达,有效解决“幻觉”生成和语言混淆等问题,实现“听得清、懂得意、写得准”。

Fun-ASR 专注于高精度语音识别、多语言支持和行业定制能力
远场高噪声识别: 针对远距离拾音和高噪声场景(如会议室、车内环境、工业现场等)进行了深度优化,将识别准确率提高到93%。
中文方言和地区口音:
支持7种主要方言:吴语、粤语、闽语、客家话、赣语、湘语、晋语
覆盖26种地区口音:包括河南、陕西、湖北、四川、重庆、云南、贵州、广东、广西等20多个地区
多语言自由对话: 支持31种语言的识别,重点优化了东亚和东南亚的语言,支持自由切换语言和混合识别。
音乐背景下的歌词识别: 在音乐背景干扰下增强语音识别性能,支持歌曲中歌词内容的准确识别。

电脑要求:
1、推荐英伟达显卡8G及其以上
2、系统要求:win10、win11






Fun-ASR高精度语音识别解压即用整合包:
下载链接: https://pan.quark.cn/s/ea9e9698712d
解压密码: www.aibl.vip


Fun-ASR高精度语音识别解压即用整合包( 支持长视频 ):
下载链接: https://pan.quark.cn/s/bdbc6dd8064d
解压密码: www.aibl.vip



blood_b 发表于 2025-12-22 13:58:52

亲测好用,识别速度很快,有几个错别字,粘到word里一校对就可用了,感谢大佬的分享!

wowkof 发表于 5 天前

这个作者是有大爱的人。无私奉献的人。
页: [1]
查看完整版本: Fun-ASR高精度语音识别解压即用整合包