Fun-ASR高精度语音识别解压即用整合包
整合包支持音频、视频和实时麦克风语音转文本,音频、视频支持批量转录功能视频演示 : https://www.bilibili.com/video/BV1sWqSB6EJC/
https://www.bilibili.com/video/BV1rDBpBcErf/
Fun-ASR 是通义实验室推出的一款端到端语音识别大模型。它基于数千万小时的真实语音数据训练而成,具备强大的上下文理解能力和行业适应性。支持低延迟实时转写,覆盖31种语言。在教育、金融等垂直领域表现出色,能够精准识别专业术语和行业表达,有效解决“幻觉”生成和语言混淆等问题,实现“听得清、懂得意、写得准”。
Fun-ASR 专注于高精度语音识别、多语言支持和行业定制能力
远场高噪声识别: 针对远距离拾音和高噪声场景(如会议室、车内环境、工业现场等)进行了深度优化,将识别准确率提高到93%。
中文方言和地区口音:
支持7种主要方言:吴语、粤语、闽语、客家话、赣语、湘语、晋语
覆盖26种地区口音:包括河南、陕西、湖北、四川、重庆、云南、贵州、广东、广西等20多个地区
多语言自由对话: 支持31种语言的识别,重点优化了东亚和东南亚的语言,支持自由切换语言和混合识别。
音乐背景下的歌词识别: 在音乐背景干扰下增强语音识别性能,支持歌曲中歌词内容的准确识别。
电脑要求:
1、推荐英伟达显卡8G及其以上
2、系统要求:win10、win11
Fun-ASR高精度语音识别解压即用整合包:
下载链接: https://pan.quark.cn/s/ea9e9698712d
解压密码: www.aibl.vip
Fun-ASR高精度语音识别解压即用整合包( 支持长视频 ):
下载链接: https://pan.quark.cn/s/bdbc6dd8064d
解压密码: www.aibl.vip
亲测好用,识别速度很快,有几个错别字,粘到word里一校对就可用了,感谢大佬的分享! 这个作者是有大爱的人。无私奉献的人。
页:
[1]