Fun-ASR高精度语音识别解压即用整合包

meiyouruguo 发表于 2025-12-21 19:42:43

整合包支持音频、视频和实时麦克风语音转文本,音频、视频支持批量转录功能
视频演示 : https://www.bilibili.com/video/BV1sWqSB6EJC/
https://www.bilibili.com/video/BV1rDBpBcErf/

Fun-ASR 是通义实验室推出的一款端到端语音识别大模型。它基于数千万小时的真实语音数据训练而成，具备强大的上下文理解能力和行业适应性。支持低延迟实时转写，覆盖31种语言。在教育、金融等垂直领域表现出色，能够精准识别专业术语和行业表达，有效解决“幻觉”生成和语言混淆等问题，实现“听得清、懂得意、写得准”。

Fun-ASR 专注于高精度语音识别、多语言支持和行业定制能力
远场高噪声识别：针对远距离拾音和高噪声场景（如会议室、车内环境、工业现场等）进行了深度优化，将识别准确率提高到93%。
中文方言和地区口音：
支持7种主要方言：吴语、粤语、闽语、客家话、赣语、湘语、晋语
覆盖26种地区口音：包括河南、陕西、湖北、四川、重庆、云南、贵州、广东、广西等20多个地区
多语言自由对话：支持31种语言的识别，重点优化了东亚和东南亚的语言，支持自由切换语言和混合识别。
音乐背景下的歌词识别：在音乐背景干扰下增强语音识别性能，支持歌曲中歌词内容的准确识别。

电脑要求：
1、推荐英伟达显卡8G及其以上
2、系统要求：win10、win11

Fun-ASR高精度语音识别解压即用整合包:
下载链接: https://pan.quark.cn/s/ea9e9698712d
解压密码: www.aibl.vip

Fun-ASR高精度语音识别解压即用整合包( 支持长视频 ):
下载链接: https://pan.quark.cn/s/bdbc6dd8064d
解压密码: www.aibl.vip

blood_b 发表于 2025-12-22 13:58:52

亲测好用，识别速度很快，有几个错别字，粘到word里一校对就可用了，感谢大佬的分享！

wowkof 发表于 2026-1-2 07:45:14

这个作者是有大爱的人。无私奉献的人。

CGsunny 发表于 2026-1-9 10:46:49

清问报这个错误怎么解决：
CUDA error: no kernel image is available for execution on the device
Search for `cudaErrorNoKernelImageForDevice' in https://docs.nvidia.com/cuda/cuda-runtime-api/group__CUDART__TYPES.html for more information.
CUDA kernel errors might be asynchronously reported at some other API call, so the stacktrace below might be incorrect.
For debugging consider passing CUDA_LAUNCH_BLOCKING=1
Compile with `TORCH_USE_CUDA_DSA` to enable device-side assertions.

meiyouruguo 发表于 2026-1-9 11:17:18

CGsunny 发表于 2026-1-9 10:46
清问报这个错误怎么解决：
CUDA error: no kernel image is available for execution on the device
Search ...
什么显卡,先更新一下显卡驱动

一百万只大象 发表于 2026-1-19 17:45:57

大佬能向你购买这个整合包制作的详细教程吗

页: [1]

AIBL论坛's Archiver

Fun-ASR高精度语音识别解压即用整合包