近日,小红书旗下的 FireRed 团队推出了全新的开源语音识别模型——FireRedASR。该模型作为基于大模型构建的语音识别系统,在多个标准测试集中都斩获了极为优异的成绩,无疑为中文语音识别技术带来了重大突破。

FireRedASR 的核心指标是字错误率(CER),该指标越低,表示模型的识别效果越好。在最近的公开测试中,FireRedASR 的 CER 达到了3.05%,较之前的最佳模型 Seed-ASR 降低了8.4%。这一结果显示出 FireRed 团队在语音识别技术上的创新能力。
FireRedASR 模型分为两种核心结构:FireRedASR-LLM 和 FireRedASR-AED。前者专注于极致的语音识别精度,后者则在准确率与推理效率之间实现了良好的平衡。团队提供了不同规模的模型和推理代码,以满足各种应用场景的需求。
在多个日常应用场景中,FireRedASR 同样展现了强大的性能。在由短视频、直播和语音输入等多种来源组成的测试集中,FireRedASR-LLM 的 CER 相较于业内领先的服务提供商降低了23.7% 至40%。特别是在需要歌词识别的场景中,该模型的表现尤为突出,CER 实现了50.2% 至66.7% 的相对降低。
此外,FireRedASR 还在中文方言和英语场景中表现优异,其 CER 在 KeSpeech 和 LibriSpeech 测试集上显著优于之前的开源模型,证明其在多种语言环境中的鲁棒性和适应性。
FireRed 团队希望通过开源这一新模型,推动语音识别技术的发展和应用,为语音交互的未来贡献力量。所有模型和代码已在 GitHub 上公开,鼓励更多开发者和研究者参与其中。
真实双人插画动漫-真实双人插画动漫永久版v15.8.6
08-30
随着互联网和数字文化的不断发展,动漫艺术逐渐融入了更多现实元素,形成了新的潮流。真实双人插画动漫永久版正是这种潮流的代表之一,受到了越来越多动漫爱好者的青睐。这款软件不
久久文化传媒有限公司在哪-久久文化传媒有限公司在哪无限次数版v14.12.14
08-30
久久文化传媒有限公司在哪无限次数版是当前最受关注的企业之一,尤其在文化传媒领域引起了广泛关注。作为国内知名的文化传播平台,久久文化传媒致力于多元化的影视、广
蒙阴蜜桃-蒙阴蜜桃国语免费版v4.6.9
08-30
随着手机应用市场的快速发展,各类APP层出不穷,其中不乏一些独特的热门应用。蒙阴蜜桃国语免费版便是其中一款备受瞩目的应用,它凭借其独特的功能和优化的用户体验,吸引了众多用户的关注