三花快讯 · 2025, 2月12日
小红书开源 FireRedASR:支持普通话、方言和英文的语音识别模型
两种解决方案追求极致性能或平衡效率
FireRedASR 是小红书开源的语音识别模型,支持识别普通话、方言和英文。它分为两个版本:
- FireRedASR-LLM:效果最佳,普通话识别开源领先,利用 LLM 处理语音数据。
- FireRedASR-AED:采用 AED 架构,兼顾效率和效果。
简单来说,FireRedASR 提供了两种不同的解决方案,一种追求极致的性能,另一种则在性能和效率之间找到平衡。目前代码和模型已经开源。
商业转载请联系三花微信公众号获得授权,非商业转载请注明本文出处及文章链接,您可以自由地在任何媒体以任何形式复制和分发作品,也可以修改和创作,但是分发衍生作品时必须采用相同的许可协议。
本文采用 CC BY-NC-SA 4.0 - 非商业性使用 - 相同方式共享 4.0 国际 进行许可。