三花快讯 · 2025, 6月20日
Kyutai 推出 STT 模型
流式模型性能超越 Whisper Large v3
Kyutai Speech-To-Text 是一款开源的语音转文本模型,支持流式传输和批量推理两种模式,运行速度极快。它提供两个版本:
- 纯英语 2.6B 参数模型 - 即使作为流式模型,在基准测试中表现也优于 Whisper Large v3
- 轻量级 1B 参数双语模型 - 专为英语/法语实时语音聊天应用优化
可惜没有中文,佬们可以直接在官方渠道下载模型、查看代码。
商业转载请联系三花微信公众号获得授权,非商业转载请注明本文出处及文章链接,您可以自由地在任何媒体以任何形式复制和分发作品,也可以修改和创作,但是分发衍生作品时必须采用相同的许可协议。
本文采用 CC BY-NC-SA 4.0 - 非商业性使用 - 相同方式共享 4.0 国际 进行许可。