三花快讯 · 2024, 7月9日

Swift: 超快开源 AI 语音助手

速度非常的快

Swift 是一个开源的 AI 语音助手,速度非常的快,使用如下技术方案实现:

  • Groq: 用于 OpenAI WhisperMeta Llama 3 的快速推理,前者用于转录,后者用于生成文本回复。
  • Cartesia: 使用其 Sonic 语音模型进行快速语音合成,并将合成的语音流式传输到前端。
  • VAD (Voice Activity Detection): 语音活动检测,用于检测用户何时在说话

商业转载请联系三花微信公众号获得授权,非商业转载请注明本文出处及文章链接,您可以自由地在任何媒体以任何形式复制和分发作品,也可以修改和创作,但是分发衍生作品时必须采用相同的许可协议。

本文采用 CC BY-NC-SA 4.0 - 非商业性使用 - 相同方式共享 4.0 国际 进行许可。