三花快讯 · 2024, 7月9日
Swift: 超快开源 AI 语音助手
速度非常的快
Swift 是一个开源的 AI 语音助手,速度非常的快,使用如下技术方案实现:
- Groq: 用于 OpenAI Whisper 和 Meta Llama 3 的快速推理,前者用于转录,后者用于生成文本回复。
- Cartesia: 使用其 Sonic 语音模型进行快速语音合成,并将合成的语音流式传输到前端。
- VAD (Voice Activity Detection): 语音活动检测,用于检测用户何时在说话
商业转载请联系三花微信公众号获得授权,非商业转载请注明本文出处及文章链接,您可以自由地在任何媒体以任何形式复制和分发作品,也可以修改和创作,但是分发衍生作品时必须采用相同的许可协议。
本文采用 CC BY-NC-SA 4.0 - 非商业性使用 - 相同方式共享 4.0 国际 进行许可。