阿里发布 CosyVoice 2.0：双向流媒体与发音优化 | 三花 AI | 免费 AI 应用 | 1000+ AI 导航合集

阿里发布了 CosyVoice 2.0 文本转语音模型，该版本不仅支持文本和语音的双向流媒体，还在绕口令、多音字和生僻字的发音错误上减少了 30%-50%。此外，模型还进行了其他性能改进。

目前代码已经开源，也有在线演示。效果是真的厉害，就是推理速度非常的慢，希望后续能优化一下。

商业转载请联系三花微信公众号获得授权，非商业转载请注明本文出处及文章链接，您可以自由地在任何媒体以任何形式复制和分发作品，也可以修改和创作，但是分发衍生作品时必须采用相同的许可协议。

OpenAI 推出打电话和发短信给 ChatGPT

打电话或发短信来与 ChatGPT 交流

OpenAI 推出 o1 推理模型 API，支持 WebRTC 和全新微调方法

新 SDK 发布及价格降低详情见公告