微软推出突破性 MAI 系列：1 秒生成 1 分钟语音的 TTS 模型 | 三花 AI | 免费 AI 应用 | 1000+ AI 导航合集

微软 AI最新发布了文本转语音(TTS)模型 MAI-Voice-1 与基础大模型 MAI-1-preview:

MAI-Voice-1 为高效语音合成系统，仅需单 GPU （官方没说是啥GPU）即可在 1 秒内生成 60 秒音频，是目前最高效的语音系统之一。

MAI-1-preview 采用混合专家架构(MoE)，在 LMArena 大模型竞技场中位列全球第 13 位。

佬们可以在这里看完整技术细节

商业转载请联系三花微信公众号获得授权，非商业转载请注明本文出处及文章链接，您可以自由地在任何媒体以任何形式复制和分发作品，也可以修改和创作，但是分发衍生作品时必须采用相同的许可协议。

Zed 推出 ACP 协议：标准化编辑器与 Agent 通信

早期开发阶段社区已开发 Bridge 尝试

OpenAI 发布 GPT-Realtime 及 Realtime API：实时语音模型全面升级

新增两款声音 Cedar 与 Marin 并优化八种现有声音