小米开源 MiMo-Audio：7B 通用音频模型 | 三花 AI | 免费 AI 应用 | 1000+ AI 导航合集

MiMo-Audio 是小米推出的开源 7B 通用音频大模型，使用 1 亿小时语音完成预训练。它能够零样本理解复杂音频并推理来源，还能按文本指令实时合成高自然度语音。更厉害的是，它可以直接在上下文中完成风格转换、语音翻译和声音编辑等任务。

官方还表示，这模型在各项基准上超越了 Gemini-2.5-Flash 和 GPT-4o-Audio，是当前最强开源音频模型。

商业转载请联系三花微信公众号获得授权，非商业转载请注明本文出处及文章链接，您可以自由地在任何媒体以任何形式复制和分发作品，也可以修改和创作，但是分发衍生作品时必须采用相同的许可协议。

阿里开源 Wan2.2-Animate：动作驱动的数字人模型

效果超强支持动作表情对口型

GitHub 突发调整：Copilot 暂停向中国大陆用户提供 Claude 模型服务

官方未发公告推测是应 Anthropic 要求