Mercury：首个商用大语言扩散模型 | 三花 AI | 免费 AI 应用 | 1000+ AI 导航合集

Mercury 是由 Inception Labs 推出的一种新型大语言模型，该模型采用扩散模型技术，允许模型一次性生成多个 token，从而极大提升了生成速度。

在 NVIDIA H100 GPU 上能够以超过 1000 个 token/秒的速度生成响应，比传统模型快约 10 倍，编程性能差不多相当于 GPT-4o-mini。

目前，Mercury 只支持在官方使用或者接入 API 调用（需要申请）。

如果你对大语言扩散模型感兴趣，可以看看前几天介绍过的开源大语言扩散模型 LLaDA。

商业转载请联系三花微信公众号获得授权，非商业转载请注明本文出处及文章链接，您可以自由地在任何媒体以任何形式复制和分发作品，也可以修改和创作，但是分发衍生作品时必须采用相同的许可协议。

Ideogram 2a 发布：速度快、成本低的文生图模型

生成速度提升两倍低质量 Turbo 模型仅需 US $0.025

微软开源多模态模型 Phi-4-Multimodal 和轻量化 Phi-4-Mini

Phi-4-Multimodal 视觉基准相当于 GPT-4o