三花快讯 · 2025, 2月28日

Mercury:首个商用大语言扩散模型

比传统模型快约 10 倍

Mercury 是由 Inception Labs 推出的一种新型大语言模型,该模型采用扩散模型技术,允许模型一次性生成多个 token,从而极大提升了生成速度。

在 NVIDIA H100 GPU 上能够以超过 1000 个 token/秒 的速度生成响应,比传统模型快约 10 倍,编程性能差不多相当于 GPT-4o-mini。

目前,Mercury 只支持在官方使用或者接入 API 调用(需要申请)。

如果你对大语言扩散模型感兴趣,可以看看前几天介绍过的开源大语言扩散模型 LLaDA

商业转载请联系三花微信公众号获得授权,非商业转载请注明本文出处及文章链接,您可以自由地在任何媒体以任何形式复制和分发作品,也可以修改和创作,但是分发衍生作品时必须采用相同的许可协议。

本文采用 CC BY-NC-SA 4.0 - 非商业性使用 - 相同方式共享 4.0 国际 进行许可。