三花快讯 · 2024, 7月17日

Mistral AI: 推出全新架构模型和数学推理模型

转为代码和数学的两个模型

  • Codestral Mamba 7B: 基于 Mamba2 架构的 256K 上下文的模型,专注于代码生成。该模型在某些基准测试上的表现超过 22B 的非 Mamba 架构的 Codestral
  • MathΣtral 7B:一个专为数学推理和科学发现设计的 7B 模型,在大部分数学方面的基准测试表现上力压同参数量的 DeepSeek、Llama3、Gemma2 和 Qwen2

商业转载请联系三花微信公众号获得授权,非商业转载请注明本文出处及文章链接,您可以自由地在任何媒体以任何形式复制和分发作品,也可以修改和创作,但是分发衍生作品时必须采用相同的许可协议。

本文采用 CC BY-NC-SA 4.0 - 非商业性使用 - 相同方式共享 4.0 国际 进行许可。