三花快讯 · 2024, 9月20日
阿里通义千问:Qwen2.5 基础模型大派对
性能强、体积小、运行快、价格还便宜
相信大家都已经知道了,阿里昨天开源了 Qwen2.5 系列模型,除了 32B 和 72B 的版本外均可商用。
今天凌晨,知名基准测试分析平台 Artificial Analysis 终于更新了其具体排名数据,72B 模型在 MMLU 得分仅比参数量更大的 Llama 3.1 405B 低 1%,在数学能力上超越 GPT-4o,编程能力上超越 GPT-4o-mini。
对比 Llama 3.1 405B,它体积小,同硬件水平运行速度快,支持 128k 的上下文窗口和 8k 输出 tokens。
此外,模型的价格也相对比较低,1M Tokens 输入输出的价格分别为 0.38/0.4 美元,GPT4-o 为 2.5/10 美元
商业转载请联系三花微信公众号获得授权,非商业转载请注明本文出处及文章链接,您可以自由地在任何媒体以任何形式复制和分发作品,也可以修改和创作,但是分发衍生作品时必须采用相同的许可协议。
本文采用 CC BY-NC-SA 4.0 - 非商业性使用 - 相同方式共享 4.0 国际 进行许可。