阿里通义 Qwen3 重磅发布：小模型吊打大模型，MoE 架构效率惊人 | 三花 AI | 免费 AI 应用 | 1000+ AI 导航合集

阿里通义 Qwen3 系列大模型正式推出，本次开源了 2 个 MoE 模型和 6 个密集模型。旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中表现出色，与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等顶级模型不相上下。

小型 MoE 模型 Qwen3-30B-A3B 仅需激活 QwQ-32B 10% 的参数就能实现更优表现；

Qwen3-4B 这样的小模型能匹敌 Qwen2.5-72B-Instruct 的性能

Qwen3 提供两种智能模式选择：

Qwen3 还特别强化了 Agent 和代码能力，同时加强了对 MCP 的支持。

现在已经在 Qwen Chat 上免费使用啦！

不过，我看了下阿里百炼的 API 接入还没出，可能还要再等等。

商业转载请联系三花微信公众号获得授权，非商业转载请注明本文出处及文章链接，您可以自由地在任何媒体以任何形式复制和分发作品，也可以修改和创作，但是分发衍生作品时必须采用相同的许可协议。

Qafind 实验室发布 ChatDLM：2800 tokens/秒的极速扩散语言模型

13 万 tokens 超长上下文处理能力

DeepSeek-R1T-Chimera：推理能力与 token 效率的完美结合

输出更简洁推理更紧凑媲美 o1