计算机行业：阿里QWEN3发布超越DEEPSEEK-R1等登顶全球最强开源模型

本报告导读：

采用MoE 架构的阿里Qwen3 正式发布，登顶全球最强开源大模型，性能全面超越DeepSeek-R1和 OpenAI o1，尤其在 Agent领域，Qwen3表现优异。

投资要点：

投资建议：我们认为，阿里此次 Qwen3 的发布，再次印证了我国头部AI 公司的技术水平已经位列世界顶尖水平，开源的8 款模型，对整个AI 行业的发展都将起到重要的促进作用。Qwen3 在评估模型Agent 能力的BFCL 取得新高成绩，这说明Qwen3 能为即将到来的智能体Agent 和大模型应用爆发提供了更好的支持，阿里此次专门宣布正前往“以训练Agent 为中心的时代”，未来AI Agent 时代有望加速到来，维持计算机板块“增持”评级，推荐标的：合合信息、赛意信息、鼎捷数智、虹软科技、万兴科技、金蝶国际、金山办公、海光信息、寒武纪。

阿里发布Qwen-3，登顶全球最强开源模型。4 月29 日凌晨，阿里巴巴推出Qwen3，系列的旗舰模型Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中仅在部分指标落后Gemini-2.5-Pro，全面超越DeepSeek-R1、o1、o3-mini、Grok-3 等顶级模型。此外，小型MoE 模型Qwen3-30B-A3B 的激活参数数量是QwQ-32B 的10%，表现更胜一筹，甚至像Qwen3-4B 这样的小模型也能匹敌Qwen2.5-72B-Instruct 的性能。此次，阿里开源了两个MoE 模型的权重：

Qwen3-235B-A22B（代表拥有2350 多亿总参数和220 多亿激活参数）和Qwen3-30B-A3B。此外，六个Dense 模型也已开源，包括Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和Qwen3-0.6B，均在Apache2.0 许可下开源。

Qwen3 支持两种思考模型，数据集达到36 万亿tokens。Qwen3 模型支持两种思考模式：思考模式：模型会逐步推理，经过深思熟虑后给出最终答案。这种方法非常适合需要深入思考的复杂问题。非思考模式：模型提供快速、近乎即时的响应，适用于那些对速度要求高于深度的简单问题。这两种模式的结合大大增强了模型实现稳定且高效的“思考预算”控制能力。在预训练方面，Qwen3 的数据集相比Qwen2.5 有了显著扩展。Qwen2.5 是在18 万亿个token 上进行预训练的，而Qwen3 使用的数据量几乎是其两倍，达到了约36万亿个token，涵盖了119 种语言和方言。

Qwen3 集成MCP，在Agent 领域表现优秀。Qwen3 在工具调用能力方面表现出色。阿里发布了Qwen-Agent 来充分发挥Qwen3 的Agent 能力。Qwen-Agent 内部封装了工具调用模板和工具调用解析器，大大降低了代码复杂性。要定义可用的工具，用户可以使用MCP配置文件，使用Qwen-Agent 内置的工具，或者自行集成其他工具。

值得注意的是，在评估模型Agent 能力的BFCL 评测中，Qwen3 创下70.8 的新高，超越Gemini 2.5-Pro、OpenAI-o1 等顶尖模型，可以说，Qwen3 为即将到来的智能体Agent 和大模型应用爆发提供了更好的支持。正如阿里在官方新闻中所表达的：“阿里正从专注于训练模型的时代过渡到以训练Agent 为中心的时代”。

风险提示：AI技术研发不及预期，AI商业落地不及预期。

行情