行情中心 沪深A股 上证指数 板块行情 股市异动 股圈 专题 涨跌情报站 盯盘 港股 研究所 直播 股票开户 智能选股
全球指数
数据中心 资金流向 龙虎榜 融资融券 沪深港通 比价数据 研报数据 公告掘金 新股申购 大宗交易 业绩速递 科技龙头指数

计算机行业:阿里QWEN3发布 超越DEEPSEEK-R1等登顶全球最强开源模型

国泰海通证券股份有限公司 04-29 00:00

本报告导读:

采用MoE 架构的阿里Qwen3 正式发布,登顶全球最强开源大模型,性能全面超越DeepSeek-R1和 OpenAI o1,尤其在 Agent领域,Qwen3表现优异。

投资要点:

投资建议:我 们认为,阿里此次 Qwen3 的发布,再次印证了我国头部AI 公司的技术水平已经位列世界顶尖水平,开源的8 款模型,对整个AI 行业的发展都将起到重要的促进作用。Qwen3 在评估模型Agent 能力的BFCL 取得新高成绩,这说明Qwen3 能为即将到来的智能体Agent 和大模型应用爆发提供了更好的支持,阿里此次专门宣布正前往“以训练Agent 为中心的时代”,未来AI Agent 时代有望加速到来,维持计算机板块“增持”评级,推荐标的:合合信息、赛意信息、鼎捷数智、虹软科技、万兴科技、金蝶国际、金山办公、海光信息、寒武纪。

阿里发布Qwen-3,登顶全球最强开源模型。4 月29 日凌晨,阿里巴巴推出Qwen3,系列的旗舰模型Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中仅在部分指标落后Gemini-2.5-Pro,全面超越DeepSeek-R1、o1、o3-mini、Grok-3 等顶级模型。此外,小型MoE 模型Qwen3-30B-A3B 的激活参数数量是QwQ-32B 的10%,表现更胜一筹,甚至像Qwen3-4B 这样的小模型也能匹敌Qwen2.5-72B-Instruct 的性能。此次,阿里开源了两个MoE 模型的权重:

Qwen3-235B-A22B(代表拥有2350 多亿总参数和220 多亿激活参数)和Qwen3-30B-A3B。此外,六个Dense 模型也已开源,包括Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和Qwen3-0.6B,均在Apache2.0 许可下开源。

Qwen3 支持两种思考模型,数据集达到36 万亿tokens。Qwen3 模型支持两种思考模式:思考模式:模型会逐步推理,经过深思熟虑后给出最终答案。这种方法非常适合需要深入思考的复杂问题。非思考模式:模型提供快速、近乎即时的响应,适用于那些对速度要求高于深度的简单问题。这两种模式的结合大大增强了模型实现稳定且高效的“思考预算”控制能力。在预训练方面,Qwen3 的数据集相比Qwen2.5 有了显著扩展。Qwen2.5 是在18 万亿个token 上进行预训练的,而Qwen3 使用的数据量几乎是其两倍,达到了约36万亿个token,涵盖了119 种语言和方言。

Qwen3 集成MCP,在Agent 领域表现优秀。Qwen3 在工具调用能力方面表现出色。阿里发布了Qwen-Agent 来充分发挥Qwen3 的Agent 能力。Qwen-Agent 内部封装了工具调用模板和工具调用解析器,大大降低了代码复杂性。要定义可用的工具,用户可以使用MCP配置文件,使用Qwen-Agent 内置的工具,或者自行集成其他工具。

值得注意的是,在评估模型Agent 能力的BFCL 评测中,Qwen3 创下70.8 的新高,超越Gemini 2.5-Pro、OpenAI-o1 等顶尖模型,可以说,Qwen3 为即将到来的智能体Agent 和大模型应用爆发提供了更好的支持。正如阿里在官方新闻中所表达的:“阿里正从专注于训练模型的时代过渡到以训练Agent 为中心的时代”。

风险提示:AI技术研发不及预期,AI商业落地不及预期。

免责声明:以上内容仅供您参考和学习使用,任何投资建议均不作为您的投资依据;您需自主做出决策,自行承担风险和损失。九方智投提醒您,市场有风险,投资需谨慎。

相关股票

相关板块

  • 板块名称
  • 最新价
  • 涨跌幅

相关资讯

扫码下载

九方智投app

扫码关注

九方智投公众号

头条热搜

涨幅排行榜

  • 上证A股
  • 深证A股
  • 科创板
  • 排名
  • 股票名称
  • 最新价
  • 涨跌幅
  • 股圈