发布: 12:01pm 24/09/2025

参数破兆！阿里巴巴发布通义千问最强AI大模型Qwen3-Max

（北京24日路透电）继Qwen3-2507系列发布之后，中国电商巨头阿里巴巴周三宣布推出其迄今为止规模最大、能力最强的语言模型Qwen3-Max。此举标志着该公司正加速进军AI技术领域。

阿里云首席技术官周靖人在公司年度云栖大会上表示，该模型参数规模超过1兆。参数是决定AI系统如何处理信息的关键变量，Qwen3-Max在代码生成和自主智能体能力方面表现出显著优势。

Qwen3-Max-Instruct正式版在代码能力和智能体能力方面进一步提升，在涵盖知识、推理、编程、指令遵循、人类偏好对齐、智能体任务和多语言理解的全面基准测试中均达到业界领先水平。

通义团队表示，仍在训练中的 Qwen3-Max-Thinking 已展现出非凡潜力，预计在不久的将来向公众正式发布这一版本。据介绍，在结合工具使用并增加测试时计算资源的情况下，该“思考”版本已在 AIME 25、HMMT 等高难度推理基准测试中取得100%的准确率。

据介绍，Qwen3-Max-Instruct的预览版已在LMArena文本排行榜上稳居全球前三，超越了GPT-5-Chat。正式发布版本进一步提升了其能力，尤其在代码生成与智能体表现方面表现卓越。

在专注于解决现实编程挑战的基准测试SWE-Bench Verified 上，Qwen3-Max-Instruct取得了高达69.6分的优异成绩，稳居全球顶尖模型之列。

此外，在评估智能体工具调用能力的严苛基准Tau2-Bench 上，Qwen3-Max-Instruct更是实现了突破性表现，以74.8分超越Claude Opus 4 与 DeepSeek-V3.1。

Qwen3-Max的推理增强版本 Qwen3-Max-Thinking，通过集成代码解释器并运用并行测试时计算技术，展现了前所未有的推理能力，尤其在极具挑战性的数学推理基准测试AIME 25和HMMT上，均取得了满分。

更多视频

阿里巴巴