参数破兆!阿里巴巴发布通义千问最强AI大模型Qwen3-Max



(北京24日路透电)继Qwen3-2507系列发布之后,中国电商巨头阿里巴巴周三宣布推出其迄今为止规模最大、能力最强的语言模型Qwen3-Max。此举标志着该公司正加速进军AI技术领域。
阿里云首席技术官周靖人在公司年度云栖大会上表示,该模型参数规模超过1兆。参数是决定AI系统如何处理信息的关键变量,Qwen3-Max在代码生成和自主智能体能力方面表现出显著优势。
ADVERTISEMENT
Qwen3-Max-Instruct正式版在代码能力和智能体能力方面进一步提升,在涵盖知识、推理、编程、指令遵循、人类偏好对齐、智能体任务和多语言理解的全面基准测试中均达到业界领先水平。
通义团队表示,仍在训练中的 Qwen3-Max-Thinking 已展现出非凡潜力,预计在不久的将来向公众正式发布这一版本。据介绍,在结合工具使用并增加测试时计算资源的情况下,该“思考”版本已在 AIME 25、HMMT 等高难度推理基准测试中取得100%的准确率。
据介绍,Qwen3-Max-Instruct的预览版已在LMArena文本排行榜上稳居全球前三,超越了GPT-5-Chat。正式发布版本进一步提升了其能力,尤其在代码生成与智能体表现方面表现卓越。
在专注于解决现实编程挑战的基准测试SWE-Bench Verified 上,Qwen3-Max-Instruct取得了高达69.6分的优异成绩,稳居全球顶尖模型之列。
此外,在评估智能体工具调用能力的严苛基准Tau2-Bench 上,Qwen3-Max-Instruct更是实现了突破性表现,以74.8分超越Claude Opus 4 与 DeepSeek-V3.1。
Qwen3-Max的推理增强版本 Qwen3-Max-Thinking,通过集成代码解释器并运用并行测试时计算技术,展现了前所未有的推理能力,尤其在极具挑战性的数学推理基准测试AIME 25和HMMT上,均取得了满分。
ADVERTISEMENT
热门新闻
百格视频
ADVERTISEMENT
