参数破万亿！阿里Qwen3-Max-Thinking发布，编程能力“踢馆”Gemini与Claude

在多项权威基准测试中表现优异，Qwen3-Max-Thinking 性能可与 GPT-5.2-Thinking、Claude-Opus-4.5、Gemini-3 Pro 等闭源顶级模型竞争甚至超越。具体而言，Qwen3-Max-Thinking 在多项关键 AI 基准测试中达到了或刷新了全球 SOTA 表现：这些测试覆盖了科学知识问答（如 GPQA Diamond）、数学推理（如 IMO 等级测试）、代码编程（如 LiveCodeBench）等多个领域，是衡量大型语言模型综合能力的重要指标。阿里突发最强旗舰模型，总参数过万亿就在刚刚，Qwen3-Max-Thinking 正式版突然发布，总参数规模超过 1 万亿（1T），位于目前全球最大规模 AI 模型行列，预训练数据规模高达 36T Tokens，覆盖大量高质量语料。作者｜冬梅 Qwen3-Max 是阿里通义团队迄今规模最大、能力最强的语言模型，该版本包括 Base、Instruct 和 Thinking 多种形式。在包含事实科学知识、复杂推理和编程能力在内的 19 项权威基准测试中取得极高水平，有记录显示其综合表现可媲美 GPT-5.2-T ...