通义千问 Qwen3 发布，对话阿里周靖人

以下文章来源于晚点对话，作者程曼祺晚点对话 . 最一手的商业访谈，最真实的企业家思考。阿里云 CTO、通义实验室负责人周靖人 "大模型已经从早期阶段的初期，进入早期阶段的中期，不可能只在单点能力上改进了。" Qwen3 旗舰模型，MoE（混合专家模型）模型 Qwen3-235B-A22B，以 2350 亿总参数、220 亿激活参数，在多项主要 Benchmark（测评指标）上超越了 6710 亿总参数、370 亿激活参数的 DeepSeek-R1 满血版。更小的 MoE 模型 Qwen3-30B-A3B，使用时的激活参数仅为 30 亿，不到之前 Qwen 系列纯推理稠密模型 QwQ- 32B 的 1/10，但效果更优。更小参数、更好性能，意味着开发者可以用更低部署和使用成本，得到更好效果。图片来自通义千问官方博客。（注：MoE 模型每次使用时只会激活部分参数，使用效率更高，所以有总参数、激活参数两个参数指标。） Qwen3 发布前，我们访谈了阿里大模型研发一号位，阿里云 CTO 和通义实验室负责人，周靖人。他也是阿里开源大模型的主要决策者。迄今为止，Qwen 系列大模型已被累计下载 3 ...