阿里最新开源模型Qwen3到底能不能打？不妨上「通义App」亲自试试

作者 | 付秋伟 4 月 29 日凌晨，阿里正式发布并开源了最新的通义千问 Qwen3 模型（以下简称 Qwen3），并迅速登顶多项大模型测评榜单，引发了全行业的关注。据介绍，Qwen3 在推理、指令遵循、工具调用、多语言能力等方面均大幅增强，尤其是旗舰模型 Qwen3-235B-A22B，在多个国际权威基准测试中刷新了开源模型纪录。 | | Qwen3-235B-A22B | Qwen3-32B | OpenAl-ol | Deepseek-R1 | Grok 3 Beta | Gemini2.5-Pro | Open Al-o3-mini | | --- | --- | --- | --- | --- | --- | --- | --- | | | MoE | Dense | 2024-12-17 | | Think | | Medium | | ArenaHard | 95.6 | 93.8 | 92.1 | 93.2 | - | 96.4 | 89.0 | | AIME'24 | 85.7 | 81.4 | 74.3 | 79.8 | 83.9 | 92.0 | 79.6 | | AIME'25 ...