那个用半成品刷爆SOTA的Qwen3超大杯推理版,现在正式上线
量子位·2026-01-26 15:30

鱼羊 发自 凹非寺 量子位 | 公众号 QbitAI 新一年的基础模型竞逐,没想到是阿里千问率先出手了! 就在刚刚,Qwen3-Max-Thinking正式版突然发布,当即刷新全球SOTA: 在涵盖科学知识、数学推理、代码编程的19项权威基准测试中,赶上甚至超越GPT-5.2-Thinking、Claude-Opus-4.5和Gemini 3 Pro等TOP 闭源模型。 | Capability | Benchmark | GPT-5.2- | Claude- | Gemini | DeepSeek | Qwen3-Max- | | --- | --- | --- | --- | --- | --- | --- | | | | Thinking | Opus-4.5 | 3 Pro | V3.2 | Thinking | | Knowledge | MMLU-Pro | 87.4 | 89.5 | 89.8 | 85.0 | 85.7 | | | MMLU-Redux | 95.0 | 95.6 | 95.9 | 94.5 | 92.8 | | | C-Eval | 90.5 | 92.2 | 93.4 | ...

那个用半成品刷爆SOTA的Qwen3超大杯推理版,现在正式上线 - Reportify