阿里Qwen3系列开源：混合推理模式、性能超越DeepSeek R1

以下文章来源于赛博禅心，作者金色传说大聪明赛博禅心 . 拜AI古佛，修赛博禅心今天凌晨，Qwen3 发布。本次共开源 8 款模型，包括 2 款 MoE 模型、6 款 Dense 模型。 Qwen3 系列在代码、数学、通用能力等方面能力表现优异，其中 235B 版本，在基准测试上的水平超过了 671B 的 DeepSeek R1 。同时， Qwen3 引入了「思考模式/非思考模式」无缝切换的功能。在思考模式下，模型逐步推理，经过深思熟虑后给出最终答案。非思考模式下，能够提供快速的即时响应，适用于简单问题的回答。混合推理的模式平衡了算力和输出效果。此外， Qwen3 系列提高了 Agent 能力，同时也加强了对 MCP 的支持。Qwen 配套了一个 Qwen-Agent 项目，可以使用 API 进行工具调用，或结合现有的工具链进行扩展。 | | | Qwen3 | | | | | | --- | --- | --- | --- | --- | --- | --- | | | | 通义千问最新一代大模型:采用混合专家架构,具备思考与快速回答双模式,支持119种语言 | | | | ...