阿里Qwen3亮点:内嵌MCP+降本明显

4月 29日，阿里最新模型Qwen3正式发布，模型采用开源方式，全球开发者、研究机构和企业均可免费在Hugging Face、魔搭社区等平台下载模型并商用，也可以通过阿里云百炼调用Qwen3的API服务。大模型本质： Qwen3采用混合专家（MoE）架构，总参数量235B，专家模型数量128个，活跃参数量22B，活跃专家模型8个（和Llama4 架构类似，降低推理环节成本）。 Qwen3总参数仅为DeepSeek-R1的1/3，性能测评全面超越R1、OpenAI-o1等全球顶尖模型。在代码能力测试LiveCodeBench和Codeforces两个榜单中， Qwen3高于所有其它模型，包括当前最强的Gemini2.5-Pro。此外，Qwen3的30B参数MoE模型实现了10倍以上的模型性能杠杆提升，仅激活3B性能超过了上代Qwen2.5-32B模型性能，Qwen3-4B也能达到与Qwen2.5- 72B-Instruct相当的表现。预训练 Qwen3预训练数据集规模几乎是上一代两倍，从18万亿个token扩展到了36万亿个token。为了确保数据质量，团队利用Qwen2.5-VL提取文档文本，并通 ...