Workflow
阿里Qwen3亮点:内嵌MCP+降本明显
小熊跑的快·2025-04-30 07:51

4月 29日,阿里最新模型Qwen3正式发布,模型采用开源方式,全球开发者、研究机构和企业均可免费在Hugging Face、魔搭社区等平台下载模型并商 用,也可以通过阿里云百炼调用Qwen3的API服务。 大模型本质: Qwen3采用混合专家(MoE)架构,总参数量235B,专家模型数量128个,活跃参数量22B,活跃专家模型8个( 和Llama4 架构类似,降低推理环节成 本)。 Qwen3总参数仅为DeepSeek-R1的1/3,性能测评全面超越R1、OpenAI-o1等全球顶尖模型。在代码能力测试LiveCodeBench和Codeforces两个榜单中, Qwen3高于所有其它模型,包括当前最强的Gemini2.5-Pro。 此外,Qwen3的30B参数MoE模型实现了10倍以上的模型性能杠杆提升,仅激活3B性能超过了上代Qwen2.5-32B模型性能,Qwen3-4B也能达到与Qwen2.5- 72B-Instruct相当的表现。 预训练 Qwen3预训练数据集规模几乎是上一代两倍,从18万亿个token扩展到了36万亿个token。为了确保数据质量,团队利用Qwen2.5-VL提取文档文本,并通 ...