Workflow
全网首测! Qwen3 vs Deepseek-R1 数据分析哪家强?
AI前线·2025-04-30 05:11

作者 | 李飞 昨天凌晨,阿里巴巴开源新一代通义千问模型 Qwen3,AI Agent 厂商数势科技的数据分析智能体 SwiftAgent 已率先完成全面适配,并发布了 Qwen3 与 DeepSeek-R1 的测评报告,下面是具体评测内容,我们来看看在企业级的数据分析和智能决策场景上,Qwen3 与 DeepSeek-R1 到底有哪些差异? ( 声明 : 本次测评主要针对 Qwen3-32B 和 Qwen3-235B-A22B, 对比 Qwen2.5-72B 和 R1 效果 ) 针对数据分析 Data Agent,我们有如下关键节点 (如图 1),分别是改写,任务编排,工具选择和参数解析,工具运行和总结等。其中数据查询工具又 涵盖了复杂的能力,例如如何将用户的查询语句解析成对应的语义层要素 (时间,指标 ,维度,逻辑算子等)。不同节点的准确性对最终结果都会造成较大的影响。 图 1:数据分析 Agent 流程概要 当前在落地的过程中,不同厂商针对其中节点的准确性优化基本都是三种手段,分别是提示词工程、RAG 增强判断和模型微调等。这三种手段的实施成 本是递进的,效果也不可控。因此,数势科技一直秉持积极拥抱最先 ...