智能体Agent

Search documents
阿里Qwen3发布,超越DeepSeek-R1等登顶全球最强开源模型
Haitong Securities International· 2025-05-06 12:22
股票研究 /[Table_Date] 2025.04.29 2025-05-06 [Table_Industry] 计算机 阿里 Qwen3 发布,超越 DeepSeek-R1 等 登顶全球最强开源模型 [Table_Invest] 评级: 增持 [table_Authors] 杨林(分析师) 杨昊翊(分析师) 魏宗(分析师) 行 采用 MoE 架构的阿里 Qwen3 正式发布,登顶全球最强开源大模型,性能全面超越 DeepSeek-R1 和 OpenAI o1,尤其在 Agent 领域,Qwen3 表现优异。 投资要点: 风险提示:AI 技术研发不及预期,AI 商业落地不及预期。 股 票 研 究 请务必阅读正文之后的免责条款部分 本报告导读: 业 跟 踪 报 告 证 券 研 究 报 告 请务必阅读正文之后的免责条款部分 2 of 5 图2:Qwen-30B-A3B 和 Qwen3-4B 基准测试结果 数据来源:通义千问 Qwen 官微 行业跟踪报告 021-38676666 021-38676666 021-38676666 登记编号 S0880525040027 S0880525040126 S08805 ...
刚刚,Qwen3 终于发布!混合推理模式、支持MCP,成本仅DeepSeek R1三分之一,网友喊话小扎:工程师要赶紧加班了
AI前线· 2025-04-28 23:57
Qwen3 在推理、指令遵循、工具调用、多语言能力等方面均大幅增强。在官方的测评中,Qwen3 创下所有国产模型及全球开源模型的性能新高:在奥 数水平的 AIME25 测评中,Qwen3 斩获 81.5 分,刷新开源纪录;在考察代码能力的 LiveCodeBench 评测中,Qwen3 突破 70 分大关,表现甚至超过 Grok3;在评估模型人类偏好对齐的 ArenaHard 测评中,Qwen3 以 95.6 分超越 OpenAI-o1 及 DeepSeek-R1。 | | Qwen3-235B-A22B | Qwen3-32B | OpenAl-o1 | Deepseek-R1 | Grok 3 Beta | Gemini2.5-Pro | Open Al-o 3-mini | | --- | --- | --- | --- | --- | --- | --- | --- | | | MoE | Dense | 2024-12-17 | | Think | | Medium | | ArenaHard | 95.6 | 93.8 | 92.1 | 93.2 | - | 96.4 | 89.0 | | AIM ...