AI前线

Search documents
刚刚,Qwen3 终于发布!混合推理模式、支持MCP,成本仅DeepSeek R1三分之一,网友喊话小扎:工程师要赶紧加班了
AI前线· 2025-04-28 23:57
Qwen3 在推理、指令遵循、工具调用、多语言能力等方面均大幅增强。在官方的测评中,Qwen3 创下所有国产模型及全球开源模型的性能新高:在奥 数水平的 AIME25 测评中,Qwen3 斩获 81.5 分,刷新开源纪录;在考察代码能力的 LiveCodeBench 评测中,Qwen3 突破 70 分大关,表现甚至超过 Grok3;在评估模型人类偏好对齐的 ArenaHard 测评中,Qwen3 以 95.6 分超越 OpenAI-o1 及 DeepSeek-R1。 | | Qwen3-235B-A22B | Qwen3-32B | OpenAl-o1 | Deepseek-R1 | Grok 3 Beta | Gemini2.5-Pro | Open Al-o 3-mini | | --- | --- | --- | --- | --- | --- | --- | --- | | | MoE | Dense | 2024-12-17 | | Think | | Medium | | ArenaHard | 95.6 | 93.8 | 92.1 | 93.2 | - | 96.4 | 89.0 | | AIM ...
Docker 推出 MCP Catalog 和工具包,供应商不顾安全问题争相支持
AI前线· 2025-04-28 23:57
作者 | Tim Anderson 译者 | 平川 策划 | Tina 本文最初发布于 DEV CLAS 。 Docker 推出了自己的 MCP(模型上下文协议)目录和用于管理 MCP 工具的 MCP Toolkit。 MCP Catalog 是 Docker Hub 的一部分,该公司声称其有 100 多台初始服务器,可以访问来自 Elastic、Salesforce Heroku、New Relic、Stripe、 Pulumi、Grafana Labs、Kong 和 Neo4j 等供应商的第三方工具。未来,他们计划让企业发布自定义的 MCP 服务器,而 Docker 承诺将提供 "全面的企 业控制"。 MCP 的目的是为 AI 代理提供一个标准化的 API,用于控制这些服务器提供的服务,从而扩展 AI 代表用户执行任务的能力。如果您正在寻找一份友好的 入门指南,可以看一下我们为您准备的 MCP 实践指南。 MCP 由 Anthropic 公司于 2024 年 11 月推出,是 "一个连接 AI 助手与数据所在系统的新标准"。该协议被包括 OpenAI、微软和谷歌在内的许多公司迅 速采用;供应商们争先恐后地 ...
FastAPI-MCP 开源:简化 FastAPI 与 AI 智能体的集成
AI前线· 2025-04-28 11:10
作者|Robert Krzaczyński 译者|明知山 策划|Tina 最近,一个叫作 FastAPI-MCP 的开源库问世,旨在帮助开发者更轻松地将传统 FastAPI 应用程序与现代 AI 智能体通过模型 上下文协议 (MCP) 连接起来。FastAPI-MCP 旨在实现零配置,使得开发者能够自动将 API 端点暴露为与 MCP 兼容的服 务,从而以最小的改动让 Web 服务对 AI 系统可用。 这个库能够识别所有可用的 FastAPI 端点,并将它们转换为 MCP 工具。它保留了请求和响应模式,以及为 Swagger 或 OpenAPI 接口创建的文档。这些功能确保 AI 智能体能够访问端点,并有效地、安全地与它们发生交互。此外,开发者可以 直接在 FastAPI 应用程序内挂载 MCP 服务器,也可以将其作为独立服务部署,从而在不同架构中提供灵活性。 服务器既可以作为 FastAPI 应用的一部分进行托管,也可以独立部署,具体取决于架构需求。它支持通过 uv(一个高效的 Python 包管理器)和传统的 pip 进行安装。 这种方法在开发者和 AI 社区引起了广泛关注。AI/ML 工程师兼多云架构师 ...
细扒字节Seed 逆天招人要求!这5%本地顶级大脑做出了首个跨7大语言代码修复基准,让大模型成本狂降83%!
AI前线· 2025-04-28 11:10
作者|冬梅 字节 Top Seed 启动 2026 届招聘,瞄准顶尖博士 4 月 27 日,字节跳动 Seed 在其官微上发布了一则招聘启示,宣布正式启动 2026 届 Top Seed 大模型顶尖人才校招计划, 研究课题包括大语言模型、机器学习算法和系统、多模态生成、多模态理解、语音等方向,基本覆盖大模型研究各个领域, 计划招募约 30 位顶尖应届博士。 值得一提的是,本届 Top Seed 强调不限专业背景,更关注研究潜力,希望寻找具有极强技术信仰与热情、具备出色研究能 力、富有好奇心和驱动力的年轻研究者。 值得注意的是,字节跳动在此次招聘启事中还透露了几位刚毕业的同学已经做出了一些有影响力的研究。 比如,Z 同学构建并开源了首个多语言代码修复基准 Multi-SWE-bench,在 SWE-bench 基础上,首次覆盖 Python 之外的 Java、TypeScript、C、C++、Go、Rust 和 JavaScript 七种编程语言,1632 个真实修复任务,是真正面向"全栈工程"的评测 基准,其数据均来自 GitHub issue,历时近一年构建,以尽可能准确测评和提高大模型高阶编程智能水平。 ...
曝百川智能老班底所剩无几;小红书取消员工大小周、竞业;马拉松亚军“松延动力 N2”以 5.7 万元拍卖价成交 | AI周报
AI前线· 2025-04-27 04:28
整理 | 傅宇琪、褚杏娟 小米被曝要求员工日均工时不低于 11.5 小时;小红书宣布取消员工大小周、竞业;传百川智能重大组织结构变化,老班底所剩无几,多位核心高管变动; 传 Manus 母公司完成超 5 亿元融资;贾跃亭首次回应"下周回国"梗;英特尔本周宣布裁员 20%,超 2.18 万人或被裁撤;裁掉 2000 人后,微软对绩效不佳 员工使出一系列"组合拳";平台"二选一"?京东美团"外卖战"打得火热…… 行业热点 小米被曝要求员工日均工时不低于 11.5 小时,员工:平均 12 小时仍被约谈 近日,有用户发帖称,小米要求员工日均工时不低于 11.5 小时,其中低于 8 小时需要提交说明,工时排名靠后的要被约谈,甚至劝退。"小米查工时"相 关话题在小红书等平台引发讨论。多位小米员工证实了这一情况。 小米手机部门一员工告诉记者,不同组情况不一样,日均工时要求低的组是 10.5 小时;有的组甚至要求日均 14、15 个小时,他们部门要求 12.5 小 时,"但领导都是口头要求,不会留下痕迹。"小米上海一员工说道,他们部门确实要求平均 11.5 小时,就是 9 点上班、8 点半下班。"我之前平均工时达 到了 12 ...
Anthropic 下架逆向工程者代码,网友开始称赞OpenAI开放
AI前线· 2025-04-27 04:28
整理 | 核子可乐、褚杏娟 近期, Claude Code 迎来一次品牌危机。据报道,部分是 Anthropic 向一位试图对 Claude Code 进行逆向工程的开发者发出了下架通知,而 Claude Code 的使用许可比 Codex CLI 更为严格。 据悉,OpenAI 的 Codex CLI 源代码遵循 Apache 2.0 许可证,允许分发和商业使用。Claude Code 遵循 Anthropic 的商业许可证,限制未经公司明确许 可的修改。 据报道,Anthropic 还对 Claude Code 的源代码进行了"混淆"。Claude Code 的源代码不易获取。当一位开发人员对其进行了去混淆处理并在 GitHub 上 发布源代码时,Anthropic 提交了一份 DMCA (数字千年版权法案)投诉,要求删除该代码。 为此,开发者们认为这种做法还不如 OpenAI 发布 Codex CLI 时的开放态度。"真的觉得 Anthropic 的态度非常令人厌烦。"有网友评价。 其他几位开发人员同样分享了自己在单条提示词中取得出色编码成果的难忘经历。EverArt 创始人 Pietro Schira ...
酷开一口气甩出 6 个超级智能体!CEO:一定要做 AI 原生,性价比是我们追求的主要方向
AI前线· 2025-04-25 13:48
当下,市面上各类智能体如雨后春笋涌现,但由于缺乏应用广度及深度,以及设备交互无法承载场景需求,智能体的应用价值未得到充分发挥。市面上 不缺乏智能体,但缺少能够提供满意服务的智能体。 据王志国介绍,此次推出超级智能体后,酷开接下来的规划是分步走的。第一,做用户数据的闭环,要观察三个月左右的时间,尤其是用户留存、活跃 数据和功能满足率大方面;第二,主动服务能力是下一个重心,准备把超级智能体的意图识别模型从 7B 模型换到 32B 模型,把它做成跟用户情感对话 的工具;第三,时刻保持着跟行业内最领先的大模型做,一定要做 AI 原生,只要中间隔着人,大模型的能力就会被大幅度衰减。 同时,酷开超级智能体和六大专业智能体支持软件售卖、设备授权、PaaS 服务、生态共赢的等合作模式,致力构建开放智能生态。据王志国透露,今 年 Q1 季度,酷开签约智能体销售(软件销售)已经达到了软件和硬件各占一半。 作者 | 华卫 4 月 22 日,酷开在以"大爱 AI"为主题的 2025 春季发布会上发布超级智能体,包括影音、健康、生活、设备、创作、教育六大智能体,以及智能体硬件 酷开学习机 Y41 Air、酷开闺蜜机 C20 系列等产品 ...
出海不迷航,合规×本地化×生态:如何用技术力撬动海外市场?| 直播预告
AI前线· 2025-04-25 13:48
4 月 28 日 20:00,白鲸开源 CEO 郭炜 · Kong 中国区总裁戴冠兰 · GMI Cloud 中国 VP 蒋剑彪,三位专家深度剖析出海实战要点, 戳下方直播预约按钮观看直播。 直播介绍 直播时间 4 月 28 日 20:00-21:30 破局与增长,中国技术出海实战指南 嘉宾 主持人: 郭炜 白鲸开源 CEO 嘉宾: 戴冠兰 Kong Inc / 中国区总裁 蒋剑彪 GMI Cloud China VP 直播亮点 三大大咖同台:白鲸开源 CEO 郭炜、Kong 中国区总裁戴冠兰、GMI Cloud 中国 VP 蒋剑彪一同分享,一线干货零距离。 合规与安全破局:深度剖析数据跨境、合规门槛,教你用技术壁垒化为增长杠杆。 直播主题 本地化与差异化策略:先本土后海外 vs. 直接全球化,两种打法如何取舍?技术指标与 PMF 验证全流程揭秘。AI 时代前瞻:大模型来袭,基础设 施软件出海的新机会在哪里?未来三年技术趋势大揭秘。 如何看直播? 扫描下图海报 【二维码】 ,或戳直播预约按钮,预约 InfoQ 视频号直播。 全球人工智能开发与应用大会 1 2025 年 4 月 28 日 20:00-21:30 ...
OpenAI“Agent万能论”遭打脸!LangChain创始人:Deep Search恰恰证明Workflows不可取代
AI前线· 2025-04-25 13:48
当前,AI 领域呈现出一种近乎"追星式"的热情氛围,每当有新的东西发布,便迅速引发广泛关注与高度评价,仿佛技术变革即将一触即发。同时大 家情绪也波动剧烈,从"危机论"到"爆发论"频繁切换。OpenAI 最近出的《A Practical guide to building AI agents》的指南,就是他们最近捧上天 的"神作"。它直接被捧成了"圣经",一时间风头无两。 整理 | Tina 这份 34 页的指南被誉为"市面上最优秀的资源",旨在为产品和工程团队提供构建 AI 智能体的实用方法,涵盖了 Agent 的定义、识别 Agent 应用 场景、设计框架、逻辑和编排模式等关键方面。 不过,以冷静理性著称的 LangChain 创始人 Harrison Chase 对 OpenAI 的这份指南中提出的一些核心观点表达了强烈异议,甚至表示该指南一 开始就让人感到"恼火"。他公开批评这份指南"具有误导性",并罕见地进行了逐字逐句的分析。 他认为,OpenAI 在定义 Agent 时采取了一种过于僵硬的"二元对立"方法。实际上,目前大多数"Agentic 系统"都是 Workflows 和 Agents 的有机 ...
“DeepSeek不是万能的”,李彦宏今年押注AI 应用:模型价再“打骨折”,重点布局多智能体、多模态
AI前线· 2025-04-25 08:25
作者 | 褚杏娟、华卫 在 4 月 25 日的百度 Create 开发者大会现场,百度创始人李彦宏发布了两大模型、多款热门 AI 应用,并宣布将帮助开发者全面拥抱 MCP。同时,百度 正式点亮了国内首个全自研的三万卡集群,可同时承载多个千亿参数大模型的全量训练,支持 1000 个用户同时做百亿参数的大模型精调。 "所有这些发布,都是为了让开发者们可以不用担心模型能力、不用担心模型成本、更不用担心开发工具和平台,可以踏踏实实地做应用,做出最好的应 用!"李彦宏说道。 李彦宏表示,大模型厂商卷生卷死,几乎每周都在发布新模型,但开发者不敢大胆用,因为担心自己的应用被模型迭代快速覆盖掉。李彦宏认为这是把 双刃剑:一方面,开发者确实需要理解技术发展趋势;另一方面,这么多日益强大的模型提供了更多的选择,打开了更多的可能性。 "只要找对场景,选对基础模型,有时候还要学一点调模型的方法,在此基础上做出来的应用是不会过时的"。他强调,"没有应用,芯片、模型都没有价 值。模型会有很多,但未来真正统治这个世界的是应用,应用才是王者。" 发布两大新模型, 价格最高降 80% 文心大模型 4.5 Turbo 和文心大模型 X1 Tur ...