Workflow
Devstral
icon
Search documents
腾讯研究院AI速递 20250523
腾讯研究院· 2025-05-22 15:09
生成式AI 一、 OpenAI放大招! Responses API 支持MCP,一夜改变智能体开发 1. OpenAI的Responses API新增MCP服务支持,开发者只需简单配置即可连接外部服务, 无需手动函数调用,大幅降低开发复杂度; 2. 新版API优化了安全控制机制,通过allowed_tools参数和权限管理确保智能体安全调用工 具,防止滥用; 3. API更新增加图像生成、Code Interpreter和文件搜索等功能,并引入后台模式、推理摘要 和加密推理项新特性。 https://mp.weixin.qq.com/s/_FWuzFSrd2MdeSR9mtCv_Q 二、 微软开源Web Agent项目:Magentic-UI!让AI成为网页执行助手 1. 微软发布开源Web Agent项目Magentic-UI,支持自动浏览网页、读写文件和代码,用户 可全程监控和控制AI操作; https://mp.weixin.qq.com/s/bxRbckiKauJBuA3J9dKZkA 三、 性能碾压GPT-4.1-mini!Mistral开源Devstral,还能在笔记本上跑 1. Mistral与 ...
性能碾压GPT-4.1-mini!Mistral开源Devstral,还能在笔记本上跑
机器之心· 2025-05-22 10:25
Devstral 是本地部署和设备端使用的理想之选。 法国 AI 初创公司 Mistral 强势回归,再次大力投身开源 AI 社区。先前,其因未开源 Medium 3 大模型而受到开发者广泛批评。 机器之心报道 编辑:陈陈 刚刚,该公司宣布,他们与开源初创公司 All Hands AI(Open Devin 的创建者)合作,发布了 全新的开源语言模型 Devstral,拥有 240 亿个参数 —— 比许多竞争 对手的模型小得多,所需的算力也低得多。 因而,Devstral 可在单块 RTX 4090 显卡或配备 32GB RAM 的 Mac 上运行,是本地部署和设备端使用的理想之选。 值得一提的是,该模型现已根据宽松的 Apache 2.0 许可证免费提供,允许开发者和组织不受限制地部署、修改和商业化。 在相同的测试框架(OpenHands,由 All Hands AI 提供)下进行评估时,Devstral 的表现远超 Deepseek-V3-0324 (671B) 和 Qwen3 232B-A22B 等规模更大的模型。 最后,Devstral 可通过 Mistral 的 Le Platforme API 访 ...
24B模型编程超DeepSeek全家桶,32G内存苹果电脑就能跑,专门针对真实GitHub Issue训练
量子位· 2025-05-22 03:21
梦晨 发自 凹非寺 量子位 | 公众号 QbitAI Mistral沉默好久,果然在憋大招。 刚刚发布最新开源编程模型 Devstral ,在软件工程任务上一举超过DeepSeek全家桶和Qwen3 235B。 并且参数只有24B,可以在单卡RTX4090甚至32G内存的Mac上运行。 Devstral专为编程智能体推出,解决传统大模型只擅长碎片化的编程任务,难以解决现实世界软件工程的问题。 它 针对真实的GitHub Issue训练 ,重点在大型代码库中代码的上下文理解、识别不同组件间的关系,以及识别复杂函数中的细微错误。 最新开源代码模型实际表现 合作开发方All Hands AI联创分享了Devestral给他带来的"惊喜时刻": 当被要求写一个待办事项列表APP时,AI没有直接开始写,而是询问用户想要使用哪些技术栈。 在包含500个真实GitHub Issue问题的SWE-Bench Verified基准测试中,Devstral不仅成为开源SOTA,还优于许多同等参数规模的闭源模 型。 Devstral由Mistral AI和All Hands AI合作开发,使用Apache2.0开源许可。与上一款代 ...