Workflow
24B模型编程超DeepSeek全家桶,32G内存苹果电脑就能跑,专门针对真实GitHub Issue训练
量子位·2025-05-22 03:21

梦晨 发自 凹非寺 量子位 | 公众号 QbitAI Mistral沉默好久,果然在憋大招。 刚刚发布最新开源编程模型 Devstral ,在软件工程任务上一举超过DeepSeek全家桶和Qwen3 235B。 并且参数只有24B,可以在单卡RTX4090甚至32G内存的Mac上运行。 Devstral专为编程智能体推出,解决传统大模型只擅长碎片化的编程任务,难以解决现实世界软件工程的问题。 它 针对真实的GitHub Issue训练 ,重点在大型代码库中代码的上下文理解、识别不同组件间的关系,以及识别复杂函数中的细微错误。 最新开源代码模型实际表现 合作开发方All Hands AI联创分享了Devestral给他带来的"惊喜时刻": 当被要求写一个待办事项列表APP时,AI没有直接开始写,而是询问用户想要使用哪些技术栈。 在包含500个真实GitHub Issue问题的SWE-Bench Verified基准测试中,Devstral不仅成为开源SOTA,还优于许多同等参数规模的闭源模 型。 Devstral由Mistral AI和All Hands AI合作开发,使用Apache2.0开源许可。与上一款代 ...