软件工程代码智能体 - filings, earnings calls, financial reports, news - Reportify

软件工程代码智能体

Search documents

华为推出软工代码智能体SWE-Lego，解锁SFT训练极致性能

机器之心· 2026-01-13 04:08

"软工任务要改多文件、多轮工具调用，模型怎么学透？高质量训练数据稀缺，又怕轨迹含噪声作弊？复杂 RL 训练成本高，中小团队望而却步？" 华为研究团队推出 SWE-Lego ，仅基于监督微调（SFT）的软件工程代码智能体，无需复杂 RL 流程，在 SWE-bench Verified 基准中斩获同等规模开源模型 SOTA，甚至超越部分更大规模闭源模型！项目已开源，代码、模型和全部数据一键获取！ SWE-Lego 具有三大创新，包括数据、训练和测试时扩展。 1. 混合数据集构建： 3. 测试时扩展策略（TTS）：引言在软件工程领域，Code Agent 需要处理复杂的任务：修复 bug、重构代码、理解大型代码库。这些任务要求 Code Agent 具备长序列推理、多文件操作和工具使用等能力。现有的训练方法通常需要复杂的训练范式，比如强化学习（RL）或者 RL 和 SFT 的迭代组合。这些方法虽然有效，但计算成本高，训练过程复杂。能否用更简单的方法达到同样的效果？华为的研究团队提出了 SWE-Lego，一个仅基于监督微调（SFT）的软工代码模型的解决方案。在 SWE-bench Verifie ...

软件工程代码智能体

监督微调（SFT）

强化学习（RL）

软件与服务

软件工程代码智能体

监督微调（SFT）

强化学习（RL）

软件与服务