Workflow
软件工程代码智能体
icon
Search documents
华为推出软工代码智能体SWE-Lego,解锁SFT训练极致性能
机器之心· 2026-01-13 04:08
"软工任务要改多文件、多轮工具调用,模型怎么学透?高质量训练数据稀缺,又怕轨迹含噪声作弊?复杂 RL 训练成本高,中小团队望而却步?" 华为研究团队推出 SWE-Lego , 仅基于监督微调(SFT)的软件工程代码智能体,无需复杂 RL 流程,在 SWE-bench Verified 基准中斩获同等规模开源模型 SOTA,甚至超越部分更大规模闭源模型!项目已开源,代码、模型和 全部数据一键获取 ! SWE-Lego 具有 三大创新,包括数据、训练和测试时扩展。 1. 混合数据集构建: 3. 测试时扩展策略(TTS): 引言 在软件工程领域,Code Agent 需要处理复杂的任务:修复 bug、重构代码、理解大型代码库。这些任务要求 Code Agent 具备 长序列推理、多文件操作和工具使用 等能力。现有的训练方法通常需要复杂的训练范式,比如强化学习(RL)或者 RL 和 SFT 的迭代组合。 这些方法虽然有效,但计算成本高,训练过程复杂。能否用更简单的方法达到同样的效果? 华为的研究团队提出了 SWE-Lego,一个仅基于监督微调(SFT)的软工代码模型的解决方案 。在 SWE-bench Verifie ...