字节Seed首次开源代码模型,拿下同规模多个SOTA,提出用小模型管理数据范式
量子位·2025-05-11 04:20
克雷西 明敏 发自 凹非寺 量子位 | 公众号 QbitAI 字节Seed首次开源代码模型! Seed-Coder ,8B规模,超越Qwen3,拿下多个SOTA。 它证明 "只需极少人工参与,LLM就能自行管理代码训练数据" 。 通过 自身生成和筛选 高质量训练数据,可大幅提升模型代码生成能力。 这可以被视为对DeepSeek-R1模型自我生成和筛选训练数据策略的扩展。 一共包含三个版本: Base Instruct Reasoning 其中,Instruct在编程方面表现出色,拿下两个测试基准SOTA。 | Model | Size | | SWE-bench Verified | Multi-SWE-bench mini | | --- | --- | --- | --- | --- | | Agentless | | | OpenHands | Agentless | | ~8B Models | | | | | | Yi-Coder-9B-Chat | 9B | 0.0 | 1.6 | 0.0 | | Llama-3.1-8B-Instruct | 8B | 1.0 | 1.2 | 0.5 | | Q ...