Workflow
基于阿里最新开源的Qwen3-32B模型,DeepSWE开源AI Agent登顶榜首
NKYNKY(SZ:300109) news flash·2025-07-02 23:00

大模型训练平台Together.ai联合Agentica开源了创新AI Agent框架DeepSWE。DeepSWE是基于阿里最新 开源的Qwen3-32B模型之上,完全使用强化学习训练而成。根据SWE-Bench-Verified测试数据显示, DeepSWE在64k最大上下文长度和100最大环境步骤下进行评估,最终在16次运行平均的Pass@1准确率 上达到了42.2%,使用混合测试时扩展(TTS)后性能进一步提升至59%,超过了所有开源Agent框架位 列榜首。 DeepSWE证明了仅使用强化学习进行训练的有效性和巨大潜力。与其他开源模型相比,DeepSWE- Preview在不依赖于更强专有教师模型的蒸馏或SFT的情况下,依然能够取得了最好的性能。(AIGC开 放社区) ...