开源编程模型王座易主了,谁能想到新SOTA是快手

克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 开源编程模型王座,再度易主! 比如这个赛博朋克时钟,点击即可触发立方体爆炸特性,将罗马数字散布到3D空间中,且包含霓虹灯和粒子效果。 来自快手的 KAT-Dev-72B-Exp ,在SWE-Bench认证榜单以74.6%的成绩夺得开源模型第一。 KAT-Dev-72B-Exp是 KAT-Coder 模型的实验性强化学习版本。 而KAT-Coder同样表现不凡,在SWE-Bench认证榜单上击败了GPT-5(非Codex模式)和Claude 4 Sonnet。 KAT-Coder可以在网页中复刻出一个《水果忍者》,计分和生命值系统都完整包含。 而且模型支持在Claude Code等编程工具中使用,充当Claude模型的开源平替。 用代码让物理规律可视化 在官方X账号当中,开发团队陆续展示了KAT-Coder的更多成果。 | 9:22:13 PM | 30 Roman Numeral Clock | | | | --- | --- | --- | --- | | NO 1300 | | | | | F | | | | | 200 | 122 | 24 | V ...