Harness is the New Dataset:模型智能提升的下一个关键方向
海外独角兽·2026-03-26 12:08
作者:Celia 编辑:Siqi 最 近 , harness engineering 又 成 了 继 prompt engineering 、 context engineering 之 后 新 一 代 的 buzzword。 这背后对应着一个越来越清晰的变化: 当基模能力逐渐成熟后, 现在 真正决定 agent 上限的,已 经不是模型本身,而是围绕模型搭建起来的整套系统。 尤其对于模型公司来说,谁更早把 harness 跑顺,谁就更早有机会捕获高质量的执行轨迹;谁能持 续捕获这些轨迹,谁就更有可能形成更强的数据飞轮。 Deepmind 的 Staff Engineer Philipp Schmid 甚至直接给出了一个判断:"The Harness is the Dataset. Competitive advantage is now the trajectories your harness captures (Harness 本身就是数据集。现在真 正的竞争优势,在于你的 harness 能捕获到怎样的执行轨迹) ." 所以我们最近深入研究了一下这个概念,梳理了 Anthropic、OpenAI、Goo ...