Workflow
小模型优化
icon
Search documents
英伟达4B小模型击败GPT-5 Pro,成本仅1/36
3 6 Ke· 2025-12-08 07:23
英伟达小模型持续获胜。 ARC-AGI 2最新成绩,4B小模型NVARC以27.64%的公开榜成绩力压GPT-5 Pro 18.3%登顶榜首。 且每任务成本仅20美分,大约是GPT-5 Pro单任务成本(超过7美元)的1/36。 据官方分析,此次NVARC夺冠的亮点在于零预训练深度学习方法,没有依赖大规模通用数据集进行前期预训练,规避了预训练模型的领域偏见、数据依 赖等问题。 成绩出炉后,官方访谈到了NVARC团队的Jean-Francois Puget和Ivan Sorokin,进行技术剖析。 快来看看"性价比之王"是如何"练"成的? 而ARC-AGI 2确实是一个消除了与公共训练数据重叠的更高难度测试,主要是看测试模型能否高效地获取超出其训练数据的新技能。 不靠参数堆料 英伟达的策略是将复杂推理移至离线的合成数据管道,训练能在评估时快速运行的较小模型。 简单来说就是大规模合成高质量数据,然后对现有模型进行优化,并且将昂贵的计算工作转移到离线进行。 由于Kaggle比赛对计算资源限制非常严格,团队意识到,他们不能直接使用那些需要超强算力的大型LMM来进行复杂的、一步一步的推理和代码生成。 因此他们改变了思路 ...