Workflow
模型记忆
icon
Search documents
清华唐杰:领域大模型,伪命题
量子位· 2025-12-26 08:52
清华教授唐杰最新在微博发表了自己关于AI的一些感悟,非常值得一读~ 编辑部 整理 量子位 | 公众号 QbitAI 共八个小点 ,不算长篇大论,但扎实有料: 兹以推文刊载,供大家广泛阅读、传播。 唐杰表示,发微博是想分享一下,希望对大家有用。 以下为其感悟原文: 01,关于scaling基座模型 预训练使得大模型已经掌握世界常识知识,并且具备简单推理能力。 更多数据、更大参数和更饱和的计算仍然是scaling基座模型最高效的办法。 02,关于激活对齐和增强推理能力 基座模型继续scaling仍然高效; 真实使用体验想进一步上台阶,长尾能力的对齐和推理增强绕不过去; Agent代表模型开始进入环境、开始形成生产力; 一旦模型进入持续交互的世界,记忆机制、在线学习、自我评估就会成为核心工程题,而不是可选项; AI终究要落到替人完成工作、创造增量价值上; 领域大模型是个伪命题; …… 激活对齐和增强推理能力 ,尤其是激活更全面的长尾能力是保证模型效果的另一关键,通用benchmark的出现一方面评测了模型通用效果, 但也可能使得很多模型过拟合。 真实场景下是如何让模型更快、更好的对齐长尾的真实场景,增强实际体感。 ...