Workflow
奖励黑客行为
icon
Search documents
Scaling时代终结了,Ilya Sutskever刚刚宣布
机器之心· 2025-11-26 01:36
机器之心报道 机器之心编辑部 「Scaling 时代已经终结。」 当这句话出自 Ilya Sutskever 之口时,整个 AI 社区都无法忽视。作为 Safe Superintelligence Inc. 的创始人,他在最新访谈中抛出的这 一断言,不仅令业内震惊,更收获了诸多重量级人物的共鸣。 这场由 Dwarkesh Patel 主持、长达 95 分钟的深度对话,上线短短数小时便在 X 平台上突破了百万浏览量。从大模型的技术现状到 研究品味,再到对超级智能的终极构想,Ilya 毫无保留。 以下是本次访谈的精华总结,带你读懂这位顶尖科学家的判断与展望。 视频地址:https://www.dwarkesh.com/p/ilya-sutskever-2 1. 模型能力的「参差不齐」(Model Jaggedness) 与泛化 现象: Ilya 指出当前模型存在一种奇怪的矛盾 —— 它们能在高难度的评测(Evals)中表现出色,却可能在简单的任务上反复 犯错(如修 Bug 时引入新 Bug)。 解释: 他认为这可能源于「奖励黑客行为」(Reward Hacking)。人类研究员为了让评测分数好看,过度针对评测集进 ...