Workflow
AI答IMO难题坦承“不会”,OpenAI:这就是自我意识
量子位·2025-08-01 09:05

当IMO推理模型会在缺乏有效证据时表示"我不确定",这会显著减少隐藏错误。 在AI摘下IMO金牌后,OpenAI金牌小分队成员 Alex Wei 、 Sheryl Hsu 和 Noam Brown 参与了红杉资本组织的一场对话,揭秘模型攻 克精英数学难题的底层突破。 时令 发自 凹非寺 量子位 | 公众号 QbitAI 这一次,"不会"竟成了大模型的高光时刻。 虽然在IMO第6题上得了零分,OpenAI的金牌模型却展现了"高智商的诚实"。 正如OpenAI研究员 Noam Brown 在最新访谈中所揭示的: 有网友帮忙总结了个太长不看版: 与过去那些"看起来完美,实则错误"的幻觉式答案不同,这一代大模型开始学会"承认自己不会"。 它标志着模型正在从胡编乱造的幻觉式回答,转向更加可靠且具有"自我认意识"的全新阶段。 三位成员还在这场对话中,分享了更多关于冲刺IMO的有趣细节。 IMO金牌模型能承认自己不知道 尽管数学家与计算机科学家一致认可IMO金牌模型的价值。 但他们常常抱怨,当模型遇到知识盲区时,它总会输出一个令人信服但错误的答案。 他们不得不耗费大量精力逐行验算,才能甄别那些幻觉陷阱。 IMO第6题让大模 ...