世界顶尖数学家在测试中震惊地发现,人工智能模型已经接近数学天才了
3 6 Ke·2025-06-08 23:49
"AI 推理模型已经接近数学天才" 五月中旬的一个周末,一个秘密的数学会议召开了。 30 位世界著名的数学家齐聚美国加州伯克利。小组成员与一个"推理"聊天机器人展开对决,该机器人 的任务是解决他们为测试其数学能力而设计的问题。 在向机器人抛出两天教授级别的问题后,研究人员震惊地发现,它能够回答一些世界上最难解决的问 题。"我的同事们真的说这些模型接近数学天才了,"弗吉尼亚大学数学家、会议领导者兼评委 Ken Ono 说。 该聊天机器人由o4-mini提供支持,这是一种推理大型语言模型 (LLM)。它由 OpenAI 训练,能够进行高 度复杂的推理。谷歌的同类产品Gemini 2.5 Flash具有类似的能力。与支持早期版本 ChatGPT 的 LLM 一 样,o4-mini 可以学习预测序列中的下一个单词。然而,与早期的 LLM 相比,o4-mini 及其等效模型更 轻量级、更灵活,它们在专门的数据集上进行训练,并有来自人类的强化训练。这种方法使聊天机器人 能够比传统的 LLM 更深入地研究复杂的数学问题。 为了追踪 o4-mini 的进展,OpenAI 此前委托 Epoch AI(一家负责对 LLM 进行基 ...