Gemini 3 Deepthink
Search documents
11位顶尖数学家发了篇没结果的论文,陶哲轩推荐都关注一下
猿大侠· 2026-02-11 04:11
一水 发自 凹非寺 量子位 | 公众号 QbitAI 获陶哲轩转发,arXiv上的一篇新论文正在引起巨大关注! 挤进前排后发现,原来这是一项 由11位全球顶尖数学家发起的AI实验 —— 让AI在规定期限内,解决他们各自在真实研究过程中产生的10道"研究级"难题,以此探索"AI+数学"的能力边界。 而且走的还是高斯时代的路子——人类先证明出来,但先不公布答案和过程,等到了合适时间再公开,避免AI偷偷看答案。 以前这是一项为保护数学家证明自己优先解决某道问题的做法,而在AI时代却有了新玩法。 在陶哲轩看来,这项实验非常有意思: 当前"一次性"AI提示似乎难以解决这些问题,但它们已被人类领域专家攻克。可以预见,配备AI工具的其他领域专家也能解决其中相当 一部分。 这些问题的技术门槛相当高,非领域专家难以验证AI生成的任何输出结果 。 因此在我看来,要让非专家解决其中任何一个问题都极具挑战性——当然,意外惊喜也并非不可能。在截止期限前,这项实验能否产生 任何显著成果,将十分值得关注。 解完10道数学题,然后…藏起证明过程 概括而言,通过提出一套名为First Proof的实验方案,这群数学家想做一件事—— 检验当前A ...
11位顶尖数学家发了篇没结果的论文,陶哲轩推荐都关注一下
量子位· 2026-02-08 04:46
一水 发自 凹非寺 量子位 | 公众号 QbitAI 获陶哲轩转发,arXiv上的一篇新论文正在引起巨大关注! 挤进前排后发现,原来这是一项 由11位全球顶尖数学家发起的AI实验 —— 让AI在规定期限内,解决他们各自在真实研究过程中产生的10道"研究级"难题,以此探索"AI+数学"的能力边界。 而且走的还是高斯时代的路子——人类先证明出来,但先不公布答案和过程,等到了合适时间再公开,避免AI偷偷看答案。 以前这是一项为保护数学家证明自己优先解决某道问题的做法,而在AI时代却有了新玩法。 在陶哲轩看来,这项实验非常有意思: 当前"一次性"AI提示似乎难以解决这些问题,但它们已被人类领域专家攻克。可以预见,配备AI工具的其他领域专家也能解决其中相当 一部分。 这些问题的技术门槛相当高,非领域专家难以验证AI生成的任何输出结果 。 因此在我看来,要让非专家解决其中任何一个问题都极具挑战性——当然,意外惊喜也并非不可能。在截止期限前,这项实验能否产生 任何显著成果,将十分值得关注。 好好好,既然老陶如此安利了,咱这就开扒完整实验过程(doge)。 解完10道数学题,然后…藏起证明过程 概括而言,通过提出一套名为Fi ...