Codeforces难题不够刷?谢赛宁等造了个AI出题机,能生成原创编程题
3 6 Ke·2025-10-20 08:15
Rich Sutton 曾说过:「AI 只能在可以自我验证的范围内创造和维持知识。」爱因斯坦与英费尔德在合著的《物理学的进化》中也写道:「提出一个问题 往往比解决问题更重要,后者或许仅仅是数学或实验技巧的问题。而提出新的问题、新的可能性,从新的角度审视旧的问题,则需要创造性的想象力,并 标志着科学的真正进步。」 随着大型语言模型(LLM)朝着通用能力迈进,并以通用人工智能(AGI)为最终目标,测试其生成问题的能力也正变得越来越重要。尤其是在将 LLM 应用于高级编程任务时,因为未来 LLM 编程能力的发展和经济整合将需要大量的验证工作。 首先,为编程竞赛出题需要比解决问题更深刻的算法理解。 例如,基础问题可能会被归结为可识别的模板,用简单的技巧就能解决;许多标准的编程问题也常常允许提交部分正确或样板化的解决方案,这可能会掩 盖错误的推理过程。而竞赛编程问题有着严格的标准,旨在评估对底层算法设计原则、数据结构和复杂性权衡的更深层次理解。验证数量庞大的可能解 法,并充分覆盖各种捷径或边界情况是极具挑战性的,但这对于竞赛编程问题而言是必需的。因此,出题不仅包含了解决问题的所有挑战,甚至还超越了 它。 其次,更好的出 ...