AI浪潮下北大青年这样守护“提问”的能力

题目编写审核流程。北京大学化学与分子工程学院供图 2025年年末，北京大学化学与分子工程学院的一间教室里，174名大二学生正面对一场特殊的期中考试。试卷上，晶体结构的精细解析、反应机理的深度推演、物化性质的定量计算等硬核题目扑面而来，而考生们的"竞争对手"并非同窗，而是ChatGPT、Gemini、DeepSeek等当下最顶尖的人工智能大语言模型。这场"云端对决"的背后，是北大青年科研团队在去年12月打造的SUPERChem项目——一套包含500道高难度试题的基准测试集，旨在用"北大标准"丈量AI在化学领域的真实推理能力。在团队成员、北京大学化学与分子工程学院2020级博士研究生黄志贤看来，设计这套高难度题库的目的并不是为了证明AI不行，而是搞清楚AI到底"懂不懂化学"，为AI的发展提供更清晰的参考。在AI大模型技术爆发式发展的当下，人们似乎已经习惯向AI索取答案，"AI能解决各类复杂问题"的声音不绝于耳，而这群年轻的科研人员选择用最严谨的方式，对技术热潮进行一次冷静的追问。前沿模型在SUPERChem上的表现。北京大学化学与分子工程学院供图 "在AI发展过程中留下自己的痕迹" 黄志贤在日常 ...