AI浪潮下 北大青年这样守护“提问”的能力
Zhong Guo Qing Nian Bao·2026-01-23 06:30

题目编写审核流程。北京大学化学与分子工程学院供图 2025年年末,北京大学化学与分子工程学院的一间教室里,174名大二学生正面对一场特殊的期中考试。试 卷上,晶体结构的精细解析、反应机理的深度推演、物化性质的定量计算等硬核题目扑面而来,而考生们 的"竞争对手"并非同窗,而是ChatGPT、Gemini、DeepSeek等当下最顶尖的人工智能大语言模型。 这场"云端对决"的背后,是北大青年科研团队在去年12月打造的SUPERChem项目——一套包含500道高难 度试题的基准测试集,旨在用"北大标准"丈量AI在化学领域的真实推理能力。 在团队成员、北京大学化学与分子工程学院2020级博士研究生黄志贤看来,设计这套高难度题库的目的并 不是为了证明AI不行,而是搞清楚AI到底"懂不懂化学",为AI的发展提供更清晰的参考。 在AI大模型技术爆发式发展的当下,人们似乎已经习惯向AI索取答案,"AI能解决各类复杂问题"的声音不 绝于耳,而这群年轻的科研人员选择用最严谨的方式,对技术热潮进行一次冷静的追问。 前沿模型在SUPERChem上的表现。北京大学化学与分子工程学院供图 "在AI发展过程中留下自己的痕迹" 黄志贤在日常 ...