国产AI拿下国际物理奥赛金牌,13项顶级竞赛豪取12金1银,划重点:开源
量子位·2025-11-22 03:07
西风 发自 凹非寺 量子位 | 公众号 QbitAI 首个拿下 国际物理 奥林匹克竞赛IP hO 2025 理论考试金牌的开源模型, 出自国产 。 上海人工智能实验室团队推出新模型家族, 代号 P1 。 在IPhO 2025理论考试中,P1-235B-A22B 取 得21.2/ 30分 , 成为首个达到该金牌线的开源模型 ,仅次于Gemini-2.5-Pro与GPT-5。 不仅如此, 引入PhysicsMinions智能体框架后,P1成绩进一步提升 。 在团队构建的包含最新13项顶级物理竞赛的HiPhO基准上,P1-235B-A22B 平均成绩从35.9提高到3 8.4 ,在所有33个顶流模型中排名第一 ,超过Gemini-2.5-Pro (37.7) 和GPT-5 (37.4) 。 并且,在中国物理奥林匹克CPhO 2025人工评分中,P1-235B- A22B 获得 227/320分 ,显著超过当届全国金牌第一名人类选手 (199分) 。 开源方面团队也做得很彻底,从模型、算法到评测集、再到智能体框架,都将全链路开源。 下面具体来看P1究竟是如何做到的。 多阶段强化学习+智能体框架 为让模型学习类似人类顶 ...