Workflow
陶哲轩都惊了,o3首战「AI奥数」碾压夺冠,开源军团仅差5分狂追OpenAI
3 6 Ke·2025-09-08 03:06

AI界奥数杯,重启了!OpenAI o3首次杀入赛场,在算力拉满的情况下,直接以最高47分的逆天成绩炸翻全场。值得一提的是,前五模型合并 得分仅与o3差5分,开源与闭源差距再次缩小。 「AI奥数」第二届大赛,英伟达团队(NemoSkills)曾夺下第一! 这一次,AIMO2组委会再次重启赛题,OpenAI o3首次参赛,就拿下了最亮眼的成绩。 陶哲轩激动表示,过去,这个比赛仅限于开源模型,计算资源也卡得比较紧。 庆幸的是,AIMO第二轮比赛中,NemoSkills和清华微软imagination research、以及o3同时参赛。 测试分为两种条件:一种给差不多的计算资源,另一种是放开算力随便跑。 结果也在意料之中,算力给得越足,模型表现越好。 在算力管够的情况下,OpenAI o3成绩直接飙到了47分(满分50分)。甚至,每道题给两次机会的话,还能冲满分。 另一个有意思的情况是,在计算资源相同的情况下,开源模型和商业模型的差异其实并不大。 今天,这份完整的研究测试报告正式放出。 报告地址:https://aimoprize.com/updates/2025-09-05-the-gap-is-shrinki ...