o3 Alpha

Search documents
Altman 秀新模型“翻车”,谷歌补刀躺赢!OpenAI 前员工爆肝3天,编程再赢老东家模型!
AI前线· 2025-07-22 09:32
整理 | 华卫 近期, OpenAI 接连在多个场合携不同新模型"上桌",且这些模型均还未公开发布。上周,OpenAI 分别曝出了两款与 o3 有关联但都未公开过的新模型。其中,一款被疑是"伪装的 GPT-5",另一款则 在一场 AI 模型和人类选手都参与的编程世界锦标赛中拿到了第二名的成绩。 最新上场的是,一款 OpenAI 宣称"在国际数学奥林匹克竞赛(IMO)中取得了金牌级别成绩"的模 型。每年参加国际数学奥林匹克竞赛(IMO)的学生,都是全球范围内极具天赋的年轻数学才俊。今 年,他们迎来了一批实力更强的 AI 模型的挑战。刚刚,谷歌 DeepMind 联合创始人兼 CEO Demis Hassabis 亦宣布,Gemini Deep Think 在 IMO 中达到了金牌水平。 然而,虽然都宣布拿到金牌的成绩,但评价风向却差不少。不少网友认为:"OpenAI 为了博眼球啥 都干得出来。没官方分数,没点耐心,更没底线。""谷歌 DeepMind 的表现堪称典范,非常钦佩。" OpenAI 模型 IMO 输给谷歌? "进步惊人",用 Hassabis 的话来说。谷歌表示,其经过专门优化的数学人工智能在六道题 ...
“AI登月时刻”,OpenAI模型摘取奥数金牌
Hu Xiu· 2025-07-20 01:41
重大意义在于,这是一个通用推理模型,而不是一个专门用来解数学题的专门系统,也没有经过验证的奖励信号,即它不是依赖于"有标准答案、实时打 分的奖励"来学会的,而是靠更通用的推理和新技术,在长时间复杂的过程中,做出了正确的推理和证明。 OpenAI证明,尽管经历了Meta疯狂的挖角,它依然保持了顶尖研究人才的密度,做出重大的研究突破。本周OpenAI的模型o3 alpha在AtCoder世界巡回赛 2025决赛中仅逊于人类编程奇才Psyho,获得第二名;测试中强于o3 pro,是最好的编程及物理模型。 这样,OpenAI目前拥有了最强的编程及数学模型,让它再次碾压DeepMind,Anthropic,Grok等,也再次与中国引领的开源模型拉开了差距。 OpenAI的一个通用推理模型,在刚结束的国际奥林匹克数学竞赛(IMO)中达到了金牌的水平。AI登月时刻,社交媒体一夜无眠,AI圈子沸腾了。 在与人类参赛者完全相同的规则下,OpenAI的模型挑战了2025年IMO试题:两场各4.5小时的考试、禁用任何工具和互联网、只能阅读官方题面并以自然 语言撰写完整证明。模型完整解出了6题中的5题。每道题都由三位前IMO奖牌得主 ...