通用强化学习

Search documents
陶哲轩回应OpenAI新模型IMO夺金!GPT-5测试版也曝光了
量子位· 2025-07-20 02:49
梦晨 西风 发自 凹非寺 量子位 | 公众号 QbitAI OpenAI最新模型曝光了,在2025年国际数学奥林匹克竞赛(IMO)上达到了 金牌 水平! IMO被公认为全球最顶尖的数学竞赛,每年只有不到8%的参赛者能够获得金牌。而现在,一个AI模型做到了。 新模型最终成绩:新模型在总共6道题中成功解决了5道,获得35分(满分42分),超过了今年的金牌线。 OpenAI员工 Alexander Wei 还透露, GPT-5即将发布 ,但IMO金牌模型是一个实验性研究,在几个月内都没有计划发布。 他特别强调,这次成功并非依靠针对特定任务的狭隘方法,而是在通用强化学习和测试时计算扩展方面取得了新突破。 与此同时,第三方机构的开源代码中被发现 GPT-5-reasoning-alpha-2025-07-13 的字样。 这段代码被挖出来后很快就被删除或隐藏,结合OpenAI在新模型发布前会找第三方机构进行安全测试的惯例—— 种种迹象表明, GPT-5离我们不远了 。 35分斩获金牌,解题过程完全模拟人类考试 具体来看OpenAI的实验性新模型,这次评测可不是随便做个题那么简单。 OpenAI团队让模型在与人类选手完全相 ...
深夜开源首个万亿模型K2,压力给到OpenAI,Kimi时刻要来了?
机器之心· 2025-07-12 02:11
| 机器之心报道 | | --- | | 编辑:泽南、杜伟 | 没想到,Kimi 的首个基础大模型开源这么快就来了。 昨晚,月之暗面正式发布了 Kimi K2 大模型并开源,新模型同步上线并更新了 API,价格是 16 元人民币 / 百万 token 输出。 这次发布赶在了最近全球大模型集中发布的风口浪尖,前有 xAI 的 Grok 4,下周可能还有谷歌新 Gemini 和 OpenAI 开源模型,看起来大模型来到了一个新的技术 节点。或许是感受到了 Kimi K2 的压力,就在刚刚,奥特曼发推预告了自家的开源模型。不过,网友似乎并不看好。 本次开源的共有两款模型,分别是基础模型 Kimi-K2-Base 与微调后模型 Kimi-K2-Instruct,均可商用 。 根据 Hugging Face 页面数据显示, Kimi K2 的下载量在前 20 分钟便接近了 12K。 博客链接:https://moonshotai.github.io/Kimi-K2/ GitHub 链接:https://github.com/MoonshotAI/Kimi-K2 Kimi 展示了 K2 的一些实际应用案例,看起来它能自动 ...