Workflow
推理范式
icon
Search documents
深度|OpenAI联创:GPT-5的突破在于智能开始触及真正的深度认知领域;理想状态应该是默认使用我们的自动选择,而非手动配置
Z Potentials· 2025-09-06 04:40
图片来源: Latent Space Z Hightlights Greg Brockman 是 OpenAI 的联合创始人兼总裁,曾任 Stripe 前 CTO ,致力于推动人工智能技术的发展和普及。本次访谈由 Latent Space 在 2025 年 8 月发 起,深入探讨 GPT-5 与开源项目 GPT-OSS 的最新进展,及 OpenAI 实现通用人工智能的战略路径。 OpenAI 推理能力演进之路 SWYX: 祝贺你们发布了 GPT-5 和 GPT-OSS , OpenAI 领域的所有新进展都令人惊叹。我们稍后会详细探讨这些内容。非常高兴你能来到现场。上周这 一连串的版本发布如同风暴般席卷而来,你此刻的感受如何? Greg Brockman : 太疯狂了,一周内推出这么多成果确实非常疯狂。我们发布了开源模型,这些是我们长期研发的成果。我认为它们真正将 OpenAI 取得 的多项技术进展浓缩到非常精巧的形态中,更易于使用 —— 要知道过去几天其下载量已达数百万次。我们还发布了 GPT-5 ,这同样是我们深耕已久的项 目。看到这些成果面世并成功完成整个发布流程,我真心为团队感到骄傲。 Alessio ...
GPT-5被批过度炒作、性能落后,OpenAI联创揭秘其中原因:我们把它关在 “象牙塔”,和现实世界接触不够
AI前线· 2025-09-04 06:30
整理 | 冬梅 三年前,Sam Altman 凭借 ChatGPT 将 OpenAI 打造成一种文化现象。如今,他将目光投向了 真正的盈利之地 —— 企业市场。 上周,OpenAI 最新人工智能模型 GPT-5 的发布并不顺利。由于批评者猛烈抨击该模型不够直 观,最终公司不得不将付费聊天机器人用户的模型恢复为原有的 GPT-4。 但实际上,GPT-5 的目标用户并非普通消费者,它是 OpenAI 进军企业市场的重要举措。而在企 业市场,竞争对手 Anthropic 早已占据先机。 在 GPT-5 发布一周后,Cursor、Vercel 和 Factory 等初创公司纷纷表示,已将 GPT-5 作为部分 关键产品和工具的默认模型,并且宣称 GPT-5 设置速度更快,在复杂任务上的表现更出色,价 格也更低廉。 一些公司指出,GPT-5 目前在代码和界面设计方面已能与 Claude 相匹敌,甚至实现了超越,而 Anthropic 曾在这一领域占据主导地位。 另一家企业客户 Box,一直在针对长篇、逻辑性强的文档对 GPT-5 进行测试。其首席执行官亚 伦・莱维向 CNBC 表示,该模型是一项 "突破",其推理能力是 ...
GPT-5首次会推理,OpenAI联创曝AGI秘诀,超临界学习吞噬算力,2045金钱无用?
3 6 Ke· 2025-08-17 23:50
「GPT-5,是一个分水岭」。 昨天,OpenAI联创Greg Brockman在Latent Space团队的专访中对GPT-5做出了高度的评价。 这一小时的访谈,含金量极高。 谈及GPT-5时,Greg强调这是OpenAI首个「混合模型」,通过路由器在推理模型与非推理模型之间自动切换。 这种模式降低了使用复杂度,避免用户纠结于「该选哪个版本」。 从性能上看,GPT-5 已经在数学、编程、物理等高智力任务上表现出质变。 对此,Greg将其与前几代旗舰做了一个鲜明的对比。 GPT-3出世后,所具备的文本能力还很浅,甚至连「排序数字」这样的基础任务都做不好。 到了GPT-4,其实用性大幅提升,成为广泛商用的基础,但在真正深度智力上仍有欠缺。 「而GPT-5,则是一个分水岭」。 GPT-5在极难的领域上,如IMO、IOI国际比赛中,已经能写出与最优秀人类相当的证明。 这在过去是极大的挑战,而现在我们能用少数人团队把它解决掉。 从GPT-5 的意义、推理与强化学习的转折点,到算力瓶颈、AI工程实践,再到对未来社会的预判,Greg Brockman的对话透露了OpenAI最新战略的思考。 他还表示,「当内部训完GPT ...
深度|OpenAI 多智能体负责人:许多人正在构建的产品并未真正遵循Scaling Law,最终都会被所取代
Z Potentials· 2025-07-20 02:48
Group 1 - Noam Brown is the head of multi-agent research at OpenAI and the developer of the AI negotiation system Cicero, which achieved a top 10% performance level in the game Diplomacy [1][3][4] - Cicero utilizes a small language model with 2.7 billion parameters, demonstrating that smaller models can still achieve significant results in complex tasks [8][9] - The development of Cicero has led to discussions about AI safety and the controllability of AI systems, with researchers expressing satisfaction over its highly controllable nature [9][10] Group 2 - The conversation highlights the evolution of AI language models, particularly the transition from earlier models to more advanced ones like GPT-4, which can pass the Turing test [7][8] - There is an ongoing exploration of how to enhance the reasoning capabilities of AI models, aiming to extend their reasoning time from minutes to hours or even days [9][55] - The potential for multi-agent systems to create a form of "civilization" in AI, similar to human development through cooperation and competition, is discussed as a future direction for AI research [56] Group 3 - The podcast emphasizes the importance of data efficiency in AI, suggesting that improving algorithms could enhance how effectively models utilize data [36][39] - The role of reinforcement learning fine-tuning is highlighted as a valuable method for developers to specialize models based on available data, which will remain relevant even as more powerful models are developed [30][31] - The discussion also touches on the challenges of software development processes and the need for improved tools to facilitate code review and other aspects of development [50][51]