Workflow
OpenAI并未让DeepSeek惊出一身冷汗
Seek .Seek .(US:SKLTY) Hu Xiu·2025-04-17 11:51

出品 | 虎嗅科技组 作者 | 房晓楠 编辑 | 苗正卿 头图 | 视觉中国 "OpenAI的创新好像到瓶颈期了。"一位业界人士这样说道。 今日凌晨,预热了很久的OpenAI o3模型完整版终于面世,且与以往直播"挤牙膏"式的依次、慢吞发布 方式不同的是,这次o3和o4-mini是同时发布。 在OpenAI官方的陈述中,o3和o4-mini的亮点主要在于可以组合调用ChatGPT中的各个工具,像是网络 搜索、Python、图像分析、文件解释和图像生成等。这可以看作是OpenAI开始后发补足自身在Agent能 力上的探索。 其中,o3作为推理模型,在编程、数学、科学、视觉感知等多个维度的基准测试中都刷新了纪录。比如 在Codeforces、SWE-bench、MMMU基准测试中,视觉任务准确率高达87.5%,而MathVista达到 75.4%。 其实分数、榜单,这些都是常规操作。相较于以往,这次的最大不同在于,o3和o4-mini将上传的图像 直接集中到思维链中,这就意味着,图像不仅仅是被看到,还能被用来作为思考过程中的一部分。 从OpenAI团队成员、中科大校友Jiahui Yu发布的帖文来看,"用图像思考 ...