Workflow
o3深度解读:OpenAI终于发力,agent产品危险了吗?
Hu Xiu·2025-04-25 14:21

我们在2025年Q1的大模型季报中提到,在AGI路线图上,只有智能提升是唯一主线,因此我们持续关注头部AI Lab的模型发布。上周OpenAI密集发布了o 系列最新的两个模型o3和o4-mini,开源了Codex CLI,还推出了在API中使用的GPT 4.1。本文将着重对这些新发布进行解读,尤其是o3 agentic和多模态 CoT新能力。 我们认为OpenAI在数次平淡的更新后,终于拿出了有惊艳表现的o3。融合了tool use能力后,模型表现已经覆盖了agent产品常用的use case。Agent产品开 始分化出两类路线:一类是像o3那样把tool use通过CoT内化到模型中,模型可以用写代码调用的方式执行任务;另一类是类似Manus,把工作流程外化 成人类OS中的computer use。同时OpenAI已经把agent产品作为了未来产品商业化收入占比的大头,我们有理由担心通用agent产品在大模型公司主航道上 被覆盖。 长线看,RL Scaling是进步斜率最大的方向,上周两位RL教父Richard Sutton和David Silver发布了一篇很重要的文章Era of Experience, ...