Workflow
OpenAI发布ChatGPT Agent:部分能力超越人类,但做电子表格仍不如人类
Di Yi Cai Jing·2025-07-18 05:13

"现在ChatGPT可以思考和行动,能主动从技能工具箱中选择工具,完成一些任务。"OpenAI介绍,这些任务包括"查看我的日历并根据近期新闻介绍即将 举行的会议""分析三个竞争对手并创建幻灯片"等。此外,用户还可以执行一些重复任务,例如将屏幕截图转换为可编辑PPT、用新的财务数据更新电子 表格、重新安排会议。 在评估模型编辑真实场景电子表格能力的测试中,ChatGPT Agent的最高得分45.5%远低于人类得分71.3%。 7月,OpenAI尚未按照此前计划发布GPT-5,智能体方面的更新先行面世了。 北京时间7月18日凌晨,OpenAI直播发布了ChatGPT Agent,这一智能体融合了Operator智能体网页交互能力以及Deep Research功能,使ChatGPT内置计算 机能帮助用户完成复杂的多步骤任务。 不过,虽然ChatGPT Agent在SpreadsheetBench测试(评估模型编辑真实场景电子表格的能力)中,表现超过OpenAI的其他模型,但其最高得分45.5%还是 远低于人类得分71.3%。 据介绍,ChatGPT的工作过程包括浏览网站、过滤结果、提醒用户登录相关账号、运行账号、 ...