Gemini Deep Research Agent
Search documents
腾讯研究院AI速递 20251215
腾讯研究院· 2025-12-14 16:01
生成式AI 一、GPT-5.2上线的24小时,X 大批网友给 GPT-5.2 打差评? 1. OpenAI十周年发布GPT-5.2系列号称"最强专业知识工作模型",但上线24小时后X平台和Reddit用户集体差评, 认为其过于平淡、安全审查过度、情商堪忧; 2. SimpleBench测试显示GPT-5.2得分低于一年前的Claude Sonnet 3.7,在garlic有几个r等简单问题上回答错 误,LiveBench得分低于Opus 4.5和Gemini 3.0; 3. 最受诟病的是安全拒绝机制过于严格,用户反馈模型共情力和语境感知能力下降,在情感支持场景中给出机械且脱 离现实的建议。 https://mp.weixin.qq.com/s/xiOX9i6V-yfnn0pyC6ZlTA 二、OpenAI发布同时,谷歌推出Gemini Deep Research Agent 1. 谷歌在GPT-5.2发布前一小时推出全新版Gemini Deep Research Agent,基于Gemini 3 Pro构建并通过多步强 化学习训练提高准确性减少幻觉; 2. 新版在Humanity's Last Exam测试集 ...
谷歌最新 Gemini Agent 爆击GPT-5.2?人类最后考试得分见分晓!网友:Altman又该发“红色警报”了
AI前线· 2025-12-13 05:33
作者|冬梅 在全球人工智能领域竞争快速升温的当下,谷歌与 OpenAI 再次在同一天抛出重磅更新,令整个行业 的注意力高度集中。 昨天夜里,谷歌发布了全新"重新构想"的 Gemini Deep Research 版本,并首次开放了嵌入式研究智 能体 API。 而几乎同时,OpenAI 正式发布了备受期待的 GPT-5.2(代号 Garlic)。两家公司围绕智能体 (Agent)未来、基础大模型能力边界以及应用生态主导权的竞争,正进入一个前所未有的焦灼阶 段。 这一次,谷歌和 OpenAI 的攻防几乎精确地踩在同一时间窗口,让外界得以清晰观察这两家全球 AI 巨头之间的战略对抗节奏。 谷歌推出全新 Deep Research Agent 谷歌推出的全新 Gemini Deep Research 工具是一款智能 Agent,能够整合海量信息并处理提示信息 中大量的上下文数据。谷歌表示,客户使用 Deep Research Agent 执行的任务范围广泛,从尽职调 查到药物毒性安全研究均有涉及。 谷歌还表示,很快会将这款全新的 Deep Research Agent 集成到其各项服务中,包括谷歌搜索、谷 歌财经、G ...
OpenAI与谷歌竞争不断,半导体设备ETF(159516)涨超2%
Mei Ri Jing Ji Xin Wen· 2025-12-12 05:57
在「红色警报」后,OpenAI拿出了最新的顶级模型GPT-5.2系列,谷歌也率先反击,推出全新版Gemini Deep Research Agent,聚焦上游半导体设备领域的半 导体设备ETF(159516)盘中领涨超2.8%。 资金持续抢筹,半导体设备ETF(159516)近5日净流入超1.4亿元,年初以来份额增长超160%,当前规模超64亿元,居同类产品第一。 基于这些能力提升,OpenAI称为专业知识型工作打造的GPT-5.2是公司至今最强的模型,"GPT-5.2在众多基准测试中都刷新了行业水平,例如GDPval测试 中,这款模型在涵盖44个职业的明确知识型工作任务中表现超过了行业专家。" 来源:OpenAI OpenAI与谷歌竞争不断,AI景气度持续上行 在「红色警报」后,OpenAI 在北京时间本周五拿出了最新的顶级模型 GPT-5.2 系列 —— 迄今为止在专业知识工作上最强大的模型系列。包含GPT-5.2 Instant、Thinking和Pro模式,此时距离OpenAI更新GPT-5.1只过去了一个月。 此次应对挑战,OpenAI拿出了更多"真枪实弹"。GPT-5.2推出了更多智能上的更新,也 ...
谷歌深夜重磅开源,深度研究Agent拿下SOTA,比GPT-5 pro便宜90%
3 6 Ke· 2025-12-12 00:49
智东西12月12日消息,今日凌晨,比OpenAI早一个小时,谷歌甩出了3个Agent大招: Deep Research Agent功能更新,并首次向开发者开放;开源新网络研究Agent基准DeepSearchQA,旨在测试Agent在网络研究任务中的全面性;推出新交 互API(Interactions API)。 Gemini Deep Research是一款专为长期上下文采集和综合任务优化的Agent,其背后的模型是Gemini 3 Pro,通过多步强化学习的扩展搜索,Agent能够自 主地以高精度导航复杂的信息环境。此次更新包括针对特定数据进行网页搜索、更低成本生成研究报告等。 谷歌DeepMind产品经理路卡斯·哈斯( Lukas Haas)在社交平台X上透露,新Gemini Deep Research Agent已经实现SOTA,在谷歌新基准测试上得分 46.4%,在BrowseComp上与GPT-5 Pro相当,价格是其1/10左右。 Deep Research Agent很快将在谷歌搜索、笔记本、谷歌金融中提供,并在Gemini应用中升级。 DeepSearchQA内置了900个手工设计的"因果链 ...