Workflow
Gemini Deep Research
icon
Search documents
计算机行业周报:大模型持续迭代,AI商业化加速-20251217
Shanghai Securities· 2025-12-17 11:22
[Table_Rating] 增持(维持) able_Summary] [Table_Summary ◼ 市场回顾 ] [行业Table_Industry] : 计算机 日期: shzqdatemark [Table_Author] 分析师: 章锋 E-mail: zhangfeng@shzq.com SAC 编号: S0870525030002 [Table_QuotePic] 最近一年行业指数与沪深 300 比较 [Table_ReportInfo] 相关报告: 《大模型持续升级,端侧应用加速落地》 ——2025 年 12 月 08 日 《AI 变革持续,算力需求景气》 ——2025 年 12 月 03 日 《科技大厂持续引领 AI 创新》 -20% -15% -10% -5% -1% 4% 9% 14% 19% 12/24 02/25 05/25 07/25 09/25 12/25 计算机 沪深300 2025年12月17日 大模型持续迭代,AI 商业化加速 ——计算机行业周报(2025.12.08—2025.12.12) 过 去 一 周 (12.08-12.12) 上 证 综 指 下 跌 0.34%, ...
传媒行业AI周度跟踪之四十六:OpenAI 发布 GPT-5.2,谷歌开源深度研究 Agent-20251214
GF SECURITIES· 2025-12-14 08:45
[Table_Page] 跟踪分析|传媒 证券研究报告 [Table_Summary] [Table_Title] 传媒行业•AI 周度跟踪之四十六 OpenAI 发布 GPT-5.2,谷歌开源深度研究 Agent | [Table_Gr ade] 行业评级 | 买入 | | --- | --- | | 前次评级 | 买入 | | 报告日期 | 2025-12-14 | 核心观点: [Table_PicQuote] 相对市场表现 -24% -14% -5% 5% 14% 24% 12/24 02/25 05/25 07/25 09/25 12/25 传媒 沪深300 | [分析师: Table_Author]旷实 | | | --- | --- | | | SAC 执证号:S0260517030002 | | | SFC CE No. BNV294 | | | 010-59136610 | | | kuangshi@gf.com.cn | | 分析师: | 廖志国 | | | SAC 执证号:S0260525060001 | | | 021-38003665 | | | liaozhiguo@gf.com.c ...
谷歌最新 Gemini Agent 爆击GPT-5.2?人类最后考试得分见分晓,网友:Altman又该发“红色警报”了
3 6 Ke· 2025-12-12 10:02
在全球人工智能领域竞争快速升温的当下,谷歌与 OpenAI 再次在同一天抛出重磅更新,令整个行业的注意力高度集中。 昨天夜里,谷歌发布了全新"重新构想"的 Gemini Deep Research 版本,并首次开放了嵌入式研究智能体 API。 而几乎同时,OpenAI 正式发布了备受期待的 GPT-5.2(代号 Garlic)。两家公司围绕智能体(Agent)未来、基础大模型能力边界以及应用生态主导权的 竞争,正进入一个前所未有的焦灼阶段。 这一次,谷歌和 OpenAI 的攻防几乎精确地踩在同一时间窗口,让外界得以清晰观察这两家全球 AI 巨头之间的战略对抗节奏。 1 谷歌推出全新 Deep Research Agent 谷歌推出的全新 Gemini Deep Research 工具是一款智能 Agent,能够整合海量信息并处理提示信息中大量的上下文数据。谷歌表示,客户使用 Deep Research Agent 执行的任务范围广泛,从尽职调查到药物毒性安全研究均有涉及。 谷歌还表示,很快会将这款全新的 Deep Research Agent 集成到其各项服务中,包括谷歌搜索、谷歌财经、Gemini 应用以及 ...
谷歌的阳谋:在GPT-5.2发布日,推出史上“最深度”研究型Agent
硬AI· 2025-12-12 09:34
谷歌推出迄今最强的深度研究型Agent——GeminiDeep Research的"重制版",试图定义Agent 的基础设施级入口。未来 可能不是用户"谷歌一下",而是你的Agent替你谷歌一切。 硬·AI 作者 |卜淑情 编辑 | 硬 AI 在全球AI叙事走向"Agent时代"的关键节点,谷歌选择了一个颇具戏剧性的发布时机。 周四,就在OpenAI端出备受期待的 GPT-5.2(内部代号 Garlic)之日,谷歌同步推出了迄今最强的深度 研究型Agent—— Gemini Deep Research 的"重制版",并宣称其基于旗下最先进的Gemini 3 Pro模型。 同日,DeepMind还 宣布将在英国建立首个自动化研究实验室 ,利用AI与机器人加速材料科学实验。 这不是"撞车",更像一场精心策划的阳谋:在竞争对手聚焦全球目光时,谷歌以一款更具战略意味的产品 回应——将Agent 推向操作系统级能力。 01 从"写报告"到"嵌入应用" 谷歌试图定义Agent的基础设施级入口 全新 Gemini Deep Research已不是传统意义上的"自动写研究报告"的工具,它被定位为: 换句话说:未来不是用户"谷 ...
GPT-5.2获封“最强打工人”,谷歌同日以Gemini“性价比”系列应战
Tai Mei Ti A P P· 2025-12-12 08:22
图片由AI生成 "我从未像现在这样对我们的研发和产品路线图,以及实现我们使命的整体方向感到如此乐观。" 12月12日,在正式上线GPT-5.2的同时,OpenAI CEO萨姆·奥尔特曼(Sam Altman)发布了一篇十周年 纪念文章中这样说。 他极力向外界展现着自己依旧自信的一面。毕竟,虽然GPT大模型和ChatGPT聊天机器人至今仍是当前 AI大潮的造浪者,但想必此刻,奥尔特曼感受到的竞争压力堪称空前。 今年以来,DeepSeek、Grok、Claude等竞争者的强势追赶,尤其是谷歌上个月推出的Gemini 3大放异 彩,都将AI大模型竞争推上了更新的高度。 最近,奥尔特曼先是在内部备忘录中提示员工,需要接受最好的大模型不出自家之手的事实,继而,又 发出公司首个"红色警报",强调"立即行动,集中所有资源夺回领先地位"。 截图来自社交平台X 只有更强大的产品,才能支撑自信的底气。 在十周年纪念日这天,OpenAI重磅发布预热了一周多的GPT-5.2,评测表现再次反超所有竞争对手。 但谷歌不甘示弱,几乎在同一时间发布了新品,让这场大模型之争的战况再次升级。 GPT-5.2获评"最强AI打工人",但"工资"很高 ...
谷歌的阳谋:在GPT-5.2发布日,推出史上“最深度”研究型Agent
美股IPO· 2025-12-12 07:34
谷歌推出迄今最强的深度研究型Agent——GeminiDeep Research的"重制版",试图定义Agent 的基础设施级入口。未来可能不是用户"谷歌一下", 而是你的Agent替你谷歌一切。 能持续执行数分钟甚至数小时、多步骤推理任务的长链式推理Agent 这些能力普遍指向一个趋势: 谷歌正试图把Deep Research变成未来AI时代的"搜索引擎底层能力"。 为了让开发者把Deep Research更轻松地嵌入自己的应用,谷歌推出了全新的 Interactions API 。这等于是把"搜索+多步骤推理+评估"打包成操作系统 级服务。 在全球AI叙事走向"Agent时代"的关键节点,谷歌选择了一个颇具戏剧性的发布时机。 周四,就在OpenAI端出备受期待的 GPT-5.2(内部代号 Garlic)之日,谷歌同步推出了迄今最强的深度研究型Agent—— Gemini Deep Research 的"重制版",并宣称其基于旗下最先进的Gemini 3 Pro模型。同日,DeepMind还宣布将在英国建立首个自动化研究实验室,利用AI与机器人加速材料科 学实验。 这不是"撞车",更像一场精心策划的阳谋:在 ...
谷歌智能体发力:增强版Gemini Deep Research和专属API都来了
量子位· 2025-12-12 06:41
闻乐 发自 凹非寺 量子位 | 公众号 QbitAI OpenAI强势更新,谷歌也没闲着。 正式发布增强版的 Gemini Deep Research ,基于Gemini 3 Pro构建,专门减少幻觉,在复杂信息检索与分析任务上表现领先,很快将被 集成到谷歌搜索、NotebookLM、Google Finance以及升级版的Gemini App中。 谷歌还配套推出了 DeepSearchQA基准测试集 ,为深度搜索与研究任务提供了更全面的评估标准。 | DSQA-full.csv (355.11 kB) | | | | 2 | | | --- | --- | --- | --- | --- | --- | | Detail Compact | Column | | | 4 of 4 columns | V | | A problem | | | | | | | | | | Valid ■ Mismatched ■ | 900 0 | 100% 0% | | 900 | | | | | | | | | | Missing ■ | O | 0% | | unique values | | | Unique | 9 ...
对抗 OpenAI GPT-5.2,谷歌推出Gemini Deep Research智能体
Huan Qiu Wang Zi Xun· 2025-12-12 03:53
为解决现有评测难以体现真实世界多步骤研究复杂性的问题,谷歌同步开放DeepSearchQA数据集与工 具。该基准涵盖17个领域、900个"因果链"任务,每个任务的每一步均依赖前序分析,要求智能体生成 详尽答案集,以此精准衡量其研究精度与检索全面性。此外,DeepSearchQA还可作为"思考时间"效益 的诊断工具,谷歌内部测试显示,增加智能体的搜索与推理步骤可显著提升其任务表现,这一方向将在 未来版本中持续探索。目前,开发者可访问该数据集、排行榜与Colab示例,并查阅相关技术报告。 在实际应用场景中,Gemini Deep Research已在多个对精度和上下文理解要求较高的行业展现出显著价 值。在金融服务领域,企业借助该智能体自动化完成尽职调查中的早期信息收集工作,整合市场信号、 竞争格局与合规风险等关键信息,大幅提升研究效率;在生物技术领域,Axiom Bio利用其处理药物毒 性预测相关的文献分析,获得了更高的研究深度与颗粒度,有效加速了药物开发流程;在市场研究等领 域,该智能体也凭借其强大的信息整合能力助力企业提升决策科学性。 通过此次推出的Interactions API,开发者可调用Gemini ...
Google launched its deepest AI research agent yet — on the same day OpenAI dropped GPT-5.2
TechCrunch· 2025-12-12 00:18
Core Insights - Google has launched a reimagined version of its research agent, Gemini Deep Research, based on the Gemini 3 Pro model, which enhances its capabilities beyond just producing research reports [1] - The new agent allows developers to integrate Google's research capabilities into their applications through the Interactions API, marking a significant step towards agentic AI [1][3] - Gemini Deep Research is designed to synthesize large amounts of information and is utilized for various tasks, including due diligence and drug toxicity safety research [2] Product Features - The new deep research agent will be integrated into several Google services, such as Google Search, Google Finance, the Gemini App, and NotebookLM, indicating a shift towards AI-driven information retrieval [3] - Gemini 3 Pro is touted as Google's "most factual" model, specifically trained to reduce hallucinations during complex tasks, which is crucial for maintaining accuracy in long-running decision-making processes [3][4] Benchmarking and Competition - Google has introduced a new benchmark called DeepSearchQA to evaluate agents on complex, multi-step information-seeking tasks, which has been open-sourced [5] - The performance of Gemini Deep Research was tested against other benchmarks, including Humanity's Last Exam and BrowserComp, where it outperformed competitors, although OpenAI's ChatGPT 5 Pro closely followed [7] - On the same day as Google's announcement, OpenAI launched its GPT 5.2 model, which claims to surpass its rivals, including Google, on various benchmarks [8][9]
当Search Agent遇上不靠谱搜索结果,清华团队祭出自动化红队框架SafeSearch
机器之心· 2025-10-16 07:34
Core Insights - The article discusses the vulnerabilities of large language model (LLM)-based search agents, emphasizing that while they can access real-time information, they are susceptible to unreliable web sources, which can lead to the generation of unsafe outputs [2][7][26]. Group 1: Search Agent Vulnerabilities - A real-world case is presented where a developer lost $2,500 due to a search error involving unreliable code from a low-quality GitHub page, highlighting the risks associated with trusting search results [4]. - The research identifies that 4.3% of nearly 9,000 search results from Google were deemed suspicious, indicating a prevalence of low-quality websites in search results [11]. - The study reveals that search agents are not as robust as expected, with a significant percentage of unsafe outputs generated when exposed to unreliable search results [12][26]. Group 2: SafeSearch Framework - The SafeSearch framework is introduced as a method for automated red-teaming to assess the safety of LLM-based search agents, focusing on five types of risks including harmful outputs and misinformation [14][21]. - The framework employs a multi-stage testing process to generate high-quality test cases, ensuring comprehensive coverage of potential risks [16][19]. - SafeSearch aims to enhance transparency in the development of search agents by providing a quantifiable and scalable safety assessment tool [37]. Group 3: Evaluation and Results - The evaluation of various search agent architectures revealed that the impact of unreliable search results varies significantly, with the GPT-4.1-mini model showing a 90.5% susceptibility in a search workflow scenario [26][36]. - Different LLMs exhibit varying levels of resilience against risks, with GPT-5 and GPT-5-mini demonstrating superior robustness compared to others [26][27]. - The study concludes that effective filtering methods can significantly reduce the attack success rate (ASR), although they cannot eliminate risks entirely [36][37]. Group 4: Implications and Future Directions - The findings underscore the importance of systematic evaluation in ensuring the safety of search agents, as they are easily influenced by low-quality web content [37]. - The article suggests that the design of search agent architectures can significantly affect their security, advocating for a balance between performance and safety in future developments [36][37]. - The research team hopes that SafeSearch will become a standardized tool for assessing the safety of search agents, facilitating their evolution in both performance and security [37].