Workflow
DeepSearchQA
icon
Search documents
谷歌智能体发力:增强版Gemini Deep Research和专属API都来了
量子位· 2025-12-12 06:41
闻乐 发自 凹非寺 量子位 | 公众号 QbitAI OpenAI强势更新,谷歌也没闲着。 正式发布增强版的 Gemini Deep Research ,基于Gemini 3 Pro构建,专门减少幻觉,在复杂信息检索与分析任务上表现领先,很快将被 集成到谷歌搜索、NotebookLM、Google Finance以及升级版的Gemini App中。 谷歌还配套推出了 DeepSearchQA基准测试集 ,为深度搜索与研究任务提供了更全面的评估标准。 | DSQA-full.csv (355.11 kB) | | | | 2 | | | --- | --- | --- | --- | --- | --- | | Detail Compact | Column | | | 4 of 4 columns | V | | A problem | | | | | | | | | | Valid ■ Mismatched ■ | 900 0 | 100% 0% | | 900 | | | | | | | | | | Missing ■ | O | 0% | | unique values | | | Unique | 9 ...
对抗 OpenAI GPT-5.2,谷歌推出Gemini Deep Research智能体
Huan Qiu Wang Zi Xun· 2025-12-12 03:53
为解决现有评测难以体现真实世界多步骤研究复杂性的问题,谷歌同步开放DeepSearchQA数据集与工 具。该基准涵盖17个领域、900个"因果链"任务,每个任务的每一步均依赖前序分析,要求智能体生成 详尽答案集,以此精准衡量其研究精度与检索全面性。此外,DeepSearchQA还可作为"思考时间"效益 的诊断工具,谷歌内部测试显示,增加智能体的搜索与推理步骤可显著提升其任务表现,这一方向将在 未来版本中持续探索。目前,开发者可访问该数据集、排行榜与Colab示例,并查阅相关技术报告。 在实际应用场景中,Gemini Deep Research已在多个对精度和上下文理解要求较高的行业展现出显著价 值。在金融服务领域,企业借助该智能体自动化完成尽职调查中的早期信息收集工作,整合市场信号、 竞争格局与合规风险等关键信息,大幅提升研究效率;在生物技术领域,Axiom Bio利用其处理药物毒 性预测相关的文献分析,获得了更高的研究深度与颗粒度,有效加速了药物开发流程;在市场研究等领 域,该智能体也凭借其强大的信息整合能力助力企业提升决策科学性。 通过此次推出的Interactions API,开发者可调用Gemini ...
谷歌深夜重磅开源,深度研究Agent拿下SOTA,比GPT-5 pro便宜90%
3 6 Ke· 2025-12-12 00:49
智东西12月12日消息,今日凌晨,比OpenAI早一个小时,谷歌甩出了3个Agent大招: Deep Research Agent功能更新,并首次向开发者开放;开源新网络研究Agent基准DeepSearchQA,旨在测试Agent在网络研究任务中的全面性;推出新交 互API(Interactions API)。 Gemini Deep Research是一款专为长期上下文采集和综合任务优化的Agent,其背后的模型是Gemini 3 Pro,通过多步强化学习的扩展搜索,Agent能够自 主地以高精度导航复杂的信息环境。此次更新包括针对特定数据进行网页搜索、更低成本生成研究报告等。 谷歌DeepMind产品经理路卡斯·哈斯( Lukas Haas)在社交平台X上透露,新Gemini Deep Research Agent已经实现SOTA,在谷歌新基准测试上得分 46.4%,在BrowseComp上与GPT-5 Pro相当,价格是其1/10左右。 Deep Research Agent很快将在谷歌搜索、笔记本、谷歌金融中提供,并在Gemini应用中升级。 DeepSearchQA内置了900个手工设计的"因果链 ...