DeepResearch

Search documents
黄仁勋第三次访华:英伟达4万亿市值血洗AI算力焦虑;DeepSeek爆火后遭遇滑铁卢;Manus大撤退!|混沌AI一周焦点
混沌学园· 2025-07-17 09:15
错位竞争:垂直能力构建壁垒 混沌AI咨询师2.0转向战略伙伴,秘塔深耕中文研究,差异化能力取代同质化模型竞争。 入口重构:浏览器升级认知操作系统 AI驱动浏览器重塑人机交互(如Aura、Comet),从工具转向智能体协同网络入口。 本周AI商业焦点必读 (2025.7. 10 -7. 16 ) 本周核心趋势 算力破局:芯片解禁激活产业创新 英伟达H20芯片回归中国,缓解算力焦虑,加速本土模型迭代与低成本应用落地。 商业验证:技术需匹配场景效率 Manus撤退、DeepSeek下滑警示:纯模型竞赛不可持续,需强化服务稳定性与成本控制。 「战略跃迁」 混沌AI战略咨询师2.0:从工具迈向智能伙伴时代 混沌AI战略咨询师迎来里程碑升级!2.0版本突破工具属性,跃升为真正的战略智能伙伴。核心在于两大智能化跃迁:深度意图识别精准捕捉业务诊断、竞 对分析等核心需求,智能框架决策动态选择并融合SWOT、PEST等经典模型进行自主研判。这标志着AI从被动响应转向主动引领分析,赋能管理者、创业 者、投资人获得更专业、系统的战略洞察。 核心能力突破: 深度意图识别引擎 自动解析用户真实分析意图(如业务诊断、竞对分析) 智能切入专 ...
腾讯研究院AI速递 20250716
腾讯研究院· 2025-07-15 15:09
生成式A I 一、 突发!美解除封锁,英伟达可向中国销售H20 AI芯片 1. 美国政府承诺授予英伟达许可,将恢复对中国销售H20 AI芯片; 2. 此转变发生在黄仁勋与美国总统特朗普会面后,黄仁勋强调了英伟达对美国就业和AI领先 地位的支持; 3. 英伟达2025财年第一季度收入创纪录达260.44亿美元,同比增长262%,数据中心业务收 入226亿美元是主要增长动力。 https://mp.weixin.qq.com/s/HUt2dTqRleq70B8vBDMxeQ 二 、 扎克伯格宣布2026年启用1GW「Prometheus」集群 1. Meta正建设「Prometheus」AI超算集群,2026年将达1GW算力,堪比一座核电站或百 万居民城市用电量; 2. 2027年「Hyperion」计划将部署超5GW级算力,占地面积与曼哈顿相当,Meta将自建天 然气电厂保障供电; 1. 马斯克推出基于Grok 4的「智能伴侣」功能,包括动漫角色Ani和卡通熊猫Rudy,前者还 具有NSFW模式; 2. 这些AI伴侣拥有3D动画效果和语音互动能力,但功能仍处于初期阶段,中文发音尚显机 械,互动动作略显做作; 3 ...
秘塔AI也终于悄悄上线了DeepResearch。
数字生命卡兹克· 2025-07-14 22:11
昨天晚上,秘塔AI搜索悄悄上了一个新功能。 测试完以后,我觉得这玩意,还是值得我将近通宵写一篇的。 深度研究,也就是DeepResearch。 我过去写过很多次秘塔AI了,因为我自己的搜索习惯,现在基本就是,大活上ChatGPT用 DeepResearch ,常识问答直接找豆包,一般的AI搜索就是秘塔 AI。 当然很多ChatBot产品都有AI搜索,但是我自己这两年,还是习惯用秘塔AI和Perplexity这样形态的原生AI搜索产品了,这可能就是习惯的力量吧。 而现在,秘塔AI的深度研究,也就是 DeepResearch ,终于来了。 之前一直是简洁,深入,研究这三种模式。 而现在,变成了深度研究。 我其实早期在各种形形色色的地方,安利过N多次 DeepResearch ,不过那个时候要200刀,国内也不方便用,后面就说的越来越少了。 直到现在,OpenAI和和Gemini两大巨头在那里杵着,国内大家也都挺卷的,豆包、智谱、Kimi等等,都有动作。 终于,我最喜欢的秘塔AI来了,而且上了就是公开可用。 在体验完以后,整体感觉是,秘塔还是秘塔,你永远可以相信秘塔的产品设计,它居然可以把 DeepResearch ...
Kimi新功能Deep Researcher海外引发热议 还被马斯克直播点名
Sou Hu Cai Jing· 2025-07-10 10:15
是Kimi上月发布的首款Agent产品,在HLE测试中超过了Gemini2.5Pro,略高于OpenAI Deep Research,并与Gemini-Pro的Deep Research Agent打平,是目 前已知的最高水平之一。 当地时间9日晚,马斯克旗下公司xAI举办直播发布会,正式发布其最新旗舰模型Grok 4。 直播中提到HLE(Humanities Last Exam,人类最后的考试)进行对比时,分别介绍了OpenAI、谷歌旗下Gemini以及月之暗面Kimi三家公司,而 DeepResearcher正 资料显示,Kimi DeepResearcher功能在执行每个研究任务时,会平均进行23次推理,由模型判断并筛选出信息质量最高的内容后,剔除冗余及低质信息, 自动生成分析结论,拥有文献的严谨性,可有效告别模型幻觉。 在海外社交媒体上,AI从业者纷纷表达着对这款来自中国AI产品的喜爱,有网友表示,Kimi Deep Researcher可能是用过的最好的深度研究模型,视觉效 果出色。也有博主表示,对深度研究的能力和准确性印象深刻。 | February 3. | OpenAl Deep | A ma ...
一文读懂 Deep Research:竞争核心、技术难题与演进方向
Founder Park· 2025-06-26 11:03
Core Insights - The article discusses the emergence and evolution of "Deep Research" systems in the AI Agent exploration wave, highlighting the rapid development and competition among major players like Google, OpenAI, and Anthropic since late 2024 [1][2] - A comprehensive survey from Zhejiang University provides a framework for understanding and evaluating the current landscape of deep research systems, emphasizing the shift from model capability to system architecture and application adaptability as the main competitive focus [1][2] Group 1: Current Landscape and System Comparisons - The ecosystem of deep research systems is characterized by significant diversity, with different systems focusing on various technical implementations, design philosophies, and target applications [3] - Key differences among systems are evident in their foundational models and reasoning efficiency, with commercial giants leveraging proprietary models for superior performance in handling complex reasoning tasks [4] - Systems also differ in tool integration and environmental adaptability, showcasing a spectrum from comprehensive platforms to specialized tools [5] Group 2: Application Scenarios and Performance Metrics - In academic research, systems like OpenAI/DeepResearch excel due to their rigorous citation and methodology analysis capabilities, while in enterprise decision-making, systems like Gemini/DeepResearch thrive on data integration and actionable insights [8] - Performance metrics reveal that leading commercial systems maintain an edge in complex cognitive ability benchmarks, although specialized evaluations highlight the strengths of various systems in specific tasks [9][10] Group 3: Implementation Challenges and Technical Solutions - The implementation of deep research systems involves strategic trade-offs across architecture design, operational efficiency, and functional integration [12] - Core challenges include managing hallucination control, privacy protection, and ensuring interpretability, with solutions focusing on source grounding, data isolation, and transparent reasoning processes [15] Group 4: Evaluation Frameworks - The evaluation of deep research systems is evolving from single metrics to a multi-dimensional framework that assesses functionality, performance, and contextual applicability [16] - Functional evaluations focus on task completion capabilities and information retrieval quality, while non-functional assessments consider performance efficiency and user experience [17][18] Group 5: Future Directions in Reasoning Architecture - Future advancements in deep research systems are expected to address limitations in context window size, enabling more comprehensive analysis of large-scale research materials [22][23] - The integration of causal reasoning capabilities and advanced uncertainty modeling will enhance the systems' applicability in complex fields like medicine and social sciences [27][30] - The development of hybrid architectures that combine neural networks with symbolic reasoning is anticipated to improve reliability and interpretability [25][26]
80个团队入局,AI深度研究赛道,究竟“卷”向何方 | Jinqiu Select
锦秋集· 2025-06-24 15:14
在2025年的AI Agent探索浪潮中,"深度研究"类产品可以说是最早成功落地的一批。 从2024年底谷歌发布其首个深度研究产品开始,短短数月内,OpenAI、Anthropic等行业巨头迅速跟进,推出了功能强大的商业竞品;OpenDeepResearcher、 HKUDS/Auto-Deep-Research、Camel-AI/OWL、OpenManus等明星项目构成的繁荣开源社区也拔地而起。至今,已有超过80个团队投身于此。 经过一段时间的探索,这个领域已积累了相当规模和丰富的实践经验,形成了多样的技术路线和架构选择,整个探索格局已经初步成型。因此,现在正是对这一领 域进行一次系统性梳理和总结的最佳时机。 最近,来自浙江大学的学者撰写了一篇综述,《A Comprehensive Survey of Deep Research: Systems, Methodologies, and Applications》,为我们提供了一整套理解、评 估和展望该领域的认知框架。 文章揭示,当前深度研究系统的生态已经呈现出显著的差异化,竞争的焦点不再是单一的模型能力,而是系统架构、工程优化与应用场景适配度的综合比拼。 ...
文字的速度终于赶上了短视频
虎嗅APP· 2025-05-24 03:26
以下文章来源于虹线 ,作者评论尸 虹线 . 本文来自微信公众号: 虹线 ,作者:评论尸,题图来自:AI生成 全球最大的稍后阅读工具 Pocket 宣布停服,它将在今年 10 月 8 日删除所有账户和用户数据。 实际在 2017 年被 Firefox 浏览器的母公司 Mozilla 收购之后,这款曾经为 1700 万用户保存超过 10 亿篇文章的第二大脑,就已经进入了慢性死亡。 在官方的公告里,用一段非常简单的文字解释了他们为什么要关闭 Pocket: 具体来说,其实只有一条: 面向自己写作。 随着人们使用网络的方式不断演变,我们将资源投入到更符合他们浏览习惯和在线需求的项目上。 这款曾经代表着"稍后阅读"精神图腾的产品,它的象征意义,正在被一个新时代迅速解构。Pocket 的式微,与其说是一个产品的失败,不如说是一个时代的注脚: 在AI浪潮席卷一切的当下,我们或许真的不再需要"稍后阅读"了,同样,可能也不再有"稍后写 作"。 稍后本来就不存在 Pocket 成立于 2007 年。 与它的一众同侪,如 Instapaper,诞生于一个信息爆炸初期、但个体处理能力尚未迭代的时代。 有个许久不被提及的词,用来形容那 ...
大模型集体“挂科”!全新中文网页检索测试:GPT-4o准确率仅6.2%
量子位· 2025-05-06 04:24
目前,BrowseComp-ZH的全部数据已开源发布。 研究团队直言: 为什么我们需要中文网页能力测试? 如今的大模型越来越擅长"用工具":能连搜索引擎、能调用插件、能"看网页"。 BrowseComp-ZH团队 投稿 量子位 | 公众号 QbitAI 你以为大模型已经能轻松"上网冲浪"了? 新基准测试集 BrowseComp-ZH 直接打脸主流AI。 BrowseComp-ZH是一项由 港科大(广州)、北大、浙大、阿里、字节跳动、NIO等机构 联合发布的新基准测试集,让20多个中外主流大模 型集体"挂科": GPT-4o在测试中准确率仅6.2% ;多数国产/国际模型准确率 跌破10% ;即便是目前表现最好的OpenAI DeepResearch, 也仅得42.9% 但众多评估工具都只在英文语境下建立,对中文语境、中文搜索引擎、中文平台生态考虑甚少。 然而,中文互联网信息碎片化严重、搜索入口多样、语言表达复杂。 中文网页世界到底有多难?举几个例子你就明白了: 因此,英文测试集"翻译一下"根本不够。 需要从中文语境原生设计,才能真正衡量大模型是否能在中文网页上"看得懂"、"搜得到"、"推得准"。 BrowseC ...
AI Agent深度(二):2025 Agent元年,AI从L2向L3发展
Soochow Securities· 2025-05-05 08:23
证券研究报告·行业年度策略报告·传媒互联网 增持(维持) AI Agent深度(二):2025 Agent元年,AI从L2向L3发展 证券分析师 :张良卫 执业证书编号:S0600516070001 联系邮箱:zhanglw@dwzq.com.cn 证券分析师 :周良玖 执业证书编号:S0600517110002 联系邮箱:zhoulj@dwzq.com.cn 研究助理 :张文雨 执业证书编号:S0600123070071 联系邮箱:zhangwy@dwzq.com.cn 2025年5月4日 核心观点 2 1. 我们认为 2025年是Agent元年:AI 正从 L2(推理者)向 L3(Agent/智能体)进化,标志着AI 从"思考"走向"行动"。这一转变由四大驱动力 促成: ①技术成熟度达到临界点: 强大的多模态基础模型(能理解视觉信息如 GUI 界面)和成熟的强化学习训练方法已准备就绪 。②标杆产品 的出现: 行业领导者(如 OpenAI, Google, Anthropic)推出了关键产品(如 Operator, DeepResearch),基准测试(如 RE-Bench)显示顶尖 Agent 在特定任务 ...
AIAgent深度(二):2025Agent元年,AI从L2向L3发展
Soochow Securities· 2025-05-04 15:05
AI Agent深度(二):2025 Agent元年,AI从L2向L3发展 证券分析师 :张良卫 执业证书编号:S0600516070001 联系邮箱:zhanglw@dwzq.com.cn 证券分析师 :周良玖 执业证书编号:S0600517110002 联系邮箱:zhoulj@dwzq.com.cn 研究助理 :张文雨 执业证书编号:S0600123070071 联系邮箱:zhangwy@dwzq.com.cn 证券研究报告·行业年度策略报告·传媒互联网 增持(维持) 2025年5月4日 核心观点 2 1. 我们认为 2025年是Agent元年:AI 正从 L2(推理者)向 L3(Agent/智能体)进化,标志着AI 从"思考"走向"行动"。这一转变由四大驱动力 促成: ①技术成熟度达到临界点: 强大的多模态基础模型(能理解视觉信息如 GUI 界面)和成熟的强化学习训练方法已准备就绪 。②标杆产品 的出现: 行业领导者(如 OpenAI, Google, Anthropic)推出了关键产品(如 Operator, DeepResearch),基准测试(如 RE-Bench)显示顶尖 Agent 在特定任务 ...