深度思考

Search documents
专家访谈汇总:黄金再度强势飙涨,加仓还是观望?
阿尔法工场研究院· 2025-05-21 14:48
1、 《 黄金价格再度飙涨》摘要 5、 《 公募新规落地影响市场生态》摘要 ■ 5月21日上午,现货黄金上破3300美元/盎司大关,为5月9日以来首次。 ■ 短期波动核心驱动: 地缘冲突升温+美国一季度GDP负增长推升避险需求,但贸易摩擦缓和构成短 期利空,金价或陷入3000-3300美元区间震荡。 ■ 国内消费强韧性: 4月金银珠宝零售额同比+25.3%(环比+14.7%),国内黄金消费景气度独立于 国际金价波动,上游珠宝商渠道扩张红利仍在释放。 ■ 机构观点分歧: 看多逻辑 : 滞胀风险(通胀上行+经济下行)+美联储降息周期+央行购金潮支撑 黄金长期趋势,调整后仍具配置价值。 谨慎信号 : 当前金价已处高位,贸易战暂缓或触发获利了 结,警惕短期技术性回调风险。 ■ 关键 价格锚点 : 花旗大幅下调3个月目标价至3150美元(原3500美元),技术面关注3000美元支 撑位与3300美元阻力位突破方向。 2、 《 美国拟对东南太阳能设备征收最高3521%的关税 》摘要 ■ 关税 冲击强度 分化: 东南亚太阳能产业链面临极端税率分化:柬埔寨厂商税率高达3521%(因拒 配合调查),马来西亚仅34%,晶科/天合 ...
ICML 2025 | 大模型深度思考新范式:交替「推理-擦除」解决所有可计算问题
机器之心· 2025-05-15 06:04
作者介绍:本文第一作者是丰田工业大学芝加哥 PhD 学生杨晨晓,研究兴趣是机器学习理论和大模型推理,在 ICML,NeurIPS,ICLR 等顶级会议上发表过论 文。 本文提出一个 交替 「推理 - 擦除 」的深度思考新范式 PENCIL ,比传统 CoT 更高效地解决更复杂的推理任务。理论上,我们证明 PENCIL 可用 最优空间 与 最 优时间 下解决所有可计算问题,而这对于传统的 CoT 是不可能的!该工作已被机器学习顶会 ICML 2025 收录。 最近的大模型(如 OpenAI 的 o1/o3、DeepSeek 的 R1)发现能通过在测试阶段 深度思考(Test-Time Scaling) 来大幅提高模型的推理能力。目前实现深度思考的 关键在于使用 长链思维链(Long Chain-of-Thought,CoT) ,即让模型生成更长中间结果得到最终答案。然而,传统 「只写不擦 」的方法在处理高难度、大规 模任务时面临以下瓶颈: 不过实际上,并非所有中间思路都后续推理有用:例如定理证明里,引理一旦验证通过,其具体推导可被丢弃;解数学题时,已知某条思路走不通就无需保留那 段 「尝试 」的细节。纵观计算机 ...
火山总裁谭待:很多Agent的能力还停留在类似自动驾驶的L1阶段
news flash· 2025-04-17 11:17
"目前很多Agent的能力仍停留在初级水平,真正实现具备更强反思、规划与自主决策能力的Agent,是 行业发展的方向。"4月17日,在火山引擎2025FORCE LINK AI创新巡展现场杭州站上,字节跳动旗下 的火山总裁谭待在接受采访时表示。谭待认为,深度思考模型是构建Agent的基础,模型要有能力做好 思考、计划和反思,并且一定要支持多模态,就像人类具备视觉和听觉一样,Agent才能更好地处理复 杂任务。当日,豆包1.5深度思考模型正式发布。据介绍,这款模型除了在数学、编程、科学推理、创 意写作等通用任务表现突出之外,还上线了具备视觉推理能力的深度思考模型视觉版,能像人类一样对 看到的事物进行联想和思考。(智通财经) ...
从DeepSeek R1的复现看深度思考模型的未来|ML-Summit 2025
AI科技大本营· 2025-03-31 06:55
备受瞩目的 2025 全球机器学习技术大会(ML Summit 2025)将于 4 月 18-19 日在上海虹桥西郊庄园丽笙大酒店召开。本次盛会由 CSDN & Boolan 联合主办,汇聚了超 50 位来自学术界和工业界顶尖专家,共同探讨智能体、联邦学习、多模态大模型等热门 AI 技术实践。 作为全球机器学习技术大会的老朋友,新浪微博首席科学家及 AI 研发部负责人张俊林将带来《从 DeepSeek R1 的复现看深度思考模型的未来》的精 彩分享。 张俊林作为「大模型技术拆解得最通透的实战派」,在 2024 年的机器学习技术大会上,他对 Gemini 多模态架构、OpenAI o1 技术的硬核拆解,让 开发者直呼"终于有人讲透技术本质"。 系统梳理技术脉络: 回顾 DeepSeek R1 开源后的各类复现研究,涵盖 SFT 阶段的轻量适配(如 S1)与 RL 阶段的创新实践。 深度解析训练范式: 重点剖析其核心的两阶段训练模式——如何通过冷启动微调结合多领域数据优化进行 SFT,以及如何运用 GRPO 强化学习 与全场景对齐实现模型"深度思考"能力的跃迁。 探讨关键技术问题: 尝试解答一系列备受关注的核心问 ...
对话阿里吴嘉:夸克是一个天然的超级智能体
36氪· 2025-03-24 10:44
Core Viewpoint - The article emphasizes the transformation of AI tools, highlighting that the future will see AI as a tool used by humans, rather than merely a replacement for traditional search methods [4][5][14]. Group 1: Product Development and Features - The launch of "New Quark" represents a significant upgrade, introducing the "Super Box" concept, which aims to redefine the relationship between humans, tools (AI), and tasks [3][4]. - The "Super Box" is designed to be a "Super Agent" that directly delivers results by integrating various AI capabilities, such as AI search, writing, and health assistance, into a single interface [4][5]. - Quark's user base has grown significantly, with over 200 million monthly active users and a cumulative download exceeding 370 million by 2024, indicating strong market acceptance [8]. Group 2: Strategic Vision and Market Position - The strategic focus on Quark as a core component of Alibaba's AI To C strategy reflects a shift towards consumer-oriented AI products, aiming to provide comprehensive solutions for everyday tasks [6][7]. - The leadership of Wu Jia, who has extensive experience within Alibaba, is pivotal in driving Quark's growth and aligning it with the company's broader AI mission [9][10]. - The "Super Box" is positioned as a versatile tool that can cater to a wide range of user needs, from academic reports to travel plans, emphasizing its utility across various demographics [21][22]. Group 3: Future Directions and Innovations - Future developments will focus on enhancing the "Super Box" to support multi-modal inputs, allowing users to interact through various means such as voice and images [22][23]. - The integration of deep thinking capabilities and multi-modal abilities will enable the "Super Box" to handle more complex tasks, further distinguishing it from traditional search engines [35]. - The overarching goal is to establish Quark as a leading "Super Entrance" in the AI era, facilitating seamless interactions between users and information [40].
独家|当传统搜索走向黄昏:看夸克AI搜索如何用自研模型打造“深度思考”新体验
Z Potentials· 2025-03-03 02:22
在信息爆炸的时代,搜索引擎早已成为知识工作者和普通人获取专业信息的关键入口。然而,传统搜索引擎以关键词匹配为核心的模式,正在面临前所 未有的挑战。 2025年2月28日,夸克AI搜索推出"深度思考",这是夸克基于阿里通义千问基模开发的推理模型,擅长迅速思考,可信、时效性强。这不仅 仅是一次功能升级,更是对搜索引擎本质的重新定义,标志着AI搜索时代的正式到来。 认知革命:从关键词匹配到意图理解 传统搜索引擎如百度,长期以来依靠关键词匹配和网页排序算法工作。当知识工作者需要检索 " 数据驱动决策的最佳实践 " 时,传统搜索引擎会返回包 含这些关键词的网页列表,用户需要自行筛选、整合信息,这种 " 找寻式 " 体验已无法满足专业人士的高效需求。 相比之下,夸克的 " 深度思考 " 彻底改变了这一范式。 它不再局限于简单的信息匹配,而是通过模拟人类的 " 系统二思维 " (即慢思考模式),深入理 解专业问题的本质和语境,进行多步骤推理,最终提供一个综合、深度的解答 。 例如,当一位产品经理询问 " 如何设计更符合 Z 世代用户习惯的社交产品 " 时,传统搜索可能返回数十篇相关但分散的文章,而夸克 " 深度思考 " 则 ...
DeepSeek小技巧分享:解锁AI深度思考的奥秘!
未可知人工智能研究院· 2025-02-08 11:51
(二)与其他推理模型的对比 与其他推理模型(如RE模型)相比,DeepSeek的R1模型在深度思考和多角度分析方面表现更为出色。RE模型虽然也能够理解 句子背后的含义,进行多角度分析和深度推演, 但在处理复杂问题时,R1模型的推理过程更加清晰,能够更好地启发用户。例 如,在生成旅行攻略时,R1模型会考虑更多的因素,如天气、景点、小吃、住宿等,而不仅仅是概率上的组合。 在AI技术飞速发展的今天,DeepSeek作为一款强大的AI工具,正以其独特的功能和优势,为我们的工作和生活带来前 所未有的便利。今天,就让我们一起深入探索DeepSeek的使用技巧,解锁AI深度思考的奥秘,开启一场AI深度探索之 旅。 二、使用DeepSeek的小技巧 一 、 DeepSeek与其他AI工具的比较 (一)提示词的运用 在使用DeepSeek时,提示词的编写至关重要。 但与传统语言模型不同,DeepSeek的推理模型对提示词的依赖程度较低。 因 此,我们不需要编写特别长的提示词,而是要简洁明了地表达我们的需求。 同时,要忘掉过去囤积的专业提示词,因为它们可 能会限制DeepSeek的推理过程。 例如,如果你想让DeepSeek为你 ...