Workflow
推理
icon
Search documents
关注半导体,脑机接口,深海科技
2025-06-23 02:09
关注半导体,脑机接口,深海科技 20250622 摘要 中伊冲突升级、陆家嘴论坛政策兑现以及沪指技术阻力位等多重因素叠 加,导致 A 股市场风险偏好下降,沪指承压。 宏观经济基本面复苏乏力,5 月社零数据虽超预期但持续性存疑,装备 制造业表现相对较好,地产等其他分项依然面临压力,制约市场上行空 间。 市场内生结构问题显现,小微盘超额收益持续走高导致拥挤度提升,量 化策略调整加剧小微盘下跌,拖累大盘表现,市场脆弱性增加。 季末及中报期前夕,资金从 Q1 的 TMT 方向转向 Q2 的新消费和创新药 方向,短期性价比不高导致部分资金离场,影响大盘走势和成交量。 港股流动性驱动特征明显,港元贬值引发市场对金管局收紧流动性的担 忧,新消费和创新药板块拥挤度较高,新股破发,港股整体调整对 A 股 产生联动效应。 A 股市场本周整体疲弱,仅红利或蓝筹价值板块相对抗跌,资金避险情 绪升温,流向银行和保险板块,地缘事件驱动油气、油运板块走强。 芯片半导体行业表现较强,科创板分层政策支持未盈利硬科技企业上市, 中美博弈加速芯片制造材料设备国产化,存储领域国产化预期提升。 Q&A 本周 A 股市场表现如何?有哪些主要影响因素? ...
清华教授刘嘉:人工智能时代,我们需要具备的五大能力
3 6 Ke· 2025-06-22 23:10
» 研究:提出正确问题。 » 统计:探寻万事万物之间的关系。 » 逻辑:从已知推演未知。 » 心理:理解自己,洞悉他人。 » 修辞:说服他人,引领革新。 刘嘉/文 古希腊通识教育的核心是培养贵族的政治和文化能力,与普通人的生活需求和社会功能无关;耕种庄稼、蓄养牲畜等与生活相关的工作,则专属于普通公民 和奴隶。在古希伯来文中,"奴隶"和"工作"是同一个词。在古罗马时期,通识教育的实用性被极大地提升——即使面向贵族的通识教育中的思辨也被极大地 削弱,而法律、建筑、雄辩术等实用学科则得到大力发展。 进入现代,工业革命和现代化需要大批受过基础教育的劳动者,以适应新型经济结构和技术发展的需求,于是19世纪普鲁士的义务教育制度成为现代教育的 模板,以培养所有社会阶层的工作技能。 在AGI时代,我们在将发端于工业革命时期的专才教育变革为通识教育时,既要继承古希腊通识教育注重广博知识和理性思辨的传统,也要融入现代科学技 术和跨学科思维,强调教育实用性与思想性的平衡,并加入全球化与文化多样性的视角。因此,在我看来,现代的通识教育,我们需要培养这五大能力: 知识只是智能的产物,而学习才是智能的原因。 但是,当年辛顿是如何在如日中 ...
FindingDory:具身智能体记忆评估的基准测试
具身智能之心· 2025-06-22 10:56
点击下方 卡片 ,关注" 具身智能 之心 "公众号 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要 的。 一、研究背景与核心问题 长期记忆缺失 是当前具身智能体的关键瓶颈。尽管视觉语言模型(VLMs)在规划与控制任务中表现突 出,但其 处理跨时空的多模态观察数据 能力严重受限: 核心矛盾 :具身智能需整合长期历史经验(如"找到昨天未整理的玩偶"),但缺乏针对性评估框架。 二、基准设计创新点 2.1 任务架构 作者丨 Karmesh Yadav等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 动态环境交互 记忆推理验证 输入限制 :主流VLMs仅能处理数百张图像(远低于真实场景的千帧级输入) 评估缺陷 :现有视频QA基准(如EgoSchema)依赖选择题形式,无法评估 物体操纵/导航 等需细粒 度推理的具身任务 记忆-动作脱节 :传统方法孤立评估记忆召回与决策执行,忽视二者在具身环境中的耦合性 动态环境构建 :脚本代理在Habitat模拟器中执行物体抓取-放置(Pick-and-Place),产生 ...
大模型为何难成为「数学家」?斯坦福等揭示严谨证明中的结构性弱点
机器之心· 2025-06-22 04:26
另一方面,当前主流的大语言模型是在海量自然语言上训练出来的。它们虽然无法直接生成可被形式系统接受的机器检查证明,却在 "非形式化推理" 方面表现出色 —— 也就是说,它们往往能给出看似合理、直觉对路的答案,并模仿人类在解决问题初期的思维方 式。这种能力虽然不符合传统意义上的形式证明要求,但在探索性的数学过程中具有重要价值。 为此,斯坦福大学、加州大学伯克利分校与麻省理工学院的研究团队提出了一种创新方法:将不等式证明任务拆解为两个 "非形式化但 可验证" 的子任务,即 "界限估计" 和 "关系预测",并基于此构建了第一个奥林匹克级不等式证明基准数据集 ——IneqMath。这一框 架提供了一种介于完全形式化验证与自然语言生成之间的 "中间层",可以逐步审查模型的推理链条,从而判断其是否真正掌握了推理 结构,而不仅仅是在猜测答案。 这正是当前形式化数学所试图解决的问题。近年来,Lean、Coq 等系统为数学提供了严格可验证的推理机制,每一步推导都必须符合 逻辑规则,可被计算机检验。然而,这类系统对语句的表达精度要求极高,建模成本大、自动化程度有限,尤其在面对中学到奥数级别 的不等式问题时,很难做到规模化应用。 使 ...
概率统计机制下,LLM 推理真的「理解世界了」吗?
机器之心· 2025-06-21 06:32
机器之心PRO · 会员通讯 Week 25 --- 本周为您解读 ② 个值得细品的 AI & Robotics 业内要事 --- 1. 概率统计机制下,LLM 推理真的「理解世界了」吗? 简单复读 vs 显性路径,CoT 在推理中担任何种角色?Next Token Prediction 是一种动态建模过程,CoT 或许并非简单的复 读?基于概率统计的 LLM 推理能力是简单的模式匹配,还是另一种对因果理解的表达?「实践出真知」,强化学习后训练是否 有可能打破禁锢 LLM 的「知识幻觉」? ... 2. 2025 年了,企业的 AI 采购预算都在怎么花? 企业增加生成式人工智能支出的原因是什么?在生产用例中使用多个模型的动机是什么?AI 采购为何 逐渐呈现传统软件采购的特征?为何从自行构建转向购买第三方 AI 应用?在选择 AI 模型时的评估框 架包括哪些关键因素?... 本期完整版通讯含 2 项专题解读 + 31 项 AI & Robotics 赛道要事速递,其中技术方面 12 项,国内方面 8 项,国外方面 11 项。 本期通讯总计 22632 字,可免费试读至 7% 消耗 99 微信豆即可兑换完整本期解 ...
大模型掌握人类空间思考能力!三阶段训练框架学会“边画边想”,5个基准平均提升18.4%
量子位· 2025-06-21 06:07
Core Insights - The article discusses the development of the ViLaSR-7B model, which enhances spatial reasoning capabilities in large vision-language models (LVLMs) through a novel "Drawing to Reason in Space" paradigm, achieving significant improvements in various spatial reasoning tasks [1][17][33]. Group 1: Model Performance - ViLaSR-7B achieved an average improvement of 18.4% across five major spatial reasoning benchmarks, including maze navigation and video spatial reasoning [3][25]. - The model reached a 45.4% accuracy on the VSI-Bench, outperforming the Qwen2.5-VL-7B by 12.7% [26]. Group 2: Training Framework - The model employs a three-stage training framework: 1. Cold-start training establishes basic visual operation capabilities [22]. 2. Reflective rejection sampling enhances self-correction and reflection abilities [23]. 3. Reinforcement learning optimizes overall reasoning capabilities and drawing operation efficiency [24]. Group 3: Reasoning Paradigms - The article highlights a shift from the traditional "visual-to-text" reasoning paradigm to the "Thinking with Images" paradigm, which allows models to actively manipulate images during reasoning [10][15]. - This new paradigm addresses limitations in the traditional approach, such as loss of critical details and temporal information during the visual encoding process [11][16]. Group 4: Human-like Reasoning Strategies - ViLaSR-7B demonstrates human-like spatial reasoning strategies, such as reference-based measurement reasoning and systematic cross-frame object tracking [30][32]. - The model's ability to identify and utilize reference objects for accurate measurements reflects a mature reasoning process similar to human problem-solving [31].
国产SOTA新模型精准get“画(3+6)条命的动物” | 开源
量子位· 2025-06-21 03:57
金磊 整理自 凹非寺 量子位 | 公众号 QbitAI 生成图像 这件事, 会推理 的AI才是好AI。 举个例子,以往要是给AI一句这样的Prompt: (3+6)条命的动物。 我们人类肯定一眼就知道是猫咪,但AI的思考过程却是这样的: △ 虽然生成了猫,但思考过程不对 思考的过程还是把"(3+6)"里的数字分开来处理,并没有真正get到其背后 "九条命的动物=猫" 的本意。 以及像ChatGPT,还是执着于在图片里面展示数字: 究其原因,是因为当前主流的基于文本进行图像生成的方法往往依赖固定的文本编码器,仅能处理"纯文本"输入,难以自然接入图像、音频 等模态的信息。 同时,这类系统在应对"复杂世界知识"和"多步骤逻辑推理"方面表现乏力。 但就在最近,清华大学、腾讯ARC Lab、香港中文大学和香港大学联手提出了一个新大模型—— MindOmni ,显著增强了AI的 "推理生成 能力" 。 它不仅能理解复杂指令,还能基于图文内容展开连贯而可信的"思维链"(Chain-of-Thought, CoT),生成具备逻辑性与语义一致性的图像 或文本输出: △ 推理图像生成可视化结果对比 △ 对基于多模态用户输入的推理 ...
三年累亏5.68亿元,AI云公司PPIO派欧云冲刺港股CEO要圆上市梦
Tai Mei Ti A P P· 2025-06-21 00:57
来源:钛媒体 PPIO派欧云联合创始人、董事长、CEO姚欣 6月20日晚,PPTV创始人姚欣带着创办的新公司PPIO派欧云(上市公司主体PPLabs Technology Limited)正式冲刺港交所,工银国际、申万宏源为联席保荐 人。 2016年6月,姚欣加入风险投资机构蓝驰创投担任风险合伙人,彼负责项目尽职调查、投资和管理,并于2017年8月-2023年8月担任南京我乐家居股份有限公 司(603326.SH)独立董事。 | 纂]的[編纂]數目 | [編纂]股股份(視乎[ | | --- | --- | | | 行使與否而定) | | 「編纂]數目 | [編纂]股股份(可予[ | | [編纂]數目 | [編纂]股股份(可予[ | | | 視乎[編纂]行使與 | | 最高[編纂] | 每股[編纂][編纂]港j | | | 經紀佣金、0.0027 | | | 0.00565% 聯交所3 | | | 會財局交易徵費(; | | | 繳足,多繳股款可 | | 面值 | 每股股份0.00001美元 | | 股份代號 | [0] | 成立于2018年的PPIO派欧云,是国内一家独立分布式云计算服务商。所属上市主体PP ...
国产SOTA新模型精准get“画(3+6)条命的动物” | 开源
量子位· 2025-06-20 03:28
金磊 整理自 凹非寺 量子位 | 公众号 QbitAI 生成图像 这件事, 会推理 的AI才是好AI。 举个例子,以往要是给AI一句这样的Prompt: (3+6)条命的动物。 我们人类肯定一眼就知道是猫咪,但AI的思考过程却是这样的: △ 虽然生成了猫,但思考过程不对 思考的过程还是把"(3+6)"里的数字分开来处理,并没有真正get到其背后 "九条命的动物=猫" 的本意。 以及像ChatGPT,还是执着于在图片里面展示数字: 究其原因,是因为当前主流的基于文本进行图像生成的方法往往依赖固定的文本编码器,仅能处理"纯文本"输入,难以自然接入图像、音频 等模态的信息。 同时,这类系统在应对"复杂世界知识"和"多步骤逻辑推理"方面表现乏力。 但就在最近,清华大学、腾讯ARC Lab、香港中文大学和香港大学联手提出了一个新大模型—— MindOmni ,显著增强了AI的 "推理生成 能力" 。 它不仅能理解复杂指令,还能基于图文内容展开连贯而可信的"思维链"(Chain-of-Thought, CoT),生成具备逻辑性与语义一致性的图像 或文本输出: △ 推理图像生成可视化结果对比 △ 对基于多模态用户输入的推理 ...
一次集成,减少 80% 适配工作!从 0 到 1 开发一款 MCP Server 难不难?
AI前线· 2025-06-20 02:47
既然 MCP 在大模型应用开发中如此重要,要从 0 到 1 开发出一款 MCP Server 到底难不难? 作者 | 冬梅 硅谷的咖啡厅里,永远流传着这样的传说:一个天才开发者,一台电脑,一段颠覆行业的代码。但当 31 岁的 Maor Shlomo 在特拉维夫的公寓里敲下 Base44 的第一行代码时,他没想到这个故事会以 8000 万美元的现金收购落幕——没有风投加持,没有百人团队,只有 8 名员工和 180 天的闪电战。 AI 正在快速发展,大语言模型处于这一变革的前沿。随着这些模型在理解和生成类人文本方面日益 精进,将其与外部系统集成的需求也显著增长。这种集成有望开启一个全新的应用时代,使之能够利 用真实世界的数据和工具来增强功能,并提供更符合语境的响应。 然而,将大语言模型连接到外部资源的传统方法通常需要针对每个数据源进行复杂且定制化的实现, 从而导致架构碎片化且难以扩展。 Anthropic 的模型上下文协议 (MCP) 应运而生,成为应对这些挑战的关键解决方案。 过去,如果我们想让 AI 处理数据,通常只有两种选择:要么依赖预训练好的静态知识库,要么手动 上传数据。这种方式不仅效率低下,还存在明显 ...