Workflow
语言模型
icon
Search documents
银行业智能化转型:AI智能体的变革力量与未来展望 | 金融与科技
清华金融评论· 2025-06-11 10:51
文/ 伦敦证券交易所 集团全球战略客户技术总监 诸赞松 自 2 0 2 2年底Op e nAI推出Ch a tGPT以来,大语言模型的发展如浪潮 奔涌。它们借助大语言模型进行深度思考,并通过人工智能技术与 外 部 环 境 交 互 , 精 准 完 成 各 类 任 务 。 随 着 大 语 言 模 型 技 术 日 趋 成 熟,银行业也正经历一场深刻的技术变革。在这场变革中,企业通 过采用AI智能体技术不仅可以显著提升业务流程效率而且能够创造 新的业务增长点。尽管AI智能体前景广阔,银行在实际部署时仍面 临多重挑战。 针对这些机遇和挑战,全球多家领先金融机构已率先开展了富有成 效的实践,并在不同业务场景中验证了AI 智能体的变革价值,为行 业后续发展积累了宝贵经验和示范效应。 随着大语言模型技术日趋成熟,银行业也正经历一场深刻的技术变革。 智能体正成为银行业实现智能 化跃迁的核心动力,其应用边界将随着技术的迭代与场景的深化不断拓展, 企业通过采用AI智能体技 术不仅可以显著提升业务流程效率而且能够创造新的业务增长点。它们犹如金融领域的"智慧大脑",通 过构建客户虚拟助手、风险管理代理、欺诈检测代理等角色,优化业务流程 ...
「Next-Token」范式改变!刚刚,强化学习预训练来了
机器之心· 2025-06-11 03:54
| 机器之心报道 | | --- | 编辑:张倩、陈陈 谁说强化学习只能是蛋糕上的樱桃,说不定,它也可以是整个蛋糕呢? 在 2016 年的一次演讲中,Yann LeCun 曾将强化学习比喻成蛋糕上的樱桃。他提到,「如果把智能比作一块蛋糕,那么无监督学习就是蛋糕的主体,监督学习就是 蛋糕上的糖霜,而强化学习则是糖霜上的樱桃。我们已经知道如何制作糖霜和樱桃,但却不知道如何制作蛋糕本身。」 从 2016 年至今,LeCun 对强化学习一直不看好。然而,不可否认的是,强化学习在提升 AI 模型能力方面正变得越来越重要。而且,来自微软的一项新研究显 示,它不仅在后训练阶段发挥着关键作用,甚至在预训练阶段也展现出巨大的潜力。 在这篇题为「Reinforcement Pre-Training」的论文中,作者提出了一种名为「强化预训练(RPT)」的新范式。在这种范式中,下一个 token 预测任务可以被重新定 义为一个通过强化学习训练的推理任务。在这一任务中,模型会因正确预测给定上下文中的下一个 token 而获得可验证的奖励。 这就好比在制作蛋糕的过程中,直接将樱桃融入到蛋糕的主体结构中。 作者指出,RPT 范式的好处在于 ...
Mistral的首个强推理模型:拥抱开源,推理速度快10倍
机器之心· 2025-06-11 03:54
机器之心报道 编辑:泽南 强推理终于要卷速度了。 大模型强推理赛道,又迎来一位重量级玩家。 本周二,欧洲人工智能公司 Mistral AI 发布了 Magistral,这是一个全新的大语言模型(LLM)系列,展现了强大的推理能力。它能够进行不断反思,并解 决更复杂的任务。 此次发布包含两个版本:面向企业客户的大型专有模型 Magistral Medium,以及一个 24B 参数的开源版本 Magistral Small。其中开源版本使用 Apache 2.0 许可,可以自由使用、商用化;Magistral Medium 则可通过 Mistral 的 Le Chat 界面和 La Plateforme API 访问。 在基准测试中,新模型取得了不错的成绩。这里主要是 Magistral 与其前身 Mistral-Medium 3 和 DeepSeek 系列的对比。Magistral Medium 在 AIME2024 上的得分为 73.6%,其中多数投票为 64%,得分为 90%。Magistral Small 的得分分别为 70.7% 和 83.3%。 新模型在一些其他高要求测试中也表现出色,包括研究生水平的 ...
专访|让AI智能体真正“看懂”世界——访德国弗劳恩霍夫研究所数据专家
Xin Hua She· 2025-06-11 02:53
新华社柏林6月10日电 专访|让AI智能体真正"看懂"世界——访德国弗劳恩霍夫研究所数据专家 措恩指出,要实现更高程度的自主能力,AI智能体所依赖的基础模型必须具备接收并理解其所处环境 的能力,尤其是在涉及现实任务的场景中。"系统要在真实世界中运行,首先得真正'看懂'这个世 界。"他说,将高精度的三维场景数据与多路传感器数据输入模型,以便其在空间中进行推理和判断, 是当前人工智能研究的前沿方向之一,但这项工作仍面临诸多挑战。 "目前的大语言模型本质上是为处理文字而设计的,擅长语言理解与生成。"措恩说,"而来自现实世界 的感知数据,比如三维点云,只是一些无序的坐标集合,并不自带语义结构。"他表示,要让模型真 正"理解"这些数据,必须开发新的数据表示方式和训练机制,将"非语言"信息转化为模型能够真正识别 和处理的形式。 措恩还谈到了AI智能体应用过程中最本质的问题——信任。他认为,AI智能体之所以能够获得用户信 任,关键在于其决策路径具有高透明性和可审查性。与单一语言模型不同,AI智能体会将复杂问题拆 解为多个明确的小任务,每一步都有清晰的逻辑和执行过程,更容易被理解和验证。 "用户可以清楚看到智能体是如何逐步推 ...
AI大模型心智已经接近人类!科创板人工智能ETF现涨0.62%,实时成交额突破4000万元
Mei Ri Jing Ji Xin Wen· 2025-06-11 02:48
Group 1 - The research by the Chinese Academy of Sciences confirms that multimodal large language models (MLLMs) can form object concept representation systems similar to humans, providing a theoretical framework for building human-like cognitive structures in AI [1] - The A-share market saw a rebound in AI-related stocks, with significant gains in companies such as Chipone Technology, Tianjun Technology, and Hongsoft Technology, indicating high market interest in AI themes [1] - The Sci-Tech Innovation Board AI ETF (588930) tracks 30 leading AI companies, covering various sectors including computing chips, cloud computing, and robotics, with the top five stocks accounting for 47% of the index weight, suggesting high AI theme purity and elasticity [1] Group 2 - Guotai Junan Securities highlights the significant investment value of the AI sector amid increasing global tech competition, emphasizing the urgency of technological self-reliance in China [2] - The development of domestic EDA tools and advancements in AI research and application capabilities have injected new vitality into the computer industry, with models like DeepSeek R1 nearing international top-tier performance [2] - The upgrade of Doubao App expands AI application scenarios, showcasing the broad potential of AI in daily life, particularly in video chat and Q&A functionalities [2]
苹果高管捍卫其AI战略:开发 AI 聊天机器人并非我们的目标
Huan Qiu Wang· 2025-06-11 02:35
【环球网科技综合报道】6月11日消息,据《华尔街日报》报道,苹果公司软件工程高级副总裁 Craig Federighi 和全球营销高级副总裁 Greg Joswiak谈到苹果 的人工智能(Apple Intelligence)业务时,强调其战略重点在于系统集成而非开发传统聊天机器人。 据介绍,Apple Intelligence 的设计并非作为一个独立的应用程序或"目的地",而是一个在后台运行的框架,旨在提升用户的日常操作体验。用户在使用苹果 设备时,可能意识不到背后有 AI 技术的支持。这一策略与市场上常见的聊天机器人模式形成鲜明对比,苹果致力于实现无缝的系统集成,专注于优化用户 体验。 面对关于 Apple Intelligence 实用性和竞争力的提问,Joswiak 强调苹果的战略与其他公司截然不同。他指出,苹果目前没有开发独立 AI 应用或聊天机器人的 计划,而是选择将 AI 深度嵌入操作系统中,以实现跨设备的个性化、情境化交互体验。 据悉,为了实现这一目标,苹果与 ChatGPT 展开合作,使用户能够访问工具,同时确保系统的隐私性和安全性。 Federighi 进一步解释道,苹果无需涉足所有技术领 ...
时空压缩!剑桥大学提出注意力机制MTLA:推理加速5倍,显存减至1/8
机器之心· 2025-06-11 00:24
在大语言模型蓬勃发展的背景下,Transformer 架构依然是不可替代的核心组件。尽管其自注意力机制存在计算复杂度为二次方的问题,成为众多研究试图突破的 重点,但 Transformer 在推理时灵活建模长距离上下文的能力,使得许多线性复杂度的替代方案(如 RNN、Linear Attention、SSM 等)难以真正取代它的地位。 尤其是在大语言模型广泛采用 decoder-only 架构之后,自注意力机制的重要性进一步凸显。然而,这种机制也带来新的挑战:推理过程中每一步都需要访问 Key- Value(KV)缓存,该缓存的大小随着生成序列长度线性增长,逐渐成为影响推理效率的关键瓶颈。随着模型参数维度不断扩大,KV 缓存所需的显存和带宽开销 显著上升,限制了模型的推理长度与可支持的 batch size。 值得一提的是,近期由 DeepSeek 团队提出的 MLA 机制,通过在隐空间维度对 KV 缓存进行压缩,显著提升了推理效率,推动了大模型在低资源场景下的高效部 署。但随着生成序列的持续增长,时间维度的冗余信息也逐渐暴露,压缩其所带来的潜力亟待挖掘。然而,如何在保持性能的前提下压缩时间维度,一直受到增 ...
科学家证实大模型能像人类一样“理解”事物
Ke Ji Ri Bao· 2025-06-10 22:45
Core Insights - Researchers from the Chinese Academy of Sciences have confirmed that multimodal large language models can learn to "understand" objects in a manner similar to humans, paving the way for future AI systems that can comprehend the world like humans do [1][2] Group 1: Research Findings - The study utilized a clever experiment based on human cognitive principles, where both a large model and humans played a "find the difference" game, analyzing data from 4.7 million judgments to create a "concept map" of the model's thinking [2] - The researchers identified 66 key perspectives on how AI "understands" objects, which align closely with the neural activity patterns in the human brain responsible for object processing [2] - The multimodal model's approach to "thinking" and making choices is found to be more similar to human cognition compared to other models [2] Group 2: Comparison with Human Understanding - While humans consider both the appearance and meaning of objects, the large model relies more on "text labels" and learned abstract concepts, indicating a development of a somewhat human-like understanding of the world [2]
财经观察:AI时代,苹果落后了吗?
Huan Qiu Shi Bao· 2025-06-10 22:41
Core Viewpoint - Apple's WWDC25 faced skepticism as the company failed to deliver significant advancements in AI, raising concerns about its competitiveness in the AI era [1][4][5] AI Developments - Apple introduced a new user interface called "liquid glass" and expanded functionalities for Carplay and AirPods, but focused more on design aesthetics rather than AI innovations [3][4] - The company announced plans to integrate code completion tools and OpenAI functionalities into developer software, indicating a focus on backend infrastructure rather than front-end interaction [3][5] - Analysts noted that Apple's AI advancements have been slow, with the company struggling to deliver on promises made a year ago regarding AI upgrades for Siri [5][6] Competitive Landscape - Competitors like Google and Samsung are rapidly advancing their AI capabilities, with Google showcasing AI integration across its product lines [7] - Analysts suggest that Apple may be at least three years away from launching a "truly modern AI assistant," while competitors have already integrated such technologies [7][10] Market Performance - Apple's stock has declined approximately 18% since the beginning of 2025, making it the worst performer among the "Big Seven" tech companies [8] - The company faces multiple challenges beyond AI, including potential impacts from U.S. tariff policies and legal issues surrounding its service business [8][9] Internal Challenges - Internal management issues and a lack of unified strategy have hindered Apple's AI development, with some teams advocating for aggressive investment while others are more cautious [5][6] - Privacy concerns have limited Apple's ability to collect data, further complicating its AI advancements [5][6] Future Considerations - Analysts emphasize that Apple must overcome three key challenges: keeping pace with cloud-based large language models, miniaturizing models for end-user devices, and developing advanced image and video models [10]
腾讯研究院AI速递 20250611
腾讯研究院· 2025-06-10 14:58
生成式AI 一、 苹果 六大OS大变样,AI模型免费开放 ,但新Siri 又鸽了 1. 苹果发布六大系统统一设计,采用全新"Liquid Glass"流体玻璃元素,视觉效果大幅提 升; 2. 开放端侧大语言模型访问权限给所有App,系统级AI功能无处不在,包括视觉搜索、实时 翻译; 3. iPadOS窗口系统迎来重大更新, macOS联动iPhone功能增强 ,但新Siri再次推迟发布。 https://mp.weixin.qq.com/s/U7SmtQdmLX9N3qGJNnM1Rw 二、 苹果推出 Xcode 26 开发者工具,内置 ChatGPT 等 AI 功能 1. 苹果宣布Xcode 26将集成ChatGPT,使开发者能通过AI辅助代码编写、文档生成和错误 修复; 2. 新增窗口置顶功能,让划词结果窗口固定悬浮,不打断阅读节奏提高效率; 3. 升级功能特别适用于浏览外文网站、阅读英文文档和专业论文场景,可更新最新版本使 用。 2. 开发者可通过API密钥将其他供应商的AI模型引入Xcode,构建多元智能编程生态; 3. 苹果发布Foundation Models框架,让开发者仅需三行代码即可调用设备 ...