大语言模型(LLM)
Search documents
外媒:苹果谨慎布局人工智能,2026或迎AI反超窗口
Huan Qiu Wang Zi Xun· 2025-12-31 04:12
外媒称,内部方面,苹果的人工智能团队仍在探索自研模型的可能性,但部分高管认为,随着LLM技 术逐渐商品化,长期投入自研模型的商业合理性正在减弱。今年早些时候,原AI负责人约翰·詹南德雷 亚(John Giannandrea)退休,其职责由Apple Vision Pro核心开发者迈克·洛克威尔(Mike Rockwell)接 任。 尽管苹果曾在2024年全球开发者大会(WWDC)上承诺推出具备情境感知能力的新版Siri,并首次提 出"Apple Intelligence"概念,但相关功能至今未能如期落地。此后,公司明显放缓了AI功能的发布节 奏,转而将2025年软件更新的重点聚焦于用户界面革新"Liquid Glass"。与此同时,苹果大幅降低了对 AI技术的市场宣传力度。 与Meta、谷歌等竞争对手动辄投入数百亿美元建设AI数据中心和定制芯片不同,苹果在AI基础设施上 的支出相对克制。报告指出,这种节制使其仍保有约1300亿美元现金储备,可用于未来AI相关投资或 收购。 值得注意的是,苹果并未完全依赖自主研发大语言模型(LLM)。据消息人士透露,公司计划在2026 年推出的多项AI功能将整合谷歌的Gemin ...
自回归因果注意力也能并行解码?上交联合UCSD突破LLM推理瓶颈,模型代码全开源
机器之心· 2025-12-30 06:57
在大语言模型(LLM)落地应用中,推理速度始终是制约效率的核心瓶颈。传统自回归(AR)解码虽能保证生成质量,却需逐 token 串行计算,速度极为缓慢; 扩散型 LLM(dLLMs)虽支持并行解码,却面临训练成本高昂、质量下降及 KV 缓存兼容问题;投机解码(Speculative Decoding)则需额外引入草稿模型,系统 复杂度大增。 Jacobi Forcing 核心优势: 破解并行解码的 "三元悖论" Jacobi Forcing 的创新之处在于打破了 "低代价、高速度、高质量" 的不可能三角,其核心优势体现在三大维度: 近期,来自 UCSD Hao AI Lab 和上海交大 Deng Lab 的团队提出了一种突破性解决方案 ——Jacobi Forcing,该方案无需重构模型架构,即可将标准 AR 模型转化为 原生因果并行解码器,在编码、数学等任务中实现最高 4 倍 wall-clock 提速和 4.5 倍 tokens-per-forward 提升,同时保持接近 AR 模型的生成质量,为 LLM 高效推 理开辟了新路径。 论文地址: https://arxiv.org/pdf/2512.1468 ...
物理学变天,「AI主导」论文首次登顶刊,人类科学家沦为验证者?
3 6 Ke· 2025-12-25 07:54
【导读】AI提供1%的灵感,人类提供99%汗水!密歇根州立大学物理学家许道辉,在AI启发下,重新思考量子力学本质,在顶刊《物理快报B》上发表 了相关结论。 最近,密歇根州立大学物理学家许道辉(Stephen Hsu),经历了一件连他自己都感到震惊的事。 不是AI替他算积分、解方程,而是AI指出:你这项研究,应该换一整套数学框架来证明: 用Tomonaga–Schwinger形式的量子场论来做。 在著名物理学期刊《物理快报B》(Physics Letters B)上,许教授在线发表了一篇关于量子场论(QFT)和态依赖量子力学(State-Dependent Quantum Mechanics)的论文。 与此同时,他还发布了一份关于「AI方法论」的报告。 这两份文件加在一起,向科学界扔下了一枚重磅炸弹: 这可能是第一篇由AI提供核心理论突破思路的理论物理学论文。 诺奖得主理查德·费曼(左)和19岁的许道辉(右) 他公开承认:论文的核心想法来自 GPT-5。 密歇根州立物理学家许道辉,11月把预印本挂在arXiv上,之后被Physics Letters B接收。 对物理和AI圈来说,这都预示着转折点:AI不只帮忙润 ...
聊天机器人只是过客?谷歌押注“世界模型”,寄希望智能眼镜成为AI真正“杀手级”应用
Hua Er Jie Jian Wen· 2025-12-23 10:30
谷歌正在调整其在人工智能领域的战略重心,试图超越目前主导行业的聊天机器人范式,通过押注能够 理解物理世界的"世界模型",寻求AI技术的下一个质的飞跃。 据彭博专栏作者Parmy Olson23日报道,谷歌计划于明年(2026年)推出新款AI智能眼镜,旨在通过"世 界模型"技术与Meta等竞争对手展开差异化竞争。这款眼镜将由谷歌与三星合作制造,不同于仅能通过 摄像头描述画面的竞品,该设备旨在理解三维空间、物理对象间的关系以及环境动态。这被视为 Hassabis在产品领域的一次关键尝试,有望扭转谷歌在智能眼镜领域的过往声誉,并确立新的行业标 准。 这一举措正值谷歌在AI竞赛中逐渐收复失地之际。随着Gemini 3模型的成功发布,谷歌在性能榜单上拔 得头筹,并在用户规模上实现了对OpenAI的强有力追赶,迫使竞争对手Sam Altman通过发布"红色代 码"来应对市场压力。尽管聊天机器人ChatGPT在企业业务和先发优势上仍处于领先,但谷歌凭借其雄 厚的资源储备和双管齐下的技术路线,正在重新定义这场"龟兔赛跑"的格局。 市场观点认为,如果这款基于世界模型的智能眼镜能够在商业上取得成功,将不仅仅是谷歌硬件业务的 复苏 ...
给AI接上专有知识库:RAG的工程化实现
Tai Mei Ti A P P· 2025-12-23 07:09
文 | 沈素明 想象一个场景。 一家制造企业花费了数十万的预算,接入了市面上最先进的大语言模型(LLM)。员工们兴奋地尝试 让这个"无所不知"的AI助手来处理日常工作。 有人问道:"我们公司的 XX 产品,最新版本的设计参数是什么?" AI助手礼貌地回答:"抱歉,我无法访问您公司的内部产品信息。" 另一个人问:"那去年第三季度的设备故障率是多少?我想写个分析报告。" AI助手再次摊手:"我无法访问您企业的内部数据库和历史数据。" 员工们感到困惑了:"你不是号称最智能的AI吗?为什么连我们公司自己的事都不知道?" 这不是AI不够聪明,而是我们对通用AI的能力产生了误解。ChatGPT、文心一言这些通用大模型,它们 是基于庞大、但公开的互联网数据训练出来的。它们博学多才,能写诗、能编程、能分析宏观经济,但 它们对企业的专有知识——那些内部流程文档、产品手册、数据库记录、私人聊天记录——一无所知。 通用AI是"外人",而企业需要的是一个"内部专家"。企业想把AI真正用起来,就必须解决这个核心矛 盾:如何让通用AI,快速、准确、且低成本地掌握企业内部不断更新的专有知识? 解决方案就是目前在大型语言模型应用中最受欢迎的 ...
智能问数方案哪家更靠谱?企业选型核心指南
Sou Hu Cai Jing· 2025-12-22 15:50
数据驱动已成为企业竞争的核心壁垒,"非技术人员高效获取数据洞察"却仍是多数企业的数字化痛点。传统BI工具因操作复杂、依赖技术支撑,难以适配业 务快速决策需求,而智能问数工具凭借"自然语言交互+AI自动分析"的核心能力,成为破解这一困境的关键。年末正是企业梳理数字化工具、优化选型策略 的重要阶段,面对市面上品类繁多的智能问数工具,如何精准匹配需求?本文经多方调研,深度解析优质智能问数工具的核心价值与能力,为企业高效决策 提供参考。 智能问数工具是基于自然语言处理(NLP)、大语言模型(LLM)与商业智能(BI) 技术融合的数据分析平台,其核心价值在于打破数据分析的"技术壁 垒",让数据价值触手可及,具体体现在三大核心优势: 降低用数门槛:传统BI依赖IT或数据分析师编写代码,业务人员(如销售、运营、财务)想查数据需提需求、等开发,周期长且易偏差;智能问数工具让非 技术人员无需学习SQL语法,用日常语言提问(比如"2025年Q3华东区某产品销售额同比增长多少?")即可获取结果,实现"自主用数不依赖他人"。 提升决策效率:从"提需求到出结果",传统模式往往需要1-3天,而智能问数可实现秒级响应,适配企业快速决策场景 ...
近两百万人围观的Karpathy年终大语言模型清单,主角是它们
机器之心· 2025-12-21 03:01
编辑|杜伟 2025 年还有 10 天就要结束,这意味着是时候进行一波年终总结了。 对于人工智能领域而言,2025 年是大语言模型(LLM)快速演进、重磅事件密集出现的一年。 就在昨天,知名 AI 学者 Karpathy 列出了一份清单,记录了他个人认为最重要、也多少有些出乎意料的「范式转变」。 这些真正改变了行业格局、并在概念层面让 Karpathy 印象深刻的变化会落在哪些领域呢?我们接下来一一来看(以第一人称)。 可验证奖励强化学习(RLVR) 2025 年初,几乎所有实验室的 LLM 生产训练流程都像下面这样: 这套流程稳定、可靠,曾长期被视为「工业级 LLM」的标准做法。 预训练(类似 2020 年的 GPT-2/3); 监督微调(SFT,类似 2022 年的 InstructGPT) 基于人类反馈的强化学习(RLHF,约 2022 年) 但在 2025 年,一种新的阶段浮出水面,并迅速成为事实上的标配: 可验证奖励强化学习(Reinforcement Learning from Verifiable Rewards,RLVR) 。 RLVR 的核心做法是,让模型在可自动验证的环境中接受强化学习训练 ...
智谱,通过港交所IPO聆讯,或很快香港上市,中金公司独家保荐
Sou Hu Cai Jing· 2025-12-20 12:11
| 纂]項下的圖纂 數目 | [编纂]股H股(視乎[编纂]行使與否而定) | | --- | --- | | [编纂]數目 | [编纂]股H股(可予重新分配) | | [编纂]數目 | [編纂]股H股(可予重新分配及視乎[編纂] | | 行使與否而定) | | | 最高 编纂] | 每股H股[編纂]港元,另加1.0%經紀佣金、0.0027% | | | 證監會交易徵費、0.00565%聯交所交易費及 | | | 0.00015%會財局交易徵費(須於申請時以港元繳 | | 足,多繳股款可予退還) | | | 面值 | 每股H股人民幣[0.10]元 | | [編纂] | [編纂] | | CICC中金公司 | 獨家保薦人、 编纂] 编纂] | 2025年12月19日,来自北京海淀区的北京智谱华章科技股份有限公司Knowledge Atlas Technology Joint Stock Company Limited.(以下简 称"智谱")在港交所披露聆讯后的招股书,或很快在香港主板IPO上市。 智谱华章招股书链接: 主要业务 智谱 ,成立于2019年,作为中国领先的人工智能公司,追求通用人工智能( AGI) 创 ...
香港证监会原主席梁定邦:智能金融不“唯大模型”论 监管需严保数据真实与风险可控
Xin Lang Cai Jing· 2025-12-20 10:02
专题:2025年深圳香蜜湖金融年会 12月20日,香港证监会原主席梁定邦在深圳香蜜湖金融年会上,就港澳智能金融及人工智能发展发表观 点。 他指出,港澳地区智能金融已覆盖至银行、证券、保险、跨境金融和电子支付五个领域。香港在推进人 工智能应用于传统金融时,并非单纯依赖大语言模型(LLM),而是采取包括区块链在内的多层次、 多架构的技术融合策略。 以金融监管角度来说,梁定邦表示,目前 "大数据"仍是香港金融科技应用基础,"大模型"只是其中一 环。香港自2019年起,已经在监管中引入"大数据"分析、专家系统、机器学习等多种技术手段,监管机 构在核心业务中优先使用可验证、可追溯的底层真实数据,而大模型则多用于辅助性、后台类工作。 梁定邦提示,由于大模型目前仍存在"幻觉"风险,因此在金融监管及机构的业务场景中,必须对AI保持 审慎态度。他表示,生成式人工智能在涉及客户直接交互的前台业务中应用仍较为谨慎,主要集中于后 台的风险管理、数据分析等支持性环节。。即便如此,最终决策仍需由风险管理委员会及风险官结合个 人经验与多维度数据进行最终判断,不能完全依赖模型输出。 梁定邦表示,香港在智能金融发展上保持高度开放态度,但在客户 ...
Karpathy 2025 年度盘点:o3 是真正拐点,Cursor 证明了应用层比我们想象的要厚
Founder Park· 2025-12-20 08:59
文章转载自「赛博禅心」 Andrej Karpathy 在 X 上更新了一篇博客文章,回顾了 2025 年大模型发展。 在文章中,Karpathy 提到,2025 年,是 LLM 令人兴奋的一年。 LLM 正在作为一种全新的智能形态浮现,它们同时比我们预想的聪明得多,也比我们预想的蠢得多。 即便在当前的能力水平下,整个行业也远未实现其 10% 的潜力。 超 17000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应用。 邀请从业者、开发人员和创业者,飞书扫码加群: 进群后,你有机会得到: 01 可验证奖励的强化学习(RLVR), 与此同时,有太多的想法值得去尝试,从概念上看这个领域依然广阔开放。 正如我今年早些时候 在 Dwarkesh 播客中提到的 ,相信我们将继续见证快速而持续的进步,但同时仍有大量工作要做, 系好安全带。 以下是我个人认为最值得关注的几个「范式转变」,这些变化重塑了整个行业格局,也在概念上给我留下了深刻印象。 TLDR: ⬆️关注 Founder Park,最及时最干货的创业分享 成为新的训练主力 2025 年,可验证奖励的强化学习(RLVR)成为 LLM 训练的新主力环节; ...