Workflow
量子位
icon
Search documents
无预训练模型拿下ARC-AGI榜三!Mamba作者用压缩原理挑战Scaling Law
量子位· 2025-12-15 10:33
henry 发自 凹非寺 量子位 | 公众号 QbitAI 压缩即智能,又有新进展! | Method | Trained on: | Neural | Acc. | Dataset split | | --- | --- | --- | --- | --- | | Random guessing | Nothing | × | 0% | All | | Brute force rule search (Kamradt, 2024) | Nothing | × | 40% | Private Eval | | U-Net baseline | Target puzzle | V | 0.75% | Public Eval | | CompressARC (ours) | Target puzzle | V | 20% | Public Eval | | HRM ablation (ARC Prize Team, 2025) | Test puzzles | V | 31% | Public Eval | | HRM (Wang et al., 2025) | Train+test puzzles | V | ...
PPIO姚欣:AI正在进入自主行动与创造时代,智能体需要全新的操作系统|MEET2026
量子位· 2025-12-15 10:33
今天的Agent会成为未来AI应用的主力,而Agent Infra会成为下一个AI时代的操作系统。 无论模型能力如何提升,无论应用形态如何演进,未来趋势都指向同一个目标:在AI时代,通过新的Runtime体系,实现模型能力、工具能力 与执行能力的高度融合。 编辑部 整理自 MEET2026 量子位 | 公众号 QbitAI 随着AI从回答问题迈向自主执行和创造,行业开始进入真正的Agentic AI落地元年。这不仅改变了应用形态,也正在重塑整个AI技术栈的底层 逻辑。 与此同时,智能体体系结构的复杂度呈指数级增长,从任务规划、工具调用到长期记忆,每一环节都对底层框架提出了更高要求。对此, PPIO联合创始人兼CEO姚欣 表示: 能看到无论是PC时代,还是移动时代、云时代,操作系统才是最核心的中间层。 这意味着,未来的AI应用将从回答问题的工具转向能够直接完成任务的助手,而要承载这类能力,行业迫切需要一种新的基础设施——Agent 时代的操作系统。 在本次 量子位MEET2026智能未来大会 上,姚欣围绕智能体演进、Agent Infra等关键词分享了自己对 AI底层基础设施架构重塑的判断 : 为了完整体现姚欣 ...
小米语音首席科学家:AI发展的本质就像生物进化,不开源要慢1000倍 | MEET2026
量子位· 2025-12-15 08:05
就像生物进化一样, AI"配方"的设计本质上就是一个不断试错的过程,而进化的速度,取决于"复制"一个新想法所需的时间。 在本次 量子位MEET2026智能未来大会 上,他也将开源视为AI进化的核心加速器—— 若没有开源,行业的进化速度恐怕要慢上一千倍;正是因为有了开源,技术才能像生物适应新环境一样,经历"长期停滞+瞬间爆发"的非线性 跃迁。 编辑部 整理自 MEET2026 量子位 | 公众号 QbitAI 从生物进化的漫长历程到AI技术的疯狂迭代,两者遵循着惊人相似的底层逻辑。 在探寻下一代AI架构的关键时刻,著名的"Kaldi之父"、小米集团首席语音科学家、IEEE Fellow Daniel Povey 提出: 至于如何在未来的竞争中生存,在他看来,大公司最明智的策略是"两条腿走路"—— 一边利用Transformer赋能当下的产品,一边保留资源探索未知,赌中下一个颠覆世界的机会。 为了完整体现Daniel Povey的思考,在不改变原意的基础上,量子位对演讲内容进行了翻译和编辑整理,希望能给你带来更多启发。 MEET2026智能未来大会是由量子位主办的行业峰会,近30位产业代表与会讨论。线下参会观众近 ...
布林坦承谷歌低估Transformer,“还被OpenAI挖走了Ilya”
量子位· 2025-12-15 08:05
Core Insights - The article discusses Google's journey from its inception to its current challenges in the AI space, highlighting mistakes made and opportunities missed, particularly in relation to OpenAI's rise [1][2][5][26]. Group 1: Google's History and Development - Google was founded by Sergey Brin and Larry Page, initially focusing on a project called BackRub, which evolved into the Google search engine [10][16][19]. - The name "Google" reflects their ambition to organize vast amounts of information, derived from a mathematical term representing a large number [21]. - Google fostered a strong academic environment, attracting top talent and focusing on foundational research, which laid the groundwork for its future innovations in AI [22][25]. Group 2: AI Strategy and Mistakes - After the release of the Transformer model, Google underestimated the potential of AI and failed to allocate sufficient resources, allowing OpenAI to capitalize on the opportunity [26][29]. - Despite setbacks, Google's long-term investments in AI research and development, including the creation of specialized TPU chips, have helped maintain its technological edge [30][29]. Group 3: Future Directions and Recommendations - Sergey Brin emphasizes the importance of leveraging AI in various aspects of life and encourages students to pursue computer science, as coding skills remain crucial for developing better AI [32][35]. - He suggests that quantum computing and materials science are undervalued future technologies that could have significant impacts, particularly in conjunction with AI [37]. - Brin advises against prematurely commercializing ideas without adequate preparation, using the example of Google Glass to illustrate the importance of refining concepts before market introduction [42][45].
量子位编辑作者招聘
量子位· 2025-12-15 08:05
AI热潮还在汹涌,但如果你还不知道如何参与……那为什么不来 量子位 呢? 我们是一家以 追踪AI新进展 为核心的内容平台,经过8年积累,目前拥有顶流影响力,广泛且备受认可的产业资源,以及时代风口的最佳观 测和学习生态位。 目前,我们有 三大方向 岗位招聘,希望你是 (或者能成为) 这三个方向的内容专家: 岗位均为全职,工作地点:北京中关村。 岗位面向: 加入我们,你可以获得: 以下是岗位详情: 编辑部 发自 凹非寺 量子位 | 公众号 QbitAI 参与核心采访,对话产业专家、技术大牛、撰写AI云落地案例。 任职要求: AI财经商业方向 所有岗位不同能力层级职位均在开放,欢迎结合个人履历和经验申请。 AI产业方向 岗位职责: AI产业方向 :关注基建层创新,包含芯片、AI Infra、云计算; AI财经方向 :关注AI领域创投和财报,跟踪产业链资本动向; AI产品方向 :关注AI在应用和硬件终端方向的进展。 社招:覆盖编辑、主笔、主编各个层级,按能力匹配岗位; 校招:应届毕业生,接受实习且可转正。 站在AI浪潮之巅 :第一时间接触和了解AI领域最新技术和产品,构建完整的AI认知体系。 玩转AI新工具 :将各种 ...
Minion Skills: Claude Skills的开源实现
量子位· 2025-12-15 08:05
Minion Agent 团队 投稿 量子位 | 公众号 QbitAI 引言 Claude最近推出了一个令人兴奋的特性—— Skills系统 。它让AI Agent能够动态加载专业能力,按需"学习"处理PDF、Excel、PPT等专业 文档的技能。 作为一个开源爱好者,我立刻意识到这个设计的价值,并在Minion框架中实现了完整的开源版本。本文将介绍Skills的设计理念,以及我的开 源实现细节。 Skills解决了什么问题? 在开发AI Agent的过程中,有一个核心矛盾: Context Window的有限性vs能力需求的无限性 传统做法是把所有工具、所有指令都塞进system prompt: System Prompt = 基础指令 + 所有工具描述 + 所有专业知识 = 50K+ tokens = 高延迟 + 高成本 + 低效率 更糟的是,大多数时候用户只需要其中一小部分能力。当用户问"帮我处理这个PDF"时,系统却加载了处理Excel、数据库、代码等所有能力 的上下文。 Skills的核心理念 Minion的开源实现 看到Claude Code的Skills设计后,我决定在Minion框架中实现一个 ...
昆仑万维方汉:通用Agent是伪命题,AI Office仍有存在空间丨MEET2026
量子位· 2025-12-15 05:57
编辑部 整理自 MEET2026 量子位 | 公众号 QbitAI 从通用大模型到可执行智能体,AI正沿着过程自动化历经技术的拐点。 正值Agent迅速迭代时期, 昆仑万维董事长兼CEO方汉 从产业出发,提出了一个全新的视角: Agent并不是通用人工智能的雏形,而是一种可验证过程的自动化系统。它不擅长创造新范式,却极其擅长把已经被人类验证过的流程 规模化复制。 在他的判断中,从ChatGPT到DeepSeek,标志着大模型完成了从"背答案"到"背过程"的关键跃迁:前者打开了通用对话与生成能力的入口, 后者则通过更高效、更长推理的方式,把大模型推向以过程泛化为核心的新阶段。 也正因此,Agent最先落地的并非千行百业,而是流程稳定、结果可验证的AI Office。所以长期来看,将是基础模型逐步收敛,而围绕具体流 程构建的 专业Agent 成为组织运行的基本单元。 在他看来,最终Agent重塑的不是某个岗位,而是整个组织——人类将从重复执行者,转变为过程的架构者,这也将成为Agent时代人类表达 自我的新范式。 为了完整呈现方汉的思考,在不改变原意的基础上,量子位对演讲内容进行了整理编辑,希望能提供新的视角与洞 ...
马斯克猛猛带货太空数据中心!“能耗比地球香太多”
量子位· 2025-12-15 05:57
最近一段时间,无论是在硅谷还是国内, 太空数据中心 都是热议的焦点之一。 而马斯克,更是凭一己之力扛起宣传大旗,—连几条推文无不与此相关。 先是确认SpaceX未来将在太空部署数据中心: 一水 发自 凹非寺 量子位 | 公众号 QbitAI 太空,成为了AI基建新的必争之地。 后又在谷歌宣布太空数据中心计划时留下"Interesting"这样的评论,明确肯定了谷歌的眼光。 同时在接受公开采访时表示: 地球只接收到太阳能量的20亿分之一,如果想要产生相比地球来说多几个数量级的能量,你必须进入太空。 未来4~5年内,在太空部署和运行大规模AI系统的成本可能比在地球上运行同类系统更具成本效益。 …… 显而易见,敢想敢拼的马斯克,正在将太空数据中心作为AI基建的下一块试验田。 不止是他。 包括亚马逊贝佐斯、谷歌前CEO施密特等也在纷纷谈论和布局。 所以这太空数据中心究竟为何物?又为何吸引一众硅谷大佬的目光? 来听他们是怎么说、怎么做的—— 马斯克带头,硅谷刮起了"太空数据中心风" 关于硅谷最近刮起的"太空数据中心风",The Information是这样吐槽的: 每隔一段时间,科技界的知名人物就会开始如此积极地炒作同 ...
苏州大学首篇数学四大刊!解决了40年未决的丢番图逼近问题
量子位· 2025-12-15 04:04
闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 中国学者又一篇数学四大刊成果出炉,还是 苏州大学 的首篇四大刊成果。 论文《Khintchine dichotomy for self-similar measures》已被Journal of the American Mathematical Society (《美国数学杂志》) 录用。 该项成果的作者是 苏州大学副教授张涵 ,合作者有 Timothée Bénard (法国国家科学研究中心 (CNRS),巴黎北索邦大学 (LAGA) 的研 究员) 和 何伟鲲 (中国科学院数学与系统科学研究院副研究员) 。 《数学年刊》《数学学报》《数学新进展》和《美国数学杂志》并称为数学四大刊,是国际数学界公认的数学顶级期刊,每年中国研究机构中 选论文经常不超过10篇。 这次的突破是把描述有理数如何近似表达实数的 辛钦定理 推广到了 所有自相似测度 上。 接下来咱就看看是怎么个拓展法。 比如用22/7逼近π,误差不到0.0015;用355/113逼近π,误差更是能缩小到千万分之三。 而数论领域的辛钦定理,就从数学层面量化了这种逼近的可能性和效率。它给出了一个明确的判 ...
何恺明组三位本科生领衔!持续聚焦Flow模型,突破归一化流生成效率瓶颈
量子位· 2025-12-15 04:04
鱼羊 发自 凹非寺 量子位 | 公众号 QbitAI 何恺明团队新作,持续聚焦Flow模型。 论文提出名为 双向归一化流 (BiFlow) 的新框架,通过解耦前向过程——将数据映射为噪声,和逆向过程——把噪声再转回来生成图片, 成功打破了传统归一化流生成模型效率低下的问题。 值得一提的是,论文的三位一作分别是来自清华姚班和MIT的本科生。 BiFlow:逆向过程不必是前向过程的精确逆运算 归一化流方法 (NFs) 已经成为生成建模的一种原则性框架。 标准的归一化流包含前向过程和逆向过程: 与MeanFlow对流匹配的优化不同,这次主要旨在解决归一化流在生成模型中的局限。 前向过程将数据映射为噪声,逆向过程则通过对前向过程求逆来生成样本。 传统的NF模型有一个硬性规定,逆向过程必须是前向过程的精确逆运算——要像钥匙和锁一样完全匹配。这就导致了两个问题: BiFlow的核心创新就在于, 打破了"逆向过程必须是前向过程的精确逆运算"这一规则 。 设计思路是这样的: BiFLow解耦了前向过程和逆向过程的设计。 模型设计受限:因为要保证 "可逆",不能使用很多强大的通用架构 (比如视觉Transformer) ,得特 ...