量子位
Search documents
Meta亚历山大王走人?小扎回应了
量子位· 2026-03-10 04:05
而就在前后脚的功夫,Meta发言人 Andy Stone 也在X上发文辟谣,否认了最近不断发酵的"亚历山大王出走"的传闻。 他表示 王仍在负责MSL(Meta超级智能实验室)和TBD Lab ,而且王的影响力在团队内不仅没有减弱,反而还在持续上升。 henry 发自 凹非寺 量子位 | 公众号 QbitAI 亚历山大王( Alexandr Wang,汪滔)从Meta离职了? 假的! 就在刚刚,小扎在Thread上更新了一张他和亚历山大王的自拍,照片上俩人堆满笑容,王看上去还胖了不少。 同时,Stone还直接评价此前媒体的相关报道—— "实在太荒唐"。 可以说, 小扎一幅图, 发言人一席话,让很多人暂时松了口气,但新的疑问也随之而来: 那……新模型呢? | 毕竟,网传的剧本是亚历山大王之所以被"小扎换掉",就是因为新模型"牛油果"难产—— | | --- | | 发布时间从原本预计的去年底,一路拖到2026年第一季度。 | | 如今眼看3月都快过一半了,仍然没有任何正式消息。 | | 截至目前,亚历山大王本人还未正面回应。 | 他在X上的置顶帖,依然是去年7月宣布加入Meta的那条。 亚历山大王被传离职 最近几 ...
机器人全程自主收拾客厅!390亿美元估值机器人端到端新技能,英伟达持续加注
量子位· 2026-03-10 04:05
估值高达390亿美元、英伟达持续看好的 Fi gur e ,刚刚放出了最新进展,引来大量网友围观。 这次,其机器人能够 完全自主 、端到端全流程整 理客厅 了。 西风 发自 凹非寺 量子位 | 公众号 QbitAI 只见它先是喷洒消毒液擦拭了茶几 (毛巾 撩到肩 膀头子好好笑 ) : 接着将茶几和沙发上的杂物拾起,归置到了收纳桶中: 最后,它甚至拿起遥控器,精准按下了关机键,还强迫症似的把遥控器也摆摆好: 网友看完这一套行云流水的操作,纷纷让团队赶快安排现场直播演示。 还有网友认为,难的并不是让机器人移动物体,而在于让它理解你喜欢的是什么样子。 随后又把抱枕一一摆正: 值得一提的是,背后支撑这一突破的,正是Figure团队自主研发的具身大脑Helix 02。 就在一个月前,搭载该系统的Figure 03机器人,已在家庭厨房场景中完成了从洗碗机取盘到放入橱柜的整套自主操作。 近4分钟,机器人全程没有重置、无人为干预、也没有遥操作,将行走、抓取、搬运、放置等61个操作一气呵成: 据了解,此次解锁客厅整理新任务,团队 并未 新增算法,也未进行 特殊场景的工程适配 ,仅通过补充最新场景数据,便让Helix 02系统成 ...
12小时登顶OpenAI MLE-bench!上海AI Lab开源算法进化框架MLEvolve
量子位· 2026-03-10 04:05
MLEvolve团队 投稿 量子位 | 公众号 QbitAI 让AI像Kaggle顶尖选手一样设计算法,需要几步? 上海AI实验室「书生」科学发现平台最新开源的 MLEvolve 给出了答案: 12小时登顶MLE-bench榜单第一。 MLEvolve的核心是一套自进化机器学习系统。它用 渐进式蒙特卡洛图搜索 替代传统树搜索,让不同尝试路径之间实现经验互通;用 全局 记忆层 记录每一次成败,让智能体越探索越聪明;还用多模式代码生成和多智能体协作,覆盖从方案设计到代码审查的全流程。 算法发现也是创新能力的一种重要体现。 能够自主设计和优化算法,意味着不仅掌握了现有工具的使用,更具备了创造新工具的能力。在 AI时代,让智能系统具备算法层面的创新能力,是迈向自主科学发现的关键一步。 『书生』科学发现平台 (Intern Discovery) 是上海人工智能实验室面向AI驱动科学发现构建的综合性平台。作为支撑平台的核心技术之 一,InternAgent 1.5构建了生成、验证、进化三大协同子系统,将科研抽象为可不断迭代的智能推理过程。 MLEvolve 作为其中验证子系统的方案优化引擎,聚焦于算法设计与优化任务——在 ...
Jeff Dean最新访谈:未来开发者人均50个智能体,写需求成核心技能
量子位· 2026-03-10 02:13
听雨 发自 凹非寺 量子位 | 公众号 QbitAI 谷歌首席AI科学家、传奇工程师 Jeff Dean , 在最新访谈中放出了一个炸裂预言: 未来每个工程师可能会各自管理 50个智能体实习生 ,完成大量并行任务,而且沟通效率会比人更高效。 未来最重要的技能将会是 "写清楚需求" ,因为Agent的输出质量完全取决于你如何定义问题。 好家伙,那以后岂不是…… 写需求比写代码还重要? Jeff Dean还揭秘了谷歌目前遵循的 帕累托前沿策略 ,新模型的推出主要有两条路线: 一方面是 高端前沿模型 ,用于深度推理、复杂数学问题等高难任务; 另一方面是 高性价比模型 ,用于低延迟场景,比如更流畅的Agent式编程。 想必大家都知道了,Gemini 3 Flash能做到又快又智能,最大的秘诀就在于 蒸馏 。 Jeff Dean在这期访谈中亲口认证:通过蒸馏, 小模型可以非常接近大模型性能 。 他们让小模型在大量训练数据上多次迭代学习,同时利用大模型输出的logits信息,让小模型学到更细腻的行为。 这就是为什么Gemini能够做到 "下一代Flash ≈ 上一代Pro,甚至更好" 。并且他也透露,谷歌内部会 持续推进 ...
10秒视频token超5万,O(n²)跑不动?用后训练线性化框架实现1.71倍加速,推理成本大降|CVPR'2026
量子位· 2026-03-10 02:13
Core Viewpoint - The article discusses the challenges and advancements in video diffusion models, particularly focusing on the introduction of LINVIDEO, a framework that enables significant linearization of video generation processes without the need for data or retraining, while maintaining quality [3][25]. Group 1: Challenges in Video Diffusion Models - Video generation has entered a large-scale era, but the computational costs have surged significantly [1]. - The complexity of self-attention in video generation is O(n²), making it difficult to run efficiently, especially with token counts exceeding 50,000 for a 10-second video [2]. - The difficulty in linearizing video diffusion models arises from the sensitivity of the replacement process, where different layers have varying impacts on the final generation quality [7]. Group 2: LINVIDEO Framework - LINVIDEO is a post-training framework that allows for high-proportion linearization of video diffusion models while preserving generation quality [3][6]. - The framework employs a selective transfer approach, treating layer selection as a binary decision problem, allowing the model to learn which layers can be safely linearized [15][25]. - Additionally, LINVIDEO introduces anytime distribution matching (ADM), which aligns sample distributions across any timestep, enhancing efficiency and effectiveness without the need for auxiliary models [15][25]. Group 3: Experimental Results - LINVIDEO demonstrated a 1.71× end-to-end acceleration on the Wan 14B model, and with a 4-step distillation, it achieved up to 20.9× acceleration while maintaining nearly the same video quality [6][19]. - The performance comparison with other methods showed that LINVIDEO achieved a latency of 68.26 seconds with a 1.43× speedup on the Wan 1.3B model, and 1127 seconds with a 1.71× speedup on the Wan 14B model [17][19]. - Overall, LINVIDEO provides a practical solution for the linearization of video diffusion models, moving from O(n²) to a more scalable O(n) inference path [25].
只要1分钟!电脑装满血龙虾,现在跟下载APP似的
量子位· 2026-03-10 02:13
Core Viewpoint - The article discusses the launch of a new application called AutoClaw by Zhipu, which simplifies the deployment of AI-driven tasks, making it accessible for users without technical expertise [5][29]. Group 1: Application Features - AutoClaw allows users to execute tasks with a simple prompt, such as summarizing the latest news related to OpenClaw from various platforms [2][4]. - The application can be installed and set up in just one minute, eliminating the need for complex configurations [5][29]. - It supports multiple models, including Pony-Alpha-2, which is specifically designed for OpenClaw tasks [7][33]. Group 2: User Experience - Users can easily integrate AutoClaw with communication tools like Feishu, allowing for automated task management and information retrieval [14][35]. - The application comes preloaded with over 50 skills, enabling users to automate various tasks without needing to learn how to use the software [8][35]. - AutoClaw can perform complex multi-step tasks and browser operations, enhancing its usability for everyday users [34][33]. Group 3: Market Implications - The launch of AutoClaw represents a significant shift in AI interaction paradigms, moving from complex setups to user-friendly applications [25][30]. - By lowering the barriers to entry for AI tools, Zhipu is positioning itself to capture a broader market of non-technical users [28][30]. - The application signifies a technological advancement that makes powerful AI tools accessible to the general public, potentially transforming how individuals and businesses operate [38].
首个物理AI数据基座平台“无垠”落户浙江,专治机器人数据荒,家庭工业商业场景全覆盖
量子位· 2026-03-09 10:05
一凡 发自 凹非寺 量子位 | 公众号 QbitAI 2026,什么最火爆? 具身智能和世界模型 ,今年合计已吸金超300亿元,前者是物理AI落地的产品,后者是物理AI的"训练场",它们共同组成了物理AI的一体两 面。 然而,物理AI始终是融入真实世界的AI,尽管世界模型代表的仿真路线,以较低成本为物理AI供应了海量数据,但其中的Sim2Real鸿沟,又 让行业长期头疼。如果转而依靠真实数据,成本又太高,很难上量。 在这种矛盾之下,行业开始转向虚实融合的方式,为物理AI供应大规模的数据。就在近日,这条路线上涌现出了 业界首个数据基座平台 。 具身智能的火,照亮数据的难 开年短短2个月,具身智能赛道融资 超20起 ,平均3天不到就有一笔热钱涌入,行业累计融资金额 已超200亿元 。 海量资本注入,推动行业技术进步,让机器人开始从舞台走向工厂,准备进入千家万户。 但在实际应用场景中,大量任务都面临很多非结构化的场景,这需要机器人模型有很强的泛化能力。而模型强大的泛化能力,又来自海量的高 质量数据。 首个物理AI数据基座平台,虚实融合打破数据瓶颈 无问智科近日在德清召开了一场群星闪耀的发布会。 地平线创始人、无问智 ...
LeCun团队新论文:模仿人类智能搞AI,照猫画虎死胡同
量子位· 2026-03-09 10:05
henry 发自 凹非寺 量子位 | 公众号 QbitAI AI圈追逐多年的通用人工智能(AGI),可能从一开始就走偏了。 图灵奖得主 Yann LeCun 在最新论文中提出,未来AI的发展方向不应该是模仿人类,而是另一条路线—— 超人类适应性智能(Superhuman Adaptable Intelligence, SAI) 。 在这个框架里,AI的发展目标发生了三个关键变化: 换句话说,SAI不再追求"像人一样聪明",而是关注一件更底层的事情: 系统适应新任务的速度 。 值得一提的是,LeCun在论文中还提出了一个颇为有趣的观点: 人类本身其实也并不"通用" 。 我们所谓的"通用能力",很大程度上只是生物进化的结果—— 人类在漫长的进化过程中,逐渐获得了一套 适者生存的能力组合 。 迈向超人类适应性智能 (SAI) 按照论文中的定义: 超人类适应性智能(Superhuman Adaptable Intelligence, SAI) 指的是一种系统: 能够通过快速适应,在人类能完成的任务上超越人类,同时也能解决大量人类从未涉足的任务领域。 不再以人类为参照系。 拥抱专业化,在具体领域实现超人类能力。 衡量智 ...
扩散模型终于学会「看题下菜碟」!根据提示词难度动态分配算力,简单题省时复杂题保画质
量子位· 2026-03-09 10:05
CoTj团队 投稿 量子位 | 公众号 QbitAI 扩散模型终于学会"看题下菜碟"了! △ 上图直观展示了传统System 1(固定调度)与CoTj System 2(优化规划)的推理机制对比,以及在图像和视频生成上的真实效果差异。 突破高维诅咒:引入"扩散DNA" 为什么以前的模型学不会"慢思考"?因为挡在研究人员面前的,是可怕的"状态维度灾难"。 中国联通数据科学与人工智能研究院联合高校提出的新框架 "轨迹链" (CoTj) ,彻底打破了这一僵局。它让扩散模型拥有了"系统2"的规划 能力,能根据提示词的复杂程度,动态分配计算资源。 更颠覆的是,在5步的极端压缩下,CoTj规划出的轨迹配上最朴素的1阶求解器,画质居然吊打了传统方法配高阶求解器——证明 "找对 路"比"用什么交通工具"更重要 。 目前,该研究的论文已在arXiv发布,推理代码也已开源。 一直以来,文生图模型都是"凭直觉"作画——不管提示词是"黑色的天空"还是"梵高风格的漩涡星空",都死板地用同一套固定步数采样。 结果就是:简单题算力过剩,复杂题细节崩坏。 △ 如图所示,低熵(简单)和高熵(复杂)的提示词在生成难度和误差曲线上存在显著差异,D ...
可微奖励就该直接微调!用HJB方程颠覆流匹配对齐|NeurIPS'25
量子位· 2026-03-09 06:05
VGG-Flow团队 投稿 量子位 | 公众号 QbitAI 用强化学习微调扩散模型,还有更好的办法吗? 来自 港中深 、 微软研究院 等机构的 VGG-Flow团队 给出了一个新思路:既然奖励函数本身是可微的,为什么非要绕弯路用PPO、 GRPO。 在大规模生成模型的对齐任务中,通常依赖强化学习,在某个奖励函数上微调模型以贴近人类偏好。而事实上,大部分奖励模型本身是在偏 好数据集上训练过的神经网络。既然奖励是可微的,能否直接利用"可微性"本身,高效而稳定地微调流匹配模型? 主流做法主要分为两类路径:一条路是把模型当作黑盒,通过像Flow-GRPO那样,把原本确定性的ODE采样过程强行转为随机SDE,适配 经典的强化学习框架来采用高方差的策略梯度方法 (如PPO、GRPO) 。 另一条路则更加直接,如ReFL等方法,通过近似手段优化某些取样步对应的奖励值,但这种做法在目标层面上缺乏严格的理论支撑,也往 往容易导致过拟合与模式坍塌。那么是否可以走一条新路线? VGG-Flow 团队 回归第一性原理,将奖励微调重新表述为一个 连续时间最优控制问题 。通过Hamilton–Jacobi–Bellman(HJB)方程 ...