机器之心
Search documents
AAAI 2026杰出论文奖 | ReconVLA:具身智能研究首次获得AI顶级会议最佳论文奖
机器之心· 2026-01-26 03:08
在长期以来的 AI 研究版图中,具身智能虽然在机器人操作、自动化系统与现实应用中至关重要,却常被视 为「系统工程驱动」的研究方向,鲜少被认为能够在 AI 核心建模范式上产生决定性影响。 近年来,Vision-Language-Action(VLA)模型在多任务学习与长时序操作中取得了显著进展。然而,我们 在大量实验中发现,一个基础但被长期忽视的问题严重制约了其性能上限: 视觉注意力难以稳定、精准地 聚焦于任务相关目标。 以指令「将蓝色积木放到粉色积木上」为例,模型需要在复杂背景中持续锁定「蓝色积木」和「粉色积 木」。但现实中,许多 VLA 模型的视觉注意力呈现为近似均匀分布,不同于人类行为专注于目标物体, VLA 模型容易被 无关物体或背景干扰 ,从而导致抓取或放置失败。 而 ReconVLA 获得 AAAI Outstanding Paper Awards,释放了一个清晰而重要的信号: 让智能体在真实世界 中「看、想、做」的能力,已经成为人工智能研究的核心问题之一 。 这是具身智能(Embodied Intelligence / Vision-Language-Action)方向历史上, 首次获得 AI 顶 ...
这届网友太狠了:Clawdbot爆火,狂囤40台Mac mini来跑
机器之心· 2026-01-26 03:08
整个周末,大家都被一个名为 Clawdbot 的 AI 助手刷屏了。 被它顺带带火的,还有 Mac mini。谁也没想到,这个长期在书桌角落吃灰的小主机,会因为一个开源 AI 项目重新翻红,摇身一变成了社交平台的流量担当。 有人为此专门下单一台 Mac mini,只为让 Clawdbot 24 小时在线运行;也有人翻箱倒柜,把那台曾经被当作垫杯子的旧 Mac mini 请回桌面,重新通电: https://x.com/BahaGkc/status/2015007581404570071 相比只买一台 Mac mini 体验一下,更有狠人直接一步到位,一口气买了 40 台 Mac mini,全部用来运行 Clawdbot,并统一绑定 Claude Max 订阅。用他自己的话来 说,这不是冲动消费,而是一场对未来的押注: 你必须投资自己,才能成功。这是我的选择。现在是 2026 年,不要被甩在时代后面。 机器之心编辑部 也有人选择在闲置的树莓派上运行 Clawdbot。由于这款应用可以访问整台电脑上的软件和系统资源,因此更稳妥的做法并不是把它直接跑在自己的主力工作电脑 上,而是部署在一台独立设备上,或者至少进行隔 ...
谷歌、Anthropic双重围剿下的OpenAI,正面临「生死抉择」
机器之心· 2026-01-25 08:08
机器之心编辑部 进入到 2026 年,OpenAI 在关注消费级产品(如 ChatGPT、社交应用)之外,开始将一部分重心转向企业级市场。 上周五,我们报道了 OpenAI 正在考虑转变商业模式,不满足于只收软件使用费,还想在客户发财时抽成。详细内容请参考《 OpenAI:以后大家用 AI 赚的钱,我 可能要抽成 》 今日,据外媒 The Information 最新报道,OpenAI 传递出了清晰的战略转型信号,表明其正全方位发力企业端业务,力求为商业客户提供深度支持。 事情是怎样的呢?我们接着往下看。 OpenAI 战略重心转移,进一步押注企业市场 过去的 2025 年,OpenAI 最引人注目的动作大多集中在消费级产品上,包括 GPT‑5 系列模型、Sora 2、ChatGPT Atlas 浏览器等。今年晚些时候,OpenAI 预计还将 发布一款由前苹果设计总监 Jony Ive 参与设计的 AI 硬件设备,据悉可能是可穿戴设备。 不过就在上周,OpenAI CEO 奥特曼在旧金山召集了一场由迪士尼 CEO 鲍勃・艾格及其他企业高管参与的聚会,传达出了进一步服务企业用户的意向。 据一位知情人士透露,奥特 ...
没博士没论文,这些人靠什么「野路子」杀进OpenAI等顶级AI大厂?
机器之心· 2026-01-25 04:01
最近,OpenAI 资深研究科学家 Noam Brown 在 X 上分享了几个真实故事,证明了通过个人努力和巧妙策略,即使没有传统学术履历,也能获得机会。 编辑|杨文 许多人梦想进入像 OpenAI 这样的前沿实验室从事研究工作,然而对于那些缺乏传统学术背景,比如没有发表过论文或知名导师推荐的人来说,这条路似乎格外艰 难。 Keller Jordan:从改进他人论文开始 Keller Jordan 从加州大学圣地亚哥分校毕业时,简历上没有任何论文发表记录。当时他在一家做 AI 内容审核的初创公司工作。 按照常规路径,想进入 OpenAI 这样的顶尖实验室,至少需要名校博士学位,外加几篇顶会论文,最好还有业内知名学者的推荐,而 Keller 什么都没有。 但他做了一件关键的事,主动联系了当时在谷歌工作的研究员 Behnam Neyshabur,向对方展示了一个改进其最新论文的想法。这次「冷接触」获得了积极回应。 Behnam 同意指导他,最终合作完成了一篇 ICLR 论文。 Noam Brown 在帖子中强调,如今 AI 研究越来越封闭,公开项目越来越少,但「改进他人已发表的工作」仍是展示个人能力的绝佳方式。这 ...
17岁高中生用AI解决数学界难题,陶哲轩、Jeff Dean点赞
机器之心· 2026-01-25 04:01
编辑|杨文 你的童年我的童年好像不一样。 我的 17 岁,是坐在教室里苦哈哈地刷数学卷子;而这个名叫 Enrique Barschkis 的高中生,利用课间休息时间,成功解决了困扰数学家多年的埃尔德什第 347 号问 题。 这一成就不仅在社交平台 X 上引发热议,更得到了谷歌首席科学家 Jeff Dean 的盛赞。 什么是埃尔德什第 347 号问题? 埃尔德什第 347 号问题,最初由埃尔德什和格雷厄姆在 1980 年提出,核心问题是:是否存在一个整数序列,其中相邻项的比值趋近于 2,并且对于该序列的任何 余有限子序列,其有限子集和构成的集合在自然数中的密度都是 1? 这个问题触及了数论中完全序列理论的核心,其难度在于需要在严格的增长率限制下,保证几乎所有足够大的正整数都能表示为序列中某些项的和。 去年 10 月,著名数学家、菲尔兹奖得主陶哲轩在 Erdős 问题网站的讨论区里,用 ChatGPT 搜索相关文献,找到了一篇 Burr 和 Erdős 的旧论文。 然而数学家沃特很快发现,那篇论文中的结果使用的是相邻两项的比值条件,与本问题要求的相邻项比值条件略有不同。 陶哲轩提出了一个巧妙的构造思路:将序列分成 ...
国内首篇!融合语言模型的多模态触觉传感器,推动机器人触觉迈向人类水平
机器之心· 2026-01-25 04:01
论文第一作者为清华大学博士、南洋理工大学博士后李寿杰,清华大学博士生吴同和人工智能硕士生徐建乐。论文通讯作者包括清华大学深圳国际研究生院 副教授丁文伯,大连理工大学教授解兆谦,新加坡国立大学助理教授吴昌盛和香港城市大学教授于欣格。 随着机器人技术从「预设程序执行」向「具身智能交互」跨越,触觉感知作为理解物体属性、实现精细操作的核心感测方式,其重要性日益凸显,但当前系 统在感知维度、分辨率及信号解读能力上仍远逊于人类,导致机器人往往处于「有感无知」的状态。 在此背景下, 清华大学深圳国际研究生院丁文伯团队 联合无界智航(Xspark AI)及多所国内外科研机构,从鸽子卓越的多光谱视觉和非成像感知机制中获得灵 感,研发出了一种仿生多模态触觉传感器 SuperTac 。 该系统将多光谱成像、摩擦电感测与惯性测量融为一体,并通过构建 8.5B 参数的触觉语言模型 DOVE ,实现了触觉信号从底层感知到高层语义推理的突 破。 相关成果作为封面文章发表于 《Nature Sensors》 第一期,也是国内以第一单位在该期刊发表的首篇,标志着机器人触觉感知向「人类水平」迈出了关键 一步。 论文标题:Biomimetic m ...
谷歌用一堆不赚钱的AI小玩意,给科技圈上了一课
机器之心· 2026-01-25 02:35
编辑|杨文 《庄子・人间世》中有这样一则小故事: 南伯子綦在商地的山丘游玩时,见到一棵异常高大的树,树冠能遮蔽上千辆马车。他本以为此树必有奇特用处,却发现它的细枝弯曲不能做栋梁、树根开裂不能 做棺椁、树叶舔之烂嘴、气味嗅之让人癫狂三日。 子綦由此发出感慨:此果不材之木也,以至于此其大也。翻译过来就是,这棵树正因 「毫无用处」,才不会被砍伐,得以长成这般参天巨木。 而当我在谷歌 Arts & Culture 网站闲逛时,发现这家科技巨头深得庄子「 无用之用,方为大用 」的精髓。 链接: https://artsandculture.google.com/ 谷歌的这些艺术实验项目,若从商业角度看,实在说不上有什么直接价值。 既不能像搜索引擎那样为公司带来广告收入,也不像云服务那般能创造现金流,甚至连用户停留时间恐怕也难以企及主流产品的零头。 但 正是这些看似没啥用的项目,却藏着谷歌最真诚的人文坚守 。 今天再次进入这个网站,又发现了不少有意思的新东西。 比如 2025 年新推出的 Botanic Atlas 项目,这是个交互式的世界植物地图,收录了超过 3 万种植物的标本,我们可以在地图上看到它们分布在哪儿,还能 ...
拒绝Reward Hacking!港科联合快手可灵提出高效强化学习后训练扩散模型新范式
机器之心· 2026-01-25 02:35
在使用强化学习(RL)微调扩散模型(如 Stable Diffusion, Flux)以对齐人类偏好时,我们常面临一个棘手的 "两难困境":追求高奖励会导致图像质量崩坏(即 Reward Hacking),而为了防止崩坏引入的 KL 正则化又会严重阻碍模型的探索和收敛。 最近,来自于 香港科技大学, 快手可灵 AI,港 中 文以及爱丁堡大学的研究团队 提出了一种 全新的框架 GARDO 。它通过门控自适应正则化和多样性感知优 化,成功在防止 Reward Hacking 的同时,实现了高效的样本探索和多样性生成。研究工作已经全面开源。 论文第一作者何浩然是香港科技大学博士生,研究方向包括强化学习和多模态基础模型等,研究目标是开发下一代可扩展强化学习后训练算法。通讯作者为香港 科技大学电子及计算机工程系、计算机科学与工程系助理教授潘玲。 背景 与动机: RL 后训练中的陷阱 强化学习(RL)在视觉领域的后训练中展现出了不错的效果,逐渐成为当前研究的热点。最近半年,如 flow-grpo,dancegrpo 以及 DiffusionNFT 等工作受到了大 家广泛关注。 然而,在视觉任务中,定义一个完美的 "奖励函 ...
不止于Prompt:揭秘「神经网络可重编程性」
机器之心· 2026-01-24 04:09
从模型重编程(Model Reprogramming),到参数高效微调(PEFT),再到当下大模型时代的 Prompt Tuning ,Prompt Instruction 和 In-context Learning,研究者和 从业人员不断地探索一个核心问题: 在尽量不改动模型参数的前提下,如何最大化地复用预训练模型的能力 ? 过去几年,这类方法在不同社区中以各自独立的形式快速发展 —— 有的来自对抗鲁棒性与迁移学习,有的服务于下游任务适配,有的则成为大模型对齐与应用的 基础工具。然而,这些看似分散的技术路线,背后是否存在一个更统一、更本质的理论视角? 近期,来自墨尔本大学可信赖机器学习与推理(TMLR)研究小组和 IBM AI 研究所的研究者系统性地提出了「 神经网络可重编程性(Neural Network Reprogrammability) 」这一统一主题,在最近的一篇 survey 中,将模型重编程,Prompt Tuning、Prompt Instruction 和 In-context Learning 纳入同一分析框架,从 操纵位置、操纵类型、操纵算子和输出对齐四个维度进行了系统梳理与对比。同时 ...
估值35亿美元,LeCun创业公司官宣核心方向,掀起对Next-token范式的「叛变」
机器之心· 2026-01-24 04:09
机器之心编辑部 自从图灵奖得主 Yann LeCun 离开 Meta 创立 AMI Labs(Advanced Machine Intelligence) 以来,这家新公司便引发了业界的高度关注。本周,他们终于确认了核心 方向: 开发所谓的「世界模型(world models)」,以此构建能够理解现实世界的智能系统。 官网地址: https://amilabs.xyz/ 一直以来,LeCun 都对现有大语言模型的发展持怀疑态度,认为仅靠预测下一个 token 的生成式模型无法真正做到理解现实世界。他提出了 世界模型这一不同路 径, 一种能够准确反映现实动态的新型人工智能架构。这类全新的智能系统,应同时具备四项关键能力: 这一愿景背后,直指当前大模型路线的一个核心局限。 理解真实世界; 拥有持久记忆; 能够进行推理与规划; 可控且安全。 值得一提的是,在业界另一条技术路线中,LeCun 也开始发挥更广泛的影响力。近日,硅谷初创公司 Logical Intelligence 任命 Yann LeCun 为其技术研究委员会创 始主席。 现实世界的数据主要来自摄像头与各类传感器,其特征是连续、高维且充满噪声。过去几年 ...