Workflow
ICCV 2025 | HERMES:首个统一3D场景理解与生成的世界模型
具身智能之心·2025-08-16 16:03

编辑丨 机器之心 点击下方 卡片 ,关注" 具身智能之心 "公众号 >> 点击进入→ 具身 智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 本文第一作者周鑫、共同第一作者梁定康,均为华中科技大学博士生,导师为白翔教授。合作者包括华中科技大学涂思凡,旷视科技丁宜康,迈驰智行陈习武、 谭飞杨,香港大学赵恒爽助理教授。 在复杂的城市场景中,HERMES 不仅能准确预测未来三秒的车辆与环境动态(如红圈中标注的货车),还能对当前场景进行深度理解和问答(如准确识别出 "星 巴克" 并描述路况)。 论文标题:HERMES: A Unified Self-Driving World Model for Simultaneous 3D Scene Understanding and Generation 论文地址:https://arxiv.org/abs/2501.14729 研究背景与动机 近年来,自动驾驶技术取得了令人瞩目的进展。要让智能汽车安全高效地行驶在复杂的真实道路上,车辆必须具备两大核心能力: 对 当前环境 的深刻理解 (例 如 ...