预约贾鹏GTC2026讲面向灵巧操作的高效强化学习框架直播
理想TOP2·2026-03-09 14:27
做具身智能的至简动力半年不到时间完成5轮融资,累计融资额达20亿人民币。 至简动力 CEO: 前理想智能驾驶技术研发负责人贾鹏。 董事长: 前理想CTO王凯 COO: 前理想智驾量产负责人王佳佳。 2026年1月李想对内说 今天看机器人遇到的很多难题,非常像2025年2月7日Manus/Genspark讲通用 Agent的难度,机器人迭代速度会比软件稍慢一些,但进展幅度和变化程度会比所有人想象的快。 当前的具身基础模型,仍然难以在真实世界任务中同时满足接近 100% 的成功率与严格的执行周期的 要求。 强化学习被认为是弥合这一差距的关键技术路径,然而在灵巧操作场景中,强化学习仍面临奖励稀 疏、样本效率低以及真实世界试错成本高等核心挑战。 我们提出一个高效强化学习框架,它建立在一个大一统的具身基础模型之上,不仅实现了视觉和语言 的理解,在同一架构中同时也建模图像生成、动作生成以及价值生成。 这样的一个统一模型范式带来了多重好处,它结合了VLA和世界模型的能力,通过语言、2D视觉、 3D结构以及本体状态的时间空间思维链大幅提升了模型跨时间、跨模态的联合推理,从而整体提升 了策略的泛化能力。 同时也为强化学习提供了 ...