智元Act2Goal方案,让机器人用一张照片学会所有任务

在机器人领域,一个看似简单的任务往往需要复杂的指令和反复调试。但智元具身研究中心给出了一种 颠覆性的答案:给机器人一张"目标照片",它就能自己想办法把面前的场景变成照片里的样子。 Act2Goal则通过在动作生成之前引入目标条件世界模型,对从当前状态到目标状态的演化过程进行建 模,并生成一系列中间视觉状态作为任务进程的结构化表征,为机器人动作提供明确操作锚点。 "我们相信,这种'先理解世界如何变化,再决定如何行动'的思路,将为更通用、更可靠的机器人系统 提供重要支撑。"智元技术团队解释道。 零样本泛化与自我进化能力 Act2Goal最令人惊叹的特性在于其"零样本泛化能力"和"自我进化"本能。系统能够在从未见过的环境和 物体面前,展现出惊人的零样本泛化能力,无需人类手把手教(无奖励信号),就能在真实世界的交互 中快速"复盘"自己的行为轨迹。 智元于近日正式发布Act2Goal方案,这不仅是一个新的操作算法,更是一种让机器人"以终为始"的全新 思维方式。与传统机器人机械地执行死板指令不同,Act2Goal引入了"目标条件世界模型",使机器人不 再只是"看一步走一步",而是拥有了预见未来的能力——在真正动手之前,它 ...

SIASUN-智元Act2Goal方案,让机器人用一张照片学会所有任务 - Reportify