SIASUN-智元Act2Goal方案，让机器人用一张照片学会所有任务

在机器人领域，一个看似简单的任务往往需要复杂的指令和反复调试。但智元具身研究中心给出了一种颠覆性的答案：给机器人一张"目标照片"，它就能自己想办法把面前的场景变成照片里的样子。 Act2Goal则通过在动作生成之前引入目标条件世界模型，对从当前状态到目标状态的演化过程进行建模，并生成一系列中间视觉状态作为任务进程的结构化表征，为机器人动作提供明确操作锚点。 "我们相信，这种'先理解世界如何变化，再决定如何行动'的思路，将为更通用、更可靠的机器人系统提供重要支撑。"智元技术团队解释道。零样本泛化与自我进化能力 Act2Goal最令人惊叹的特性在于其"零样本泛化能力"和"自我进化"本能。系统能够在从未见过的环境和物体面前，展现出惊人的零样本泛化能力，无需人类手把手教（无奖励信号），就能在真实世界的交互中快速"复盘"自己的行为轨迹。智元于近日正式发布Act2Goal方案，这不仅是一个新的操作算法，更是一种让机器人"以终为始"的全新思维方式。与传统机器人机械地执行死板指令不同，Act2Goal引入了"目标条件世界模型"，使机器人不再只是"看一步走一步"，而是拥有了预见未来的能力——在真正动手之前，它 ...