Workflow
智元机器人真机强化学习落地工业产线 智元罗剑岚:真机强化学习核心突破在于学习闭环嵌入产线

智元机器人表示,真机强化学习方案在占用空间、硬件依赖与环境适配方面展现出高度通用性,可在不 同工位和产品线上快速迁移与复用。 机器人在十分钟内学会新技能,这一进步背后的技术突破如何?11月3日,智元机器人合伙人兼首席科 学家罗剑岚在接受证券时报等媒体采访时表示,机器人实现十分钟学会新技能,主要是通过预训练模 型,结合少量示范和纠错,快速点亮策略,并在工业给定范围内微调参数来达成的。 "在工业产线上,能把技术做到50%和做到100%,是完全不同的两件事,智元目前是首个真正将真机强 化学习应用在产线上的厂商,这一突破点主要在于性能,在于真正能将AI模型部署在工厂中,实现百 分之百的准确率。"罗剑岚指出。 据罗剑岚介绍,与传统的仿真强化学习相比,真机强化学习的核心突破在于直接将学习闭环嵌入产 线。"不需要解一个近似目标,而是直接优化最关心的指标,把通过率、节拍、良率这些变成训练时的 第一性目标,而不是像传统方法那样去解一个近似目标。真机强化学习使用的是产线原生信号进行判定 和奖励,这样就无需解决仿真与现实的差距问题,传统强化学习大多在仿真环境中进行,而我们直接在 真实产线中解决这个问题。" 近日,继10月9日宣布与 ...