近日MIT研究人员开发了一套框架,可以让非技术背景的用户帮助机器人在新环境中快速进行技能调整和学习,这项技术有助于家用机器人克服在真实环境中可能出现的失败情况,实现顺畅协作。
该研发团队表示,现有家用机器人大多是在工厂进行预训练后出厂,但训练环境与用户家中实际情况存在差异,导致机器人工作时可能失败。以往的方法需要用户重新演示来训练机器人,但效率不高。
为解决这一问题,MIT团队设计了算法系统,在机器人失败时生成“反事实”解释,指出哪些元素需要改变才能成功完成任务,系统随后将这些解释展示给用户,并征询额外反馈意见。
举例来说,如果要机器人抓取桌上的印有标志的马克杯失败,系统会生成诸如“改变杯子颜色”等反事实解释,用户就可以指出杯子颜色对完成任务无关紧要。
借此,系统便可以获知哪些视觉要素对任务不重要,然后通过数据增强生成新数据重新训练机器人,从而实现对相似任务的快速泛化。
与要传统需要用户大量演示的方法相比,该方法训练样本需求更少,学习性更好。
MIT团队表示,该框架使普通用户也可以参与机器人的训练过程,促进家用机器人更好地适应实际生活环境。这项研究成果展现了机器人与人类协作性的新方向,有望加速机器人技术的普及应用。