近日,谷歌旗下的AI团队DeepMind推出了一个可以自我改进、自我提升的用于机器人的AI智能体,名为RoboCat。
RoboCat本质上是由AI赋能的软件程序,可以作为机器人的“大脑”,由其加持的机器人与传统机器人不同之处在于,RoboCat机器人更具“通用性”,并可实现自我改进、自我提升。
DeepMind称,RoboCat是全球第一个可以解决和适应多种任务的机器人AI智能体,并且它可以在各类真实的机器人产品上完成这些任务。
据DeepMind的介绍,只需要通过100次左右的演示,RoboCat就可以学会操控机械臂来完成各式各样的任务,然后通过自生成的数据来进行迭代改进。
要知道,构建通用机器人之所以进展缓慢,一个重要原因就是收集真实世界的训练数据需要时间,而RoboCat的快速学习能力减少了对人类监督训练的需求,可以说是朝着创建通用机器人迈出了重要一步。
从发布的视频中可以看到,RoboCat已经可以通过自主学习操控机械臂,完成“套圈”“搭积木”“抓水果”等任务,这些任务看似简单,但考验了机械臂操作的精准度、理解力以及对于形状匹配难题的解决能力。
最重要的是,不论是它操控的机械臂还是要完成的任务,RoboCat之前从来没见过,如今,RoboCat完成一项新任务的成功率已经从初期的36%提升至74%。
RoboCat 用到的关键技术之一,是一种多模态模型Gato,而Gato在西班牙语里意为“猫”(cat),这也是“RoboCat”这一命名的由来之一。
Gato模型可以在模拟环境和物理环境中处理语言、图像和动作,研究人员将Gato的架构与一个大型训练数据集进行了结合,这个数据集包含100-1000个各种机械臂完成任务的演示。
基于原始数据集和新训练产生的数据,RoboCat的数据集将包含数百万次的训练轨迹数据,它学习的新任务越多,它就能更好地学习和解决额外的新任务。
此前研究人员已经在机器人大规模学习多种任务方面进行了探索,并将对语言模型的理解与现实世界的机器人能力相结合,而RoboCat的进步性在于,它是第一个可以解决和适应多种任务的机器人 AI 智能体。
DeepMind的论文显示,执行任务成功率的大幅提升,是由于RoboCat的经验越来越丰富,就像人们在特定领域加深学习时发展出更多样化的技能一样,并且RoboCat完成现实世界训练任务的成功率要远高于传统基于视觉的模型方案,这也是 DeepMind 研究的重要价值所在。
RoboCat这种“通用性学习能力”对于加快机器人领域的研究有重要意义,DeepMind认为,RoboCat独立学习技能、快速自我提升的能力,以及对于不同硬件设备的快速适应能力,将对新一代通用机器人AI智能体的发展起到重要推动作用。