通用机器人不再遥远，谷歌展示全球首个多任务AI智能体

近日，谷歌旗下的AI团队DeepMind推出了一个可以自我改进、自我提升的用于机器人的AI智能体，名为RoboCat。

RoboCat本质上是由AI赋能的软件程序，可以作为机器人的“大脑”，由其加持的机器人与传统机器人不同之处在于，RoboCat机器人更具“通用性”，并可实现自我改进、自我提升。

DeepMind称，RoboCat是全球第一个可以解决和适应多种任务的机器人AI智能体，并且它可以在各类真实的机器人产品上完成这些任务。

据DeepMind的介绍，只需要通过100次左右的演示，RoboCat就可以学会操控机械臂来完成各式各样的任务，然后通过自生成的数据来进行迭代改进。

要知道，构建通用机器人之所以进展缓慢，一个重要原因就是收集真实世界的训练数据需要时间，而RoboCat的快速学习能力减少了对人类监督训练的需求，可以说是朝着创建通用机器人迈出了重要一步。

从发布的视频中可以看到，RoboCat已经可以通过自主学习操控机械臂，完成“套圈”“搭积木”“抓水果”等任务，这些任务看似简单，但考验了机械臂操作的精准度、理解力以及对于形状匹配难题的解决能力。

最重要的是，不论是它操控的机械臂还是要完成的任务，RoboCat之前从来没见过，如今，RoboCat完成一项新任务的成功率已经从初期的36%提升至74%。

RoboCat 用到的关键技术之一，是一种多模态模型Gato，而Gato在西班牙语里意为“猫”（cat），这也是“RoboCat”这一命名的由来之一。

Gato模型可以在模拟环境和物理环境中处理语言、图像和动作，研究人员将Gato的架构与一个大型训练数据集进行了结合，这个数据集包含100-1000个各种机械臂完成任务的演示。

基于原始数据集和新训练产生的数据，RoboCat的数据集将包含数百万次的训练轨迹数据，它学习的新任务越多，它就能更好地学习和解决额外的新任务。

此前研究人员已经在机器人大规模学习多种任务方面进行了探索，并将对语言模型的理解与现实世界的机器人能力相结合，而RoboCat的进步性在于，它是第一个可以解决和适应多种任务的机器人 AI 智能体。

DeepMind的论文显示，执行任务成功率的大幅提升，是由于RoboCat的经验越来越丰富，就像人们在特定领域加深学习时发展出更多样化的技能一样，并且RoboCat完成现实世界训练任务的成功率要远高于传统基于视觉的模型方案，这也是 DeepMind 研究的重要价值所在。

RoboCat这种“通用性学习能力”对于加快机器人领域的研究有重要意义，DeepMind认为，RoboCat独立学习技能、快速自我提升的能力，以及对于不同硬件设备的快速适应能力，将对新一代通用机器人AI智能体的发展起到重要推动作用。

相关推荐