AI+机器人,正在一步步走向现实。
前不久,Figure人形机器人演示了自主操作咖啡机,只需端对端学习10小时,机器人就可以准确操作咖啡机,无需任何远程遥控,并具备自动纠错的能力,可以识别没有放好的咖啡包,且自己将咖啡包摆放好。
作为世界上第二大的车企丰田不甘示弱,他们利用AI技术和机器学习系统,使机器人能够观察和学习人类在家务活动中的行为,并模仿人类做家务。这一项目不仅展示了生成式人工智能帮助机器人技术的进步,同时也为未来智能家居和老年人生活提供了新的解决方案。
从公开的实验视频上看,实验者以一个喜欢整理的人的角度,通过操控具有机械臂的遥控器,让机器人学会了如何使用簸箕和刷子扫掉桌面上的豆子,机器人自身的传感器让机器人可以感知抓取的固体物品觉和物品的重量。通过示教后,可独立自主完成这项家务活动。
在这个机械臂上,丰田采用了一种称为扩散策略的机器学习系统,这种系统类似于人工智能图像生成器中使用的系统,通过多种可能性和信息,迅速提出下一步正确的行动。
据了解,该技术是与哥伦比亚大学教授Shuran Song领导的研究人员合作开发的,为机器人提供了更高效的学习方式。
这类的机器学习系统的运用使得机器人能够更灵活地吸收数据,从而更好地适应复杂多变的物理世界和人类环境,相较于传统的预先编程例程,这种系统使机器人更适合处理需要适应性、即兴创作和灵活性的工作。
丰田正在尝试将机器学习系统与支持ChatGPT及其竞争对手的语言模型结合起来,通过结合语言模型,机器人可以通过观看视频学习执行任务,将在线资源如YouTube转变为强大的机器人培训资源,这样可以使机器人能够通过观看视频学会更多的任务,从而提高学习的效率。
这并不是第一台通过YouTube学习技能的机器人,英国一研究团队曾推出过一款类似的机器人厨师,团队为这款机器人厨师植入了全新的学习算法,该算法基于人类厨师的视觉观察,逐步将食谱添加到机器人的食谱中,通过计算这两者的向量化之间的相似性,实时学习并添加新菜谱。
随后的试验中,研究团队给机器人灌输了八种简单的沙拉食谱,并让它观看人类准备沙拉的视频,在观看这些视频后,机器人能够识别所使用的配方并进行复制。
机器人分析了视频的每一帧,识别出各种物体,如刀或演示人员的手,这种能力使它能够推断接下来会发生什么,例如,如果演示者拿着一把刀和一根胡萝卜,机器人就可以预测胡萝卜即将被切碎。在机器人观看了16个视频后,该算法正确识别已知食谱成功率达到93%。
值得一提的是,研发该机器人的团队,正是出自丰田2015年成立的剑桥机器人研究所。
现如今,在机器人研究中应用语言模型似乎已经成为了新的潮流,一些大型科技公司,如Google DeepMind,一直推动着类似的研究。Google DeepMind 的一个团队发布了Auto-R软件,该软件利用大型语言模型帮助机器人确定实际且安全地完成的任务,例如简单的分类物品,拿起水杯等。
乘上生成式人工智能的快车,机器人通过学习而帮助人类分担家务活动已一步步实现,这将会为我们的生活带来更多的便利,同时也促进了热度爆棚的人形机器人等服务机器人的商业化进程。未来也许真如马斯克所说,每个家庭里会有几个机器人为我们工作,这些更智能、更灵活的机器人或将成为我们生活的重要伙伴。