加州大学伯克利分校的研究人员已经开发出使机器人通过试错来学习运动任务的算法。通过试错这一过程使机器人学习更加接近人类学习的方式,是人工智能领域的一个重要里程碑。他们通过一个机器人强化类型的学习来展示这种深度学习算法,让机器人完成各种任务——把衣服放在架子上、组装一个玩具飞机、把水瓶的盖子拧紧等等——对其周围细节没有任何预定程序。
“我们在这里展示的是赋予机器人学习能力的新方法,”加州大学伯克利分校电气工程和计算机科学系教授Pieter Abbeel 说。“关键的是,当一个机器人面对新事物的时候,我们不需要重新编程。完全相同的软件编码会告诉机器人如何学习,让机器人学习我们给它的所有不同任务。”
最新的发展在周四(5月28日)的西雅图机器人与自动化国际会议上(ICRA)呈现了。Abbeel与伯克利视觉学习中心的主任特雷弗·达雷尔一起领导该项目,。研究团队的其他成员包括谢尔盖?莱文博士后研究员和切尔西芬恩博士生。该项工作是加州大学信息技术研究中心关于机器人主动技术研究的一部分。多方面,跨学科研究的初衷是想保持令人眼花缭乱的人工智能的发展,让机器人与自动化能满足人类的需求。
“大多数机器人应用程序是在受环境约束的,处理的对象物体是处于预先设置的地方,“达雷尔说。“让机器人进入现实环境(例如家庭或办公室)的挑战是这些环境是不断变化的,机器人必须能够感知并适应环境。”
神经的灵感
通过给机器人提前编程设计处理大量可能出现的场景的方法或创造机器人动作的模拟环境是传统的,但不切实际的方法。相反,加州大学伯克利分校的研究人员转向人工智能的一个新分支——深度学习,这个灵感来自于人类大脑与世界感知和交互神经回路。
“我们的多才多艺并不是人类与生俱来的行为,可以像瑞士军刀一样的展开。而且我们不需要编程,”莱文说。“相反,我们通过生活经验和其他人的言语行为学习新技能。这个学习的过程如此深深植根于我们的神经系统,我们甚至不需要确切地知道另一个人的技能应该如何去执行。所以我们很希望机器人能在指示和指导下自己去学习。”
在人工智能的世界,深度学习程序创建“神经网络”,在这个网络中人工神经元处理层重叠的感知数据,无论是声波或图像像素。这有助于机器人在它接受的数据中识别数据的模式和类别。人们iphone中使用的Siri,谷歌的语音文本程序以及Google街景可能已经受益于深度学习的重大进展所提供的语音和视觉识别能力。