深度强化学习能为机器人注入“灵魂”

机器人拥有人一样的意识，一直是我们目前难以攻克的难题。在近日，加州大学伯克利分校的科学家和谷歌人工智能（AI）研究部门之一的Google Brain在Arxiv．org上发表的一份预印本论文中描述了一种人工智能系统，即通过深度强化学习来学习走路，简单来说，就是教“一个四足机器人来穿越熟悉和不熟悉的地形”。

目前，在此预印论文中表示，他们已经研究出了新型算法，并且根据算法演练，实现了机器人自己走路。这也就表明了人工智能系统可以让机器人学会人一样的用灵活的方式掌握和操纵自身或者周围的物体。

随着近几年来，机器人领域的发展和人工智能的崛起，深度学习与强化学习被用来处理控制系统面临的难题，尤其是在机器人的灵活操纵方面。

在现实生活中，人们很轻而易举的就将物体堆叠，或者用手工制作各式各样的工艺品，但是一直以来，机器人却一直无法跨越灵活性的鸿沟。

要知道的是，机器人灵活性一直以来就面临很多挑战：

首先，在机器人进行学习时，必须经过自身与环境之间的反复验证，来获取数据。

其次，机器人还得通过自身的观察来导出这些行为，这里面包含了很强的时间相关性。

最后，机器人很容易在环境发生转变之后，其习惯性的行动后果也不可预估。

我们不知道机器人会采取哪些行为，来描述不可预知的事情，所以，人们无法感知违背探索的事物也致使机器人灵活性受到局限。

预印论文中写道：深度强化学习可以用于自动获取一系列机器人任务的控制器，从而实现将感知输入映射到低级别动作的策略的端到端学习。其意思就是，假设机器人在现实世界中可以直接学习运动操纵，那么，每个机器人就能像人一样，获取最适合自己的单个的控制器，从而完成自身敏捷性、稳健性、能源效率上的突破。

深度强化学习可以通过算法来驱动机器人获取大量的数据样本，通过成千上万的模拟实验，来取得最好的结果。

早在2015年，就有科研人员在《自然》杂志上发表论文Human－level control through deep reinforcement learning，论文中提出的深度学习和强化学习相结合的思想模型，在Atari游戏平台的演示上，展示出了超越人类水平的表现。

可以预知的是，在未来几年间，深度强化学习能够被应用在不同的领域，例如在视频游戏上、在棋类游戏上、控制复杂的机械操作、调配网络资源、为数据中心大幅节能、对机器学习算法自动调参等等。

这种深度强化学习给机器人带来的发展，相信随着时间，也终将会给我们答案。

深度强化学习能为机器人注入“灵魂”

相关推荐