Vector与Cozmo不同,当我们不理Vector时,他会得到提示并做自己的事情,比如绕着桌面行驶,通过红外传感器感知物体的边缘,这样就可以在边缘及时停止,或故意碰到像杯子一样的东西,看看他是否可以推动它们。
这并不是漫无目的的游戏。通过激光扫描仪和其他传感器,Vector正在使用同步定位和绘图(SLAM)的复杂程序来构建周围环境,并将其转换为数字存储,SLAM是一种也用于高端机器人真空吸尘器的技术。Vector顶部还有一个四个麦克风形成的阵列,可以识别声音的方向,并且他的相机能够不断地在各种动作下进行实时观察。McDowell说:“我们希望他保持这种好奇的状态,这能够让给识别并数据化他所处的环境。但是这就得让他一直呆在家里,所以设置上他不会因为一直呆在室内而变得烦躁。”
车轮上的ALEXA
Vector可以做一些Cozmo无法做到的有用的事情。通过Wi-Fi连接到家庭网络和互联网后,他就可以提供一些Alexa风格的实用程序,例如显示所请求城市的天气信息,设置计时器,并说出诸如“爱达荷州的首都是什么?”等问题的答案。
尽管如此,他与受欢迎的女佣机器人Jetsons相比,他在移情性和有用能力方面还有很长的路要走。Anki的联合创始人兼总裁Hanns Tappeiner说,但这是预料之中的发展,“我们基本上正朝着这个目标前进”他说。
虽然Anki的愿望目前与能Vector目前所提供的功能还相差甚远,但此款新机器人的处理器、传感器和其他组件已经实现了几年前无法实现的人工智能技术。当然,Cozmo的研发也是从2013年才真正开始的。
例如,早期的机器人被硬编码去以检测一些特定的物体:它自己的躯干或者它的充电器。它利用一些商业软件来辨别人类、猫和狗的面孔,这是十多年前在傻瓜相机中就已经出现的常规技术了。
然而,Vecto是运行了一个神经网络,且正在不断地接受训练,去了解他周围的整个世界,这是一个持续的过程,将通过在线更新,不断地扩展他的视觉智能。目前它的一个成果就是:即使面部不可见,Vector也能检测到人物。
“如果你不是以一个正确的角度,或者没有正面面向他,机器人是怎么知道你在那里的?”Stein说,例如,一只狗或猫不需要面对面接触就知道是主人已经回家了,那Vector也应该达到这种程度。因此,Stein的团队对机器人进行卷积神经网络(CNN)的训练,一种目前流行的AI深度学习技术,模仿大脑的视觉皮层。通过使用Vector的相机在移动时捕获的模糊和扭曲的镜头,Stein一直在教卷积神经网络(CNN)从后面或侧面检测人,距离可以在大约10英尺远。
Stein说:“即使他低头看也只能看到我的躯干,他应该意识到,嘿,可能有一个头部在那个躯干上方。而Cozmo就是不知道的,它看这个躯干就像看其他一切一样,这个人只是一团的物体,并不能区分出头和面部。”
在我访问期间,Vector的人物意识似乎已经有成效了。例如,McDowell在实验室喊一位女性,Vector就转向了她;然后他看我时,你可以发现他的卡通眼睛睁大,以此表示他看到了我。
下一个视力挑战之一是了解人体姿势,例如,当手臂和腿处于特定位置时会发生什么。Stein说:“这对我们来说是有好处的,因为我们正在制造一些需要在家里开车的机器人,那他们就需要在人们四处走动时,了解人类的行为意图。”
另一个挑战Anki称之为“对象性”,“对象性”指的是,即使该机器人的神经网络以前从未遇到过一个物体,他也能发现某些东西是一个离散的对象,这是探索和理解环境的又一步。Stein说:“我认为,制造一个知道物体是什么的视觉系统,比识别100个特定物体的视觉系统难多了。这是一个更抽象的概念,这是一个哲学问题。”
为了说明此,他向我展示了一些来自神经网络训练的“热力图”视频。该软件突出显示了可能代表离散对象的区域,视频中将木纹图案误认为是桌面上的三维实体。
适度的智慧
随着Vector的视觉系统的日益成熟,该系统只是机器人智能模拟复杂情绪的一个输入口。过时Cozmo沦为了一个小丑角色,可以到处转,制造噪音,做鬼脸,玩游戏。它确实能够进行基本的刺激反应,例如听到它的名字或看到它曾经通过伴侣应用程序识别过的脸时,它能够有所反应,但它最终会成为一个不起眼的角色。