算力说
人工智能已经可以自动生成以假乱真的人像照片“忽悠”人类了。凭借“对抗神经网络”,人工智能从“学习”和“识别”进化到了“创造”。清华大学计算机系教授、博士生导师邓志东将此技术与深度卷积神经网络、AlphaGo并称为人工智能的三大发展。当然,基于大数据和大计算的人工智能也存在着“先天不足”,至少在理解和“举一反三”方面还有很长的路要走。
一个颇为无聊的国外网站最近火了。
这一名为“此人不存在”(ThisPersonDoesNotExist)的网站没有任何界面设计,输入网址后显示的只有一张人像大头照。新奇之处就在于,每次打开或刷新页面,显示的照片都不同,并且都不是真实存在的人物照片。
换言之,所有照片都是随机“生成”的,而其背后正是人工智能的支撑。可以看出,人工智能已经从“学习”和“识别”,开始进化到“想象”和“创造”。从网站上的照片来看,不仅实现了无限“生成”,而且还生成得不错——人物有男有女,有老有少,不同人种、不同角度、不同表情,甚至还有眼镜和佩饰,可谓以假乱真。
事实上,赋予人工智能想象力和创造力的,正是被《MIT科技评论》评为2018十大科技突破之一的“对抗神经网络”。
据《MIT科技评论》介绍,“对抗”是指两个神经网络使用同一个数据集进行训练。其中一个神经网络叫生成网络(the generator),它的任务就是依照所见过的图片来生成新的图片,而另外那个神经网络叫判别网络(the discriminator),它的任务则是判断它所见得图片是否与训练时的图片相似。
慢慢地,生成网络创造图片的能力会强到无法被判别网络识破的程度。经过训练的生成网络学会了识别并创造看起来十分真实的图片。这项技术已成为过去10年最具潜力的人工智能突破,帮助机器产生可以“忽悠”人类的成果。
生成式对抗网络“创造”出的人像(现实中不存在此人)具有十足“迷惑性”
更令人惊叹的是,这样的“生成”还不限于图像。清华大学计算机系教授、博士生导师邓志东近日在上海“张江·2019未来产业峰会”上提到:“两个卷积神经网络通过相互对抗,生成超分辨率真实感的原创图像、声音、3D物体或自然时序数据,这给AI带来一种类似于人类的想象力。”
AI的三大主义与三大发展
令人叹为观止的人像“创造”背后,必然是对海量原始照片的学习。
邓志东认为,生物智能的一个主要特征就是学习,而新一轮人工智能的鲜明特点就是学习能力。无论是生物智能还是人工智能,智能的主要特点就是感知能力、认知能力和行动能力。
追本溯源,智能的这三大特点源自连接主义、行为主义和符号主义。连接主义是生物智能的解剖学基础,即生物神经系统所包含的神经元、神经元的活性及其相互作用。在此之上,行为主义通过奖励/惩罚进行自主学习,强化学习也是人类和动植物行为学习的主要方式。最后,符号主义极大促进了人类的智力发育,尤其是语言的发明成为了人类智能远超其他生物智能的分水岭。
以“三大主义”为基础,人工智能在最近五六年取得了飞速发展。目前来看,在大数据和大计算的驱动下,深度学习已成为计算机视觉、语音识别与合成、自然语言处理和大数据分析等的主流方法。以深度卷积神经网络为基础的新一代人工智能确实带来了更接近于人类视听觉的感知能力。
因此,数据驱动的方法已被视为继实验科学、理论模型、模拟仿真之后的第四科学研究范式——数据驱动的科学范式,其如同网络技术,已逐渐变革为一种通用赋能工具。从“互联网+”到“人工智能+”,新一代人工智能已经远远超出了计算机科学技术的范畴。
大数据和大计算让人工智能迎来了大发展,邓志东总结了人工智能的三大进展。
首先是深度卷积神经网络令大数据感知智能取得突破性进展。人工智能已经能获得更加接近于人类水平的视听觉感知能力和对文本自然语言的模式分类能力,从而赋能产品、流程和服务体验,引发了技术变革和产业革命。