和谷歌抢人挖微软墙角 Facebook AI实验室5年逆袭之路

· Fairseq机器翻译模型

基于CNN，FAIR推出了集速度、准确性和学习能力为一体的NMT神经机器翻译架构——Fairseq，其速度较谷歌的RNN提高了9倍。

而为了避免需要翻译大量的数据集（通常称为语料库），FAIR在去年发布了MUSE，通过监督和无监督式学习的方式，学习和翻译110种双语词典以及自我构建新的双语词典。

· bAbI

长期记忆能力不足是神经网络的缺陷之一，为此，FAIR开发了一个支持内存网络的机器学习模型，它能够参考此前的对话内容做记忆性回答。比如，在学习了《魔界》这部电影的剧情后，其就能概括出故事的最后戒指是出现在了Mount Doom中。

而为了让模型有足够的数据学习，FAIR还构建了一个问答任务数据集——bAbI，包含数千个对话示例，可以提高模型理解文本的准确性。

· Mask R-CNN

作为一个以图片分享为核心的社交平台，每天上传至Facebook上的图片数据量是极为庞大的。而为了在合适的时间为用户展示合适的图片，FAIR通过理解图片中的不同部分的像素，以理解图片的特殊含义，比如分析人手部动作的具体含义，实现图像实例分割。

目前，Mask R-CNN已被应用于检测劣质内容等场景中。未来，Facebook还将会应用它为AR、智能相机等业务赋能。

5年坚持下的“焕新”

可以看到，5年时间，Facebook在AI，尤其是深度学习基础技术研发上已初具规模。当然，任何高端技术在走出实验室之前，都无法创造实际价值。为此，在FAIR技术成果转化过程中，Facebook还成立了其第二大人工智能实验室AML，旨在研究AI技术的具体应用。

一般而言，如这样分成两个部门应该存在着很大的沟通交流问题，不过很显然，Facebook在这方面做的很好。所有来自FAIR的预测推理、视觉、语义理解技术都被广泛应用到Facebook的各个产品中，如其图片滤镜已可以跟Snapchat媲美，不同用户主页News Feed上呈现的内容是由机器图像分析后决定的以及清除垃圾数据、内容及邮件翻译、智能摄像监控、简化版数字助理“M”等，都是AI赋能的结果。

而在Facebook近年大力发展的VR/AR业务方面，上述中多项技术都有所应用。甚至还有消息称，Facebook内部已经在紧锣密鼓的研发语音助理，代号为 “Aloha”。

可以说，AI已经成为了互联网社交外，Facebook最核心的部分。从2014年开始，即便在今年遭遇重大数据泄露问题的情况下，F8大会再未出现停办的情况，也或多或少都有较为亮眼的新产品或技术推出。Facebook也终于在2016年发布的“十年版图”中，将AI、VR等技术放在了战略核心的位置上。

就连那位此前一直反对成立人工智能实验室的Mike Schroepfer也终于承认，“AI是Facebook未来三大重点发展领域之一，其余两个是虚拟现实和让更多的人连上网络。”

成果来之不易，坚持更是难上加难。虽然较之于谷歌、微软这样在底层技术方面素来领先的公司而言，Facebook目前还未能有突破性领先成果，但5年时间里，FAIR的多项成果及相关应用也足以说明，Facebook正在试图，或者说期待凭借AI再创其在互联网时代的社交传奇。

就连LeCun都说，“在FAIR创办之前，Facebook做的都是一些短期的工程项目，最长的项目周期也不过6个月。”由此可以期待，下一个5年，FAIR或许能给我们带来更多的惊喜。

和谷歌抢人挖微软墙角 Facebook AI实验室5年逆袭之路

相关推荐