· Fairseq机器翻译模型
基于CNN,FAIR推出了集速度、准确性和学习能力为一体的NMT神经机器翻译架构——Fairseq,其速度较谷歌的RNN提高了9倍。
而为了避免需要翻译大量的数据集(通常称为语料库),FAIR在去年发布了MUSE,通过监督和无监督式学习的方式,学习和翻译110种双语词典以及自我构建新的双语词典。
· bAbI
长期记忆能力不足是神经网络的缺陷之一,为此,FAIR开发了一个支持内存网络的机器学习模型,它能够参考此前的对话内容做记忆性回答。比如,在学习了《魔界》这部电影的剧情后,其就能概括出故事的最后戒指是出现在了Mount Doom中。
而为了让模型有足够的数据学习,FAIR还构建了一个问答任务数据集——bAbI,包含数千个对话示例,可以提高模型理解文本的准确性。
· Mask R-CNN
作为一个以图片分享为核心的社交平台,每天上传至Facebook上的图片数据量是极为庞大的。而为了在合适的时间为用户展示合适的图片,FAIR通过理解图片中的不同部分的像素,以理解图片的特殊含义,比如分析人手部动作的具体含义,实现图像实例分割。
目前,Mask R-CNN已被应用于检测劣质内容等场景中。未来,Facebook还将会应用它为AR、智能相机等业务赋能。
5年坚持下的“焕新”
可以看到,5年时间,Facebook在AI,尤其是深度学习基础技术研发上已初具规模。当然,任何高端技术在走出实验室之前,都无法创造实际价值。为此,在FAIR技术成果转化过程中,Facebook还成立了其第二大人工智能实验室AML,旨在研究AI技术的具体应用。
一般而言,如这样分成两个部门应该存在着很大的沟通交流问题,不过很显然,Facebook在这方面做的很好。所有来自FAIR的预测推理、视觉、语义理解技术都被广泛应用到Facebook的各个产品中,如其图片滤镜已可以跟Snapchat媲美,不同用户主页News Feed上呈现的内容是由机器图像分析后决定的以及清除垃圾数据、内容及邮件翻译、智能摄像监控、简化版数字助理“M”等,都是AI赋能的结果。
而在Facebook近年大力发展的VR/AR业务方面,上述中多项技术都有所应用。甚至还有消息称,Facebook内部已经在紧锣密鼓的研发语音助理,代号为 “Aloha”。
可以说,AI已经成为了互联网社交外,Facebook最核心的部分。从2014年开始,即便在今年遭遇重大数据泄露问题的情况下,F8大会再未出现停办的情况,也或多或少都有较为亮眼的新产品或技术推出。Facebook也终于在2016年发布的“十年版图”中,将AI、VR等技术放在了战略核心的位置上。
就连那位此前一直反对成立人工智能实验室的Mike Schroepfer也终于承认,“AI是Facebook未来三大重点发展领域之一,其余两个是虚拟现实和让更多的人连上网络。”
成果来之不易,坚持更是难上加难。虽然较之于谷歌、微软这样在底层技术方面素来领先的公司而言,Facebook目前还未能有突破性领先成果,但5年时间里,FAIR的多项成果及相关应用也足以说明,Facebook正在试图,或者说期待凭借AI再创其在互联网时代的社交传奇。
就连LeCun都说,“在FAIR创办之前,Facebook做的都是一些短期的工程项目,最长的项目周期也不过6个月。”由此可以期待,下一个5年,FAIR或许能给我们带来更多的惊喜。