和谷歌抢人挖微软墙角 Facebook AI实验室5年逆袭之路

镁客网 中字

坚持5年能得到什么?

马云说,“对于一家创业公司而言,能坚持做5年,就一定是‘牛’的。”

同理,对于一家传统互联网公司而言,能坚持5年用新技术为原有业务改头换面,更牛。

而从2013年12月10日对外正式宣布成立AI实验室FAIR至今,Facebook真真正正做AI正好5年时间了。这家在科技创新上素来以“落后、跟随”之姿发展的公司,如今也正在期待着凭借AI再创互联网社交传奇。

传统社交数据的爆发式增长

“没有深度学习,现在的Facebook就无法正常运营,因为它已经深入到Facebook的方方面面了。”FAIR创办者&首席AI科学家、卷积神经网络发明者之一的Yann LeCun在总结Facebook这5年发展时说道,“但实际上,在2013年之前,Facebook高层并不赞同成立这个实验室。”

众所周知,Facebook以传统社交互联网起家。而因初初创立时,扎克伯格还是哈佛大学的一名学生,所以这个社交平台一开始也只在哈佛大学的学生中被广泛熟知。

得益于互联网的快速发展,以及社交这一“有点就可扩散至面”的特性,Facebook很快便成为了美国高校学生日常社交的常用工具。

随着用户范围的扩大、开辟广告业务以及接入第三方服务,到2009年年初,Facebook的用户数就已超1.5亿,用当时扎克伯格的话说,“如果Facebook是一个国家,那么它将是世界上人口第八多的国家,比日本、俄罗斯和尼日利亚等国都多。”

但1.5亿的用户量和主要以图片为信息承载的社交模式,显然还不足以让扎克伯格为数据优化及处理忧心,而素来“后知后觉”的公司高层最关心也依旧是产品线的拓展。直到2013年的一次宴会,这一现状才有所改变。

其实,Facebook并不是不重视技术的发展,只是真的很“后知后觉”。这点,从历年来的F8大会就可以窥见一二。

2007年,Facebook召开了第一届F8大会,推出了面向开发者的社交图谱。次年,又推出了社交工具Facebook Connect。但实际上,这些只是基于Facebook现有业务所做的调整,而非技术创新性突破。

也因此,2009年的F8大会因没有新进展而停办。

此后两年时间里,虽然其做了多番调整,相继推出了新社交插件、Timeline、开放式图谱协议、图谱API等。但依旧可以看出,这些技术及产品不具备创新改革的能力。

为此,2013年的F8大会再次停办了,这对才上市不久的Facebook,是个不小的打击。

相关数据统计,到2013年年初,Facebook全球日活跃用户数已然超过了6.5亿。加之第三方服务、广告业务、视频直播、Instagram等产品线的发展,以及各产品间数据共享需求的增加,传统互联网技术俨然开始无法继续支撑下去了。

而此时,诸如谷歌、微软、苹果等同类互联网公司,早已开始向科技公司转型,如谷歌早在2010年就成立了谷歌X实验室,更是在2011年成立了谷歌大脑。而苹果更是在2011年就推出了智能语音助理Siri,将机器语音学习从实验室带到了大众的生活中。

此时的Facebook,显然已经落后了。

“Facebook CTO Mike Schroepfer此前一直不同意成立AI实验室,但事实显示,AI对于Facebook未来发展越来越重要。”LeCun回忆说,“在去扎克伯格家赴宴时,我和他详谈了AI的重要性。幸运的是,扎克伯格当时也认为‘开放创新’应该成为Facebook发展的重点。”

“之后没多久,FAIR就成立了。”

追赶深度学习

从成立之初,FAIR的定位便是一个负责研究技术的部门,其研究重点也大多聚焦在解决推理、预测、规划、无监督学习等底层技术问题上。

当然,技术研发离不开人才,但Facebook于AI方面的积累几乎为0。所幸,扎克伯格肯投入,除LeCun外,5年时间里,FAIR还相继吸引来了包括VC维和SVM的缔造者Vladimir Vapnik,提出随机梯度下降法的Léon Bottou,做出高性能PHP虚拟机HHVM的Keith Adams、ICCV 2017最佳论文得主何凯明等在内的多位深度学习顶级专家,甚至还用7位数年薪与Deepmind展开了抢人大战以及大力挖角微软。截止到目前,FAIR的团队规模就已扩大至了近200人。

如此大的人才投入下去,成果自然也不会少。

· Caffe2

沿袭Caffe的大量设计,2017年4月FAIR推出了兼具扩展性、高性能和便携性的Caffe2,一个轻量化和模块化的深度学习框架,可在移动设备上进行训练和预测。

· PyTorch

2017 年初,FAIR发布了基于Python开发的PyTorch。因其集成了Caffe2和ONNX 的模块化、面向生产的功能,提供从研究原型到生产部署的无缝路径,并与云服务和技术提供商进行深度集成,在GPU速度和内存使用率方面都极具优势。

今年10 月,Facebook还举办了第一届 PyTorch开发者大会,来自加州理工学院、FAIR、fast.ai、谷歌、微软、英伟达、特斯拉等多位行业顶级专家均有参与。

· FastText

为了加快机器文本分类和学习速度,2016 年FAIR推出FastText,可对数十亿个单词量文本进行快速分类。截止到目前,FastText已经可以对157 种语言的文本进行分类,也被应用于诸如“消息回复建议”等的场景中。除此之外,FastText还和DeepText相结合,进行自然语言理解和翻译。

声明: 本文系OFweek根据授权转载自其它媒体或授权刊载,目的在于信息传递,并不代表本站赞同其观点和对其真实性负责,如有新闻稿件和图片作品的内容、版权以及其它问题的,请联系我们。
侵权投诉

下载OFweek,一手掌握高科技全行业资讯

还不是OFweek会员,马上注册
打开app,查看更多精彩资讯 >
  • 长按识别二维码
  • 进入OFweek阅读全文
长按图片进行保存