学术会议热度
在大型会议中,NeurIPS(曾用名NIPS)、CVPR和ICML,是参与人数最多的三大AI会议。自2012年以来,论参与人数的增长率,这三者也领先于其他会议。
NeurIPS和ICML参与人数增长最快:将2018年与2012年相比,NeuRIPS增长3.8倍(4.8x),ICML增长5.8倍(6.8x)。
上面讨论的是大型会议,但小型会议的参与人数同样有明显的增长,甚至可以比大型会议的增长更加明显。
这里最突出的是,ICLR2018的参会人数达到了2012年的20倍。
原因很可能是近年来,AI领域越来越关注深度学习和强化学习了。
AI创业投资情况
从2015年1月到2018年1月,人工智能创业公司的数量增长到了原来的2.1倍,而所有活跃的创业公司增长到了原来的1.3倍。
大多数情况下,创业公司的增长都保持相对稳定,而人工智能创业公司呈指数级增长。
在风投资金方面,从2013年到2017年,人工智能领域的风投资金增长到了原来的4.5倍,而所有的风投资金只增长到了原来的2.08倍。这些数据都是年度数据,不是逐年累积的。
图表中有两个高峰期,1997-2000年风投资金的激增,对应的是网络泡沫时期。2014-2015年出现了一个较小的增长,因为当时正处于一个相对较大的经济增长时期。
人才需求
报告显示,近几年,社会需要的AI相关人才大幅度增加,目前对有ML技能的人才需求最大,其次是深度学习。
可以看出,ML人才需求也是这两年增长速度最快的。
报告统计,2017年,全球ML人才需求是2015年的35倍,从2016年到2017年的增幅尤为明显。全球对AI人才的需求在2016年骤增。
专利
2014年,大约30%的人工智能专利发明人来自美国,其次是韩国和日本,各拥有16%。
在韩国和中国台湾地区,专利的增长速度较快。2014年人工智能专利的数量几乎是2004年的5倍。
财报电话会议中提及AI和ML的次数
2015年,科技公司在财报电话会议中提及AI和ML的次数开始有所增加。
2016年,其他行业提及AI次数才开始增长。
相比之下,科技行业的公司提及AI和ML的次数远比其他行业多。
在财报电话会议中,除了科技行业之外,提及AI次数最多的公司,基本上分布在消费、金融和医疗保健行业。
机器人安装量
2012年到2017年,中国机器人年安装量增长了500%,其他地区,比如韩国和欧洲,分别增长了105%和122%。
在安装量较小的地区中,中国台湾比较突出,在2012-2017年增长最快。
开源框架GitHub标星数
各框架的标星数反映着他们在开发者群体中的流行程度。不过,因为开发者们日常不会“取关”GitHub项目,所以这些星星都是多年来积攒下的。
我们可以明显发现,TensorFlow的受欢迎程度在开发者中遥遥领先、稳步增长。
排除了第一热门,第二名和第三名分别是scikit-learn和BVLC/caffe。
TensorFlow官方力推的keras排到了第四,但近一年来几无增长势头。
另外两大热门PyTorch和MXNet分别排到了第七和第六,尤其是PyTorch,作为一个年轻的框架,自2017年初发布以来至今,GitHub标星数至少增长了4倍。获取新用户的势头很猛,不知道其中有多少被TensorFlow逼疯的人类。
各类任务最新成绩
这个部分分为CV和NLP两块,分别列举了各主流任务从发展之初到现在的成绩进步情况。
ImageNet图像识别准确率
2017年是ImageNet比赛的最后一届,2018年这项比赛就不再进行了。不过,验证集依然有人在用。
蓝色的线条为ImageNet挑战赛历年的成绩变化,由于每年比赛所用的数据不同,旁边多了一条黄色线条,是以ImageNet2012验证集为评价标准绘制的。
可以看出,到2015年,机器在图像分类任务上的能力已经明显超越了人眼,而即使比赛不再继续,学术研究者依然在认真推进该任务的表现。
这也侧面说明,如果一项工作有了明确的评价标准和固定的挑战内容,研究者们围绕此竞争,更容易让技术在该领域取得突破。
ImageNet训练速度
这张图是训练ImageNet图像分类神经网络所需时间的历年变化(当然,是买得起足够计算资源的人和机构所用的时长)。
从2017年6月的1小时,到2018年11月的4分钟,ImageNet图像分类神经网络的训练速度提升了16倍,除了硬件方面的贡献,算法上的提升也不容小觑。
图像分割COCO
ImageNet挑战赛“退休”之后,CV领域的朋友们就把重点放在了微软的COCO,挑战语义分割和实例分割。
四年来,COCO数据集上图像分割挑战的精确度已经提升了0.2,2018年的成绩比2015提升了72%。不过,目前还没有超过0.5,这一项还有充足的进步空间。
另外值得一提的是,COCO比赛近年来占据冠军位置的多是来自中国的公司,包括旷视、商汤等计算机视觉独角兽日常包揽数个项目的冠军。
语法分析(Parsing)
在确定句子结构这种语法分析的任务上,2003年到2018年的15年间,AI的表现(F1Score得分)提升了将近10%。
机器翻译
在机器翻译任务上,报告拿英语-德语互相翻译举例,评估了AI模型在经典机器翻译评估算法BLEU标准中的表现。
报告显示,2018年英语转德语的BLEU评分是2008年的3.5倍,德语转英语成绩是2008年的2.5倍。
机器问答:AI2ReasoningChallenge(ARC)
在问答领域,AI表现进步更明显,可以按月计数了。
报告统计了2018年从四月到11月间,AI在ARC推理挑战赛上成绩的变化:简单组得分从63%提升到69%,挑战组得分从27%提升到42%。
这些,都仅是半年间的进步。
机器问答:GLUE
同样用于机器问答的GLUE基准(GeneralLanguageUnderstandingEvaluation)推出至今只有7个月的时间,但目前的表现已经比半年前提升了90%。
GLUE的推出者、纽约大学助理教授SamBowman说,虽然围绕GLUE的大型社区还没有出现,不过已经有了像谷歌BERT这样的代表性技术用了GLUE基准,面世一个月内已经被引用8次。在EMNLP会议中,GLUE时常被讨论,可能会成为语言理解领域中的一个基准线。
政府提及
整体来说,自2016年以来,美国、加拿大、英国政府在国会/议会会议中提及人工智能和机器学习的次数激增。
2016年之前,机器学习很少被提及,与人工智能相比,机器学习在总提及量中只占很小的一部分。