近期,斯坦福大学发布了2021年的《人工智能指数报告》,报告分为七章,从研发、技术性能、经济、AI教育、伦理挑战、AI多样性和AI国家战略七个方面跟踪、整理、提炼和可视化AI相关数据。为政策制定者、研究人员、高管、记者和普通公众提供公正的、经过严格审核的、来源于全球的数据,以形成对AI这一复杂领域的直观感知。
该报告旨在成为世界上最可信、最权威的AI数据和洞察来源。与以往不同的是,今年的报告从多个角度展示了COVID-19对AI发展的影响。
本期内参来源:斯坦福大学
原标题:
《人工智能指数2021年度报告》
作者:Jack Clark 等
一、研发
研发是人工智能进步的基础。自从这项技术在20世纪50年代首次引起计算机科学家和数学家的注意以来,人工智能已经发展成为一门具有重大商业应用价值的研究学科。
研发主要跟踪的指标是论文,报告主要使用Elsevier/Scopus和微软学术图谱(MAG)数据库的数据以及来自arXiv论文预印本库和Nesta的数据,以了解同行评审的期刊论文、会议论文和专利等人工智能出版物,以及每种出版物的引用和影响情况。
根据 Elsevier Scopus数据库中的数据。2000年至2019年间,出版物总数增长了近12倍。而这一时期同行评审出版物的比例从2000年的0.82%上升到2019年的3.8%。
2000-19年经同行评审的AI出版物数量
2000-19年经同行评审的AI出版物(占总数的百分比%)
自2004年以来,在全世界同行评审的人工智能出版物总数中,东亚和太平洋地区所占份额最大,其次是欧洲和中亚以及北美。
2000-19年按地区展示的同行评审的AI出版物(占总数的百分比%)
中国、美国和欧盟是AI研究的主要三个参与者, 截至2019年,中国在2017年超过欧盟后,同行评审人工智能出版物中所占份额在全球一直处于领先地位。2019年,中国发表的同行评审人工智能论文数量是2014年的3.5倍,而这一时期欧盟发表的论文数量仅是2014年的2倍,美国则是2014年的2.75倍。
2000-19年按地理区域展示的同行评审的AI出版物(占总数的百分比%)
从发表论文的机构角度来看, 2019年,中国大约有95.4%的同行评审人工智能出版物是与学术界相关的,而欧盟和美国的这一比例分别为81.9%和89.6%。这些机构的附属类别并不是互斥的,因为有些作者可能附属于一种以上的机构。
数据表明,除学术界之外,政府机构在中国和欧盟的同行评审人工智能出版物中所占比例始终最高(2019年分别为15.6%和17.2%),而在美国,除学术机构外占比最高的机构类型则是企业附属机构(19.2%)。
2000-19年按机构隶属关系展示的中国经同行评审的AI出版物数量
2000-19年按机构隶属关系展示的欧盟经同行评审的AI出版物数量
2000-19年按机构隶属关系展示的美国经同行评审的AI出版物数量
产学合作方面美国做的最好, 美国学术界和产业界之间的研发合作变得越来越重要也越来越受欢迎,具体表现在产学研中心数量的激增以及企业对大学研究的贡献增多。
2015年至2019年间,美国出版的产学界合作、合著的同行评审的人工智能出版物数量最多,是欧盟的两倍多,排在第二位。其次是中国,排在第三位。
2015-19年按地理区域展示的产学界合作、合著的同行评审AI出版物数量(总和)
根据微软学术图谱谱(MicrosoftAcademic Graph,MAG)的数据,2020年人工智能期刊出版文献数量比2000年高5.4倍。2020年,人工智能期刊出版文献的数量比2019年增长了34.5%,这一增长率远远高于2018年至2019年的19.6%。人工智能期刊出版文献在全球所有出版文献中的份额在2020年跃升了0.4个百分点,高于过去五年0.03个百分点的平均水平。
2000-20年AI期刊出版文献数量
2000-20年AI期刊出版文献(占所有期刊出版文献的百分比 %)
在过去的21年里,东亚和太平洋、欧洲和中亚以及北美是人工智能期刊的主要发行地,而这三个地区的主导地位随着时间的推移也在发生变化。2020年,东亚和太平洋地区的份额最高(26.7%),其次是欧洲和中亚(13.3%)以及北美(14.0%)。
2000-20年按地区分列的AI期刊出版文献(占全球总数的百分比 %)
在三大人工智能大国中,自2017年以来,中国在人工智能期刊出版文献中所占份额居世界首位,2020年为18.0%,其次是美国(12.3%)和欧盟(8.6%)。
2000-20年按地理区域展示的AI期刊出版文献(占世界总出版文献的百分比%)
从人工智能期刊引用比例的角度看,2020年中国(20.7%)首次超过美国(19.8%),而欧盟的整体份额继续保持下滑趋势。
2000-20年按地理区域展示的AI期刊引用情况(占世界总引用情况的百分比%)
专利方面,在过去20年中,世界上公布的人工智能专利总数一直在稳步增长,从2000年的21806项增长到2019年的101876项,增长超过了4.5倍。
会议方面,2020年,由于大多数会议都是通过虚拟形式召开的,人工智能会议的参与度显著提高。只有第34届国际人工智能大会(Association for the Advancement of Artificial Intelligence ,AAAI)在2020年2月线下召开。会议组织者介绍说,虚拟形式使得来自世界各地的研究人员的出席率提高,但是准确的出席人数很难衡量。
2020年,9个会议的参会者总人数几乎翻了一番。特别是,智能机器人与系统国际会议(IROS)将虚拟会议设置为允许用户在长达3个月的时间内观看会议活动,从而造成了非常高的出席率。
二、技术性能
本章重点介绍人工智能各个子领域的技术进展,包括计算机视觉、语言、语音、概念学习和定理证明。本节使用多种定量测量方式的组合,如常用的基准和奖项挑战,以及学术论文的定性分析来展示最先进的人工智能技术的发展情况。
虽然技术进步使得人工智能系统的部署比以往更广泛、更容易,但人们对人工智能的使用也越来越关注,尤其是在算法偏差等问题上。新的人工智能技术能力的出现,例如能够合成图像和视频,也带来了伦理挑战。
1、计算机视觉——图像
在20世纪10年代,图像识别和分类领域开始从经典的人工智能技术转向基于机器学习的技术,特别是基于深度学习的技术。其中最出名的数据集是来自斯坦福大学和普林斯顿大学的计算机科学家于2009年创建的ImageNet。
ImageNet挑战的图像分类任务要求机器根据图像中的主要对象为图像分配一个类别标签。下图探讨了随着时间的推移,性能最好的ImageNet系统的演变情况,以及算法和基础设施的进步如何让研究人员提高训练图像识别系统的效率,同时减少训练高性能系统所需的绝对时间。
Top-1准确度测试人工智能系统为图像分配正确标签的能力,特别是其单个最有可能的预测结果(在所有可能的标签中)是否与目标标签相同。
使用预训练数据的最新系统在Top-1准确度中每10次尝试中会出现1次错误,而在2012年12月,当时的系统每10次尝试中会出现4次错误。谷歌大脑团队的模型在2021年1月达到了90.2%的最高准确率。
ImageNet挑战:Top-1准确度
Top-5准确度考察的是正确的标签是否出现在分类器的前五个预测中。错误率已从2013年的85%左右提高到2020年的99%左右。
ImageNet挑战:Top-5准确度
随着时间的推移,原始测量准确度的提高,评估在ImageNet上训练图像分类器达到标准性能水平所需的时间变得非常有用,因为它能够揭示出大规模人工智能训练的基础计算基础设施的进步。
下面是MLPerf的结果,这是一个由非盈利性机器学习开放组织MLCommons组织举办的竞赛,参赛者使用公共(残差网络)架构训练ImageNet网络,然后根据训练系统所需的实际时间对系统进行排名。
ImageNet上的训练时间从6.2分钟(2018年12月)下降到47秒(2020年7月)。与此同时,用于实现这些成果的硬件数量大幅增加。前沿系统一直以使用“加速器”芯片为主,从2018年的GPU开始,2019年和2020年过渡到谷歌的TPU,并获得了同类型的最佳结果。
IMAGENET:培训时间的分配ImageNet:最佳系统的训练时间和硬件
训练一个现代的图像识别系统大概需要多少钱?根据斯坦福DAWNBench团队的测试,答案是2020年只需要几美元。这一数字比2017年的成本下降了大约150倍。从这个角度来看,2017年10月,一个参赛者参赛需要花费的成本是1100美元,而现在大约只需要7.43美元。这代表了算法设计的进步以及云计算资源成本的下降。
ImageNet:训练成本(准确率达到93%)
2、计算机视觉——视频
在视频方面,目前对视频理解的研究仍然集中在较短时间的事件中,比如几秒钟长的视频。较长时间的视频理解正在获得越来越多的关注。
视频使用的基准是2015年推出的ActivityNet。
ActivityNet时间动作定位任务
下图显示了2020年时间行动定位任务中最困难的活动,以及它们的平均精度与2019年结果的比较。喝咖啡(Drinking coffee)仍然是2020年被认为最困难的活动。石头剪子布(Rock-paper-scissors)虽然仍然是排名第十的最困难的活动,但它的改进是相当巨大的,增长了129.2%,即从2019年的6.6%增加到了2020年的15.22%。
2019-20年ActivityNet:最困难的活动,2019-20
目标检测是在图像中识别给定目标的任务。一般来说,在实际场景中部署的系统中,图像分类和图像检测任务通常是耦合在一起的。解决衡量已部署的目标识别系统改进情况的一个有效方法是研究广泛应用的目标监测系统的发展情况。
YOLO是一个广泛使用的开源的对象检测系统。YOLO的进展已经包含在YOLO变体的一个标准任务中,这样方便我们了解科学研究是如何普及到开源工具中的。
YOLO:平均精度
人脸识别方面,美国国家标准与技术研究所(NIST)的人脸识别供应商测试(FRVT)提供了对商用和原型人脸识别技术的独立评估。
下图给出了在多个不同数据库中根据错误不匹配率(FNMR)测量的性能最好的1:1算法的结果。FNMR是指当试图将图像与个体匹配时算法失败的速率。在过去四年中,入案照和签证照的面部识别技术改进最为显著,错误率从接近50%下降到2020年的只有百分之零点几。
2017-20年NIST FRVT 1:1数据库验证准确度
3、语言
近年来,自然语言处理技术的进步使得数十亿人访问的大规模系统发生了重大变化。例如,在2019年末,谷歌开始将其BERT算法部署到搜索引擎中,使得该公司称其内部质量指标有了显著改善。微软也紧随其后,在2019年晚些时候宣布将使用BERT来改进其必应(Bing)搜索引擎。
英语理解基准使用的是 SuperGLUE,它是一个单一的测量基准,用于评估模型在已建立的数据库上执行一系列语言理解任务的性能。 SuperGLUE得分是通过计算一组任务的平均得分得到的。
微软的DeBERTa模型现在以90.3分的成绩高居SuperGLUE排行榜榜首,而SuperGLUE的“人类基线”平均分为89.8分。虽然这并不意味着人工智能系统在所有SuperGLUE任务上的表现都超过了人类,但这确实说明这一整套方法的平均表现已经超过了人类的基线。
SuperGLUE基准
另外一个基准是斯坦福问答数据库(Stanford Question AnsweringDataset,简称SQuAD),它衡量NLP模型能够为一篇小文章的一系列问题提供简短答案的准确程度。
SQuAD 1.1的F1成绩从2016年8月的67.75分提高到了2018年9月的91.22分(25个月),而SQuAD 2.0仅用了10个月的时间就超过了人类的表现(从2018年5月的66.3分提高到2019年3月的89.47分)。2020年,最先进的SQuAD 1.1和SQuAD 2.0的F1成绩分别达到了95.38分和93.01分。
SQuAD 1.1和SQuAD 2.0:F1得分
4、语言推理能力
2015年推出的VQA挑战的任务是给定一个图像和一个基于公共数据集的关于图像的自然语言问题,要求机器给出准确的自然语言答案。图2.4.1显示,自2015年在国际计算机视觉会议(ICCV)上第一次发布以来,VQA挑战的准确度增长了近40%。2020年挑战赛的最高准确度为76.4%。这一成果已经非常接近于人类基线80.8%的准确度,与2019年排名靠前的几个算法相比性能提高了1.1%。
视觉问答(VQA)挑战:准确度
视觉常识推理(VCR) 任务于2018年首次推出,它的要求是机器回答一个关于给定图像的具有挑战性的问题,并通过推理证明该答案的正确性(而VQA只要求回答)。 性能最好的模型的Q->AR分数从2018年的44分提高到了2020年的70.5分。与2019年最好的几个模型相比,2020年最优模型的性能提高了60.2%。
视觉常识推理(VCR)任务:Q->AR得分
5、语音
语音识别,或称为自动语音识别(ASR),是指令机器能够识别口语单词并将其转换为文本的过程。
自1962年IBM推出第一项语音识别技术以来,随着AmazonAlexa、Google Home和Apple Siri等语音驱动应用的日益普及,这项技术也在不断发展。特别是深度神经网络的灵活性和强大的预测能力,使得语音识别变得更加容易。
2015年首次推出LibriSpeech数据库。该数据库包括了有声读物中1000小时的语音,已经广泛应用于语音识别技术的开发和测试。近年来,基于神经网络的人工智能系统显著提高了LibriSpeech的性能,将单词错误率(WER;0%是最佳性能)降低到了2%左右。
LIBRISPEECH:字错误率,Test Clean
LIBRISPEECH:字错误率,Test Other
VOXCELEB:等错误率
6、推理
SAT问题考虑针对一组由逻辑连接词连接的布尔变量的赋值问题,即:是否有赋值能够使得它所表示的逻辑公式为真。真实场景中的一些问题,如电路设计、自动定理证明和调度等,都可以用SAT问题来表示和解决。
虽然2016年至2018年最佳解决方案的性能并没有明显的改进,但2019年和2020年的情况却有了很大改善。这些改进不仅包括最好的解算器,也包括了它们的竞争对手。2019年排名中位数的解算器的表现优于往年排名靠前的解算器,而2020年排名中位数的解算器的表现甚至与2019年排名靠前的解算器不相上下。
2016-20年每个解算器解算全部400个实例的总时间及年份(越低越好)
2016-20年单个解算器对性能改进的时间夏普利价值贡献(越高越好)
7、 医疗和生物学
在过去的25年里,制药工业已经从基于自然资源(如植物)进行药物开发转向用化学合成的分子进行大规模药物筛选。科学家们通过使用机器学习模型,能够确定哪些潜在药物值得进一步在实验室进行评估,以及进行药物分析的最有效方法是什么。各种机器学习模型可以学习化学分子的表达形式进而用于化学合成规划。
下图给出了一些模型的Top-1准确度,这些模型是基于一个包含了美国专利中100万个反应的免费数据库为基准训练得到的。 6 Top-1准确度是指模型预测的可能性最高的产品与真实情况中报告的产品一致。数据表明,在过去的三年中,化学合成规划的研究水平稳步提升。
2020年的准确度比2017年提升了15.6%。最新的分子transformer在2020年11月份报告出来的成绩已经达到了92%的Top-1准确度。
化学合成规划基准:测试准确度TOP-1
为了抵御COVID-19大流行,人工智能驱动的药物发现代码已经开源。 COVID Moonshot是一个众包协议,由500多名国际科学家共同参与,以加速开发COVID-19抗病毒药物。根据该协议,参与的科学家们无偿公开他们的分子设计。
人工智能初创公司PostEra使用机器学习和计算工具基于科学家们提交的材料评估制造化合物的难易程度,并生成合成路线。在第一周之后,Moonshot收到了2000多份材料,PostEra在不到48小时的时间内设计了合成路线。而如果相同的任务完全由人类化学家执行,一般需要花三到四周的时间才能完成。
下图显示了一段时间以来科学家们提交材料的累计数量。Moonshot在短短四个月内就收到了来自全球365位科学家的超过10000份投稿。到2020年8月底,众包完成了它的任务,目前重点已经转移到优化铅化合物和建立动物试验中。截至2021年2月,Moonshot计划在3月底前提名一名临床候选人。
POSTERA:MOONSHOT提交的材料总数
最后,报告作者邀请了人工智能专家分享他们对2020年最重要的人工智能技术突破的看法。以下是他们的回答摘要,以及部分个人意见要点。
2020年最令人印象深刻的人工智能进步是什么?
提到最多的两个系统分别是分子分析模型AlphaFold(DeepMind),和文本生成模型GPT-3(OpenAI)。
2021年人工智能的发展趋势是什么?
专家预测通过使用预训练的模型人工智能将会取得更多的进展。例如,GPT-3是一个大型的NLP模型,可以对其进行微调从而在特定的、具体的任务中获得优异的性能。类似地,2020年,利用超大图像数据库中预训练的模型,计算机视觉领域的研究也取得了各种进步。
在2021年,你最期待看到人工智能技术进展、部署和发展的哪方面?
“我注意到了Transformers架构的流行,它最开始是用于机器翻译,目前已经成为神经网络代表架构。更广泛地说,虽然NLP在深度学习的应用方面落后于视觉技术,但现在看来NLP的进步也在推动视觉技术。”—Percy Liang,斯坦福大学
“语言生成方面令人难以置信的最新进展对自然语言处理和机器学习领域产生了深远影响,使以前非常困难的研究挑战和数据库突然变得毫无用处。同时这也鼓励了研究人员针对这些复杂新模型的非常有趣也很有吸引力的能力(和重要缺陷)开展新的研究工作。”—Carissa Schoenick,艾伦人工智能研究所
三、经济
人工智能(AI)的兴起不可避免地引发这样一个问题:人工智能技术将在多大程度上影响企业、劳动力和经济。考虑到人工智能的最新进展和众多突破,这一领域为企业提供了巨大的好处和机会,从自动化提高生产率到使用算法为消费者定制产品,以及大规模分析数据等等。
1、工作
人工智能在不同国家的就业增长有多快?本节首先介绍LinkedIn的数据,这些数据给出了不同国家人工智能相关行业的招聘率。
人工智能招聘率的计算方法是,将人工智能技能写入个人资料或从事人工智能相关职业的LinkedIn会员人数以及在新工作开始的同一个月增加新雇主的人数,除以该国LinkedIn会员总数。然后,将该比率与2016年的平均月份相关联。
例如,2020年12月的指数为1.05,则表明招聘率比2016年的平均月份高出5%。考虑到会员更新个人资料时可能出现的滞后情况,LinkedIn进行按月比较。一年的指数是该年内所有月份的平均指数。
这一数据表明,2020年,所有抽样国家的就业率都在上升。巴西、印度、加拿大、新加坡和南非是2016年至2020年人工智能招聘增长率最高的国家。在所分析的14个国家中,2020年人工智能的平均招聘率是2016年的2.2倍。对于排名第一的国家巴西来说,就业指数增长了3.5倍以上。此外,尽管出现了COVID-19大流行,但2020年14个抽样国家的人工智能招聘人数仍在继续增长。
2020年各国AI招聘指数
2016-20年各国AI招聘指数
过去七年来,美国、英国、加拿大、澳大利亚、新西兰和新加坡六个国家对人工智能劳动力的需求大幅增长。平均而言,2020年人工智能职位占所有职位的比例是2013年的五倍多。在这六个国家中,新加坡的增长最多。2020年,新加坡在所有工作岗位上的人工智能职位招聘比例是2013年的13.5倍。
在这六个国家中,美国是唯一一个在2019年至2020年间人工智能招聘职位比例下降的国家,这也是其六年来首次下降。出现这种下降情况的原因可能是冠状病毒大流行或该国相对成熟的人工智能劳动力市场。在美国发布的人工智能职位总数也下降了8.2%,从2019年的325724个减少到2020年的300999个。
2013-20年各国AI职位招聘(占所有职位招聘的百分比)
人工智能技能在不同职业中的普及程度如何?人工智能技能普及指标显示每个职业前50名技能中人工智能技能的平均份额。这些数据是根据LinkedIn会员个人资料中列出的技能、职位以及职位所在地等信息计算得到的。
在进行跨国比较时,人工智能技能的相对普及率是用一个国家各职业人工智能技能的普及率之和除以人工智能技能在全球同一职业中的平均普及率得到的。例如,相对普及率为2意味着该国人工智能技能的平均普及率是全球同类职业平均普及率的2倍。
在下图所示的样本国家中,2015年至2020年的汇总数据显示,印度(全球平均水平的2.83倍)的相对人工智能技能普及率最高,其次是美国(全球平均水平的1.99倍)、中国(全球平均水平的1.40倍)、德国(全球平均水平的1.27倍)和加拿大(全球平均水平的1.13倍)。
2015-20年各国相对AI技能普及率,2015-20
为了对各行业和样本国家的人工智能技能普及率进行更加细致深入的分解,下图展示出了过去五年全球人工智能技能普及率最高的五大行业的汇总数据:教育、金融、硬件和网络、制造业、软件和IT。
在所有五个行业中,印度的人工智能技能相对普及率最高,而美国和中国在部分榜单中也排名前列。其他相对技能普及率超过1的值得强调的专业领域,包括德国的硬件、网络以及制造业,和以色列的制造业和教育业。
2015-20年各行业的相对AI技能普及率
2、 投资
相对于2019年,2020年全球人工智能投资总额(包括私人投资、公开募股、并购和少数股权)增长了40%,总额为679亿美元。由于COVID-19大流行,许多小企业遭受了巨大的损失。
因此,在2020年,行业整合和并购的增加推动了企业对人工智能的总投资。2020年,并购占总投资的绝大部分,相较于2019年增长了121.7%。此外,2020年还发生了几起与人工智能相关的非常引人注目的收购事件,包括英伟达收购Mellanox Technologies和凯捷收购AltranTechnologies。
2015-20年按投资活动划分的全球企业对AI的投资
下面一节分析了过去10年中私人投资超过40万美元的人工智能初创公司的发展趋势。虽然近年来私人投资人工智能行业的数量急剧上升,但增长速度已经放缓。
越来越多针对人工智能的私人投资正流入越来越少的初创企业。尽管COVID-19大流行,2020年人工智能私人投资额较2019年仍然增长了9.3%,高于2019年的5.7%(图3.2.2)。不过,获得资助的公司数量连续第三年下降。
2020年,私人投资额创历史新高,超过了400亿美元。但与2017年至2018年的最大增幅59.0%相比,2020年相比2019年仅增长了9.3%。此外,受资助的人工智能初创企业数量从2017年的峰值持续大幅下降。
2015-20年私人AI投资情况
2015-20年全球新投资AI企业数量
如下图所示,美国仍然是私人投资的主要流向地,2020年的私人投资金额超过了236亿美元。其次是中国(99亿美元)和英国(19亿美元)。
2020年各国对AI的私人投资情况
仔细研究美国、中国和欧盟这三个主导人工智能竞赛的竞争者,可以进一步验证美国在人工智能私人投资方面的主导地位。虽然中国在2018年的人工智能私人投资额异常高,但其在2020年的投资水平还不到美国的一半。
不过,值得注意的是,中国在人工智能领域拥有强大的公共投资。中国的中央和地方政府都投入了大量资金以支持人工智能研发。
2015-20年按地理区域划分的AI私人投资
下图显示了2020年私人投资额最大的前10个重点领域的排名,以及2019年各自的投资额。“药物、癌症、分子、药物发现”领域高居榜首,人工智能私人投资超过138亿美元,是2019年的4.5倍。其次是“自动车辆、车队、自动驾驶、道路”(45亿美元)和“学生、课程、教育科技、英语”(41亿美元)。
除药物、癌症、分子、药物发现外,2019年至2020年,“游戏、粉丝、游戏、足球”和“学生、课程、教育科技、英语”的人工智能私人投资额都有显著增长。前者主要是受到美国和韩国游戏和体育初创企业数轮融资的推动,后者则是受到中国在线教育平台投资的推动。
2019年vs 2020年按重点领域划分的全球AI私人投资
3、公司活动
2020年,报告应用人工智能的情况最多的是代表高科技和电信企业的受访者,这与2019年的结果是相似的。其次是金融服务和汽车及装配业。
与2019年(和2018年)类似的另外一个情况是,2020年的调查表明,公司最有可能应用人工智能的功能/任务因行业而异。例如,汽车和装配行业的受访者表示,在与制造相关的任务中应用人工智能的比例高于其他行业。金融服务行业的受访者表示,在与风险相关的功能方面应用人工智能的比例更高。高科技和电信行业的受访者表示,在产品和服务开发功能方面应用人工智能的比例更高。
跨行业来看,2020年的公司最有可能将人工智能用于服务运营(如现场服务、客户服务、后台)、产品和服务开发以及营销和销售等工作中。这一点与2019年的调查结果类似。
根据行业不同,所应用的人工智能能力类型也不同。跨行业来看,2020年,公司最有可能将机器学习技术、机器人过程自动化和计算机视觉确定为至少一项业务功能所需要应用的能力。
2020年各行业AI采用情况
2020年各行业和职能部门采用AI的情况
2020年嵌入标准业务流程的AI能力
目前,人工智能正广泛应用于智能手机和个人车辆等消费类设备(如自动驾驶技术)。但在实际机器人上部署的人工智能还非常少。 6 随着研究人员开发将人工智能方法与现代机器人相结合的软件,这种情况可能会改变。
目前,可以通过计算工业机器人的全球销量进行评估,即全球范围内购买的可用于人工智能的基础设施数量。虽然COVID-19引发的经济危机短期内将导致机器人销量下降,但国际机器人联合会(IFR)预计,这场大流行将在中期为机器人行业带来全球范围内的增长机会。
在经历了连续六年的增长后,全球新部署的工业机器人数量下降了12%,从2018年的422271台降至2019年的373240台。造成这种下降的主要原因是美国和中国之间的贸易紧张关系以及汽车和电气/电子两大主要客户行业所面临的困难。
其中,汽车工业占主导地位(占总部署量的28%),其次是电气/电子(24%)、金属和机械(12%)、塑料和化工产品(5%)、食品和饮料(3%)。 7 需要注意的是,这些指标是对部署基础设施的衡量,而这些基础设施较易应用人工智能技术。这些指标并不表明是否每个新机器人都使用了大量人工智能。
2012-19年全球工业机器人安装
四、 人工智能教育
随着人工智能逐渐成为经济活动中重要的驱动力,人们对人工智能的兴趣与日俱增。人们希望了解人工智能并获得从事该领域工作所必须的技能。与此同时,产业界对人工智能人才的需求不断上升,吸引着越来越多的教授离开学术界进入私营企业。
2020年,人工智能指数开展了一项调查,内容是面向全球一流大学和新兴经济体的计算机科学系或计算与信息学院了解关于人工智能教育四个方面的问题,具体包括:本科课程、研究生课程、人工智能伦理课程、教师的专业知识和多样性。
2016-20每年学生学习或构建实用AI模型所需的技能的本科课程数量
在过去的四个学年中,计算机科学系在实用人工智能课程上投入了大量资金。 在18所大学中,教授学生建立或部署实用人工智能模型所需技能的课程数量增加了102.9%,从2016-17学年的102门增加到了2019-20学年的207门。
数据显示,在过去四个学年中,注册或尝试注册人工智能入门课程和机器学习入门课程的学生人数增加了近60%。
2019-20学年,入门级人工智能和机器学习课程的招生人数略有下降,这主要是由于美国大学课程数量的减少所造成的。在过去的四个学年中,欧盟的入门级课程注册人数增加了165%,而美国的此类注册人数在上一个学年出现了明显的下降。
2016-20学年被AI引入和ML课程引入或尝试注册的学生人数
2016-20每年地区被AI入门和ML课程入门录取或尝试入学的学生人数百分比变化
调查还关注了研究生或更高学位级别的课程设置,特别是教授学生建立或部署实用人工智能模型所需技能的研究生课程。
在过去四个学年中,教授学生建立或部署实用人工智能模型所需技能的研究生课程增加了41.7%,从2016-17学年的151门课程增加到了2019-20学年的214门课程。
在过去四个学年中,参与此次调查的大学中主要研究人工智能的终身教职教师人数显著增长,与人工智能课程和学位课程需求的增长相一致。主要研究人工智能的教师人数增长了59.1%,从2016-17学年的105人增长到了2019-20学年的167人。
2016-20每年学生学习或构建实用AI模型所需的技能的研究生课程数量
2016-20年主要专注于AI研究的终身教职学院数量
五、伦理挑战
随着以人工智能为动力的创新在我们的生活中变得越来越普遍,人工智能应用的伦理挑战也越来越明显,并受到审查。如前几章所述,使用各种人工智能技术可能会导致意外且有害的后果,例如隐私侵犯,基于性别、种族/族裔、性取向或性别认同的歧视,以及决策不透明等问题。在部署之前应对现有的伦理挑战,建立问责制的、公平的人工智能创新—-从来没有任何一个时期像现在这样重要。
自2015年以来,政府、私营企业、政府间组织和研究/专业组织一直在致力于编制规范性文件。这些规范性文件描述了管理人工智能应用的伦理挑战的方法。这些文件,包括原则、指导方针等,提供了解决问题的框架和评估各种组织内部开发、部署和管理人工智能的战略。这些人工智能原则和框架讨论了一些共同的主题,包括隐私、问责、透明度和可解释性。
人工智能原则的发布标志着组织正在关注并建立人工智能治理的愿景。不过,所谓伦理原则的泛滥也遭到了伦理研究人员和人权实践者的批评,他们反对不准确地使用与伦理有关的术语。批评人士还指出,这些原则缺乏体制框架,在大多数情况下不具备约束力。此外,由于存在模糊性和抽象性问题,这些原则无法为实施人工智能相关的伦理准则提供指导。
2015-20年按组织类型划分的新AI伦理原则数量
2015-20年按地区划分的新AI伦理原则数量
新闻媒体是如何报道人工智能技术的伦理使用问题的呢?本节分析了NetBase Quid的数据。通过在LexisNexis的归档新闻数据库中进行搜索,找到与人工智能伦理相关的文章,涉及2020年6万个英语新闻来源和50多万个博客。
最终,NetBase Quid搜索发现了3047篇与人工智能技术相关的文章,其中包括诸如“人权”、“人类价值观”、“责任”、“人类控制”、“公平”、“歧视”或“非歧视”、“透明度”、“可解释性”、“安全保障”、“问责制”和“隐私”等术语。根据语言的相似性,NetBase Quid将最终的文章划分为七大主题。
在2020年,与人工智能伦理原则和框架相关的文章在最受关注的新闻主题中排名第一(21%),其次是研究和教育(20%)、人脸识别(20%)。
2020年,与人工智能的伦理使用相关的五个最受关注的新闻主题是:
1. 欧盟委员会发布人工智能白皮书(5.9%)
2. 谷歌解雇伦理研究员蒂姆尼特·格布鲁(3.5%)
3. 由联合国组成的人工智能伦理委员会(2.7%)
4. 梵蒂冈的人工智能伦理计划(2.6%)
5. IBM终止其人脸识别相关业务(2.5%)
2020年按主题划分的AI伦理新闻覆盖率(占总数的百分比)
六、 人工智能的多样性
人工智能系统可能会对社会产生巨大影响,但构建人工智能系统的人并不代表是这些系统要服务的人。目前,人工智能从业者以男性为主,包括学术界和工业界都是如此。尽管多年来一直强调这一点带来的不利因素和风险,但从业者的多样性仍然存在很大问题。
种族和民族、性别认同和性取向缺乏多样性,不仅有可能造成权力分配不均,更重要的是有可能进一步扩大人工智能系统现有的不平等问题,缩小这些系统所能够提供的服务面向的个人和组织的范围,进而造成不公平的结果。
1、 人工智能中的性别多样性
本章研究基于其中一项调查评估了全球顶尖大学计算机系的人工智能教育状况。另外一项则是计算机研究协会(ComputerResearch Association,CRA)每年对北美地区信息学、计算机科学和计算机工程领域博士的招生、毕业和就业情况进行的Taulbee调查。
两项调查的数据都显示,女性人工智能和计算机科学博士毕业生以及计算机科学终身教职教师的比例仍然很低。在过去十年中,人工智能博士和计算机科学博士的女性毕业生的人数平均占所有博士毕业生的18.3%。
在完成全球计算机科学项目人工智能指数调查的17所大学中,女性教师仅占所有主要研究领域为人工智能的终身教职教师的16.1%。
2019-20年度按性别分列的世界顶尖大学CS系的终身教职
下图显示了一组选定国家中按国家划分的男女劳动力池中人工智能技能的普及率。 数据表明,在图中所示的大多数国家中,女性人工智能技能普及率低于男性。在我们调查的12个国家中,印度、韩国、新加坡和澳大利亚在男女人工智能技能普及率方面最为公平。
2015-20年按性别划分的AI相关技能普及率
2、民族多样性
根据CRA Taulbee调查,在2019年美国居民新人工智能博士中,白人(非西班牙裔)所占比例最大(45.6%),其次是亚裔(22.4%)。相比之下,非洲裔美国人(非西班牙裔)占2.4%,西班牙裔占3.2%(图6.2.1)。
2019年按种族/民族划分的新美国居民AI博士生数量(占总数的百分比)
下图展示了2010年至2019年间,美国计算机科学(CS)、计算机工程(CE)和信息学(I)专业授予美国居民的所有博士学位。CRA的调查显示,白人(非西班牙裔)新博士的比例在过去10年中变化不大,平均占62.7%。
同期新增黑人或非裔美国人(非西班牙裔)和西班牙裔计算机博士的比例明显较低,平均分别为3.1%和3.3%。由于未知案例的数量,我们无法比较2019年新增人工智能博士和计算机科学博士的数量(新增人工智能博士为24.8%,计算机科学博士为8.5%)。
2010-19年按种族/民族划分的美国居民新计算机博士学位(占总数的百分比)
七、 人工智能政策和国家战略
人工智能将在未来几十年内塑造全球竞争力,并且有望给早期引入人工智能者带来显著的经济和战略优势。到目前为止,各国政府、区域和政府间组织都竞相制定针对人工智能的政策,以最大限度地发挥这项技术的潜力和优势,同时有效应对其引发的社会和伦理影响。
1、 国家和地区人工智能战略
为了指导和促进人工智能的发展,世界各国和地区正在加紧制定战略和举措,目的是协调政府和政府间的努力。自2017年加拿大发布全球首个国家人工智能战略以来,截至2020年12月,已有30多个国家和地区发布了类似文件。
发布人工智能战略的国家
加拿大。 人工智能战略: 泛加拿大人工智能战略
负责组织:加拿大高级研究所(CIFAR)
要点:加拿大人工智能战略强调发展加拿大未来的人工智能劳动力,支持主要的人工智能创新中心和科学研究,并将该国定位为人工智能在经济、伦理、政策和法律方面的思想领袖。
资金(2020年12月兑换率) :1.25亿加元(9700万美元)
2020年11月,CIFAR发布了其最新年度报告,题为“AICAN”,该报告跟踪了加拿大人工智能国家战略的实施进展,其中重点阐述了加拿大人工智能生态系统的实质性增长,与医疗保健和人工智能对社会的影响相关的研究和活动,以及人工智能战略相关的其他成果。
中国。 人工智能战略: 新一代人工智能发展规划
责任机构:中华人民共和国国务院
要点:中国的人工智能战略是世界上最全面的人工智能战略之一。它涵盖了通过教育和技能获取进行研发和人才培养、伦理规范和对国家安全的影响等领域。该战略设定了具体的目标,包括:到2020年,使人工智能行业能够与竞争对手保持一致;到2025年,成为无人驾驶飞行器(UAV)、语音和图像识别等领域的全球领导者;到2030年,成为人工智能创新的主要中心。
资金:N/A
最新进展:中国于2019年2月建立了新一代人工智能创新开发区,并于2019年5月由学术机构和腾讯、百度等私营企业组成的多方利益相关者联盟发布了“人工智能北京共识”。
日本。 人工智能战略: 人工智能技术战略
负责组织:人工智能技术战略委员会
要点:该战略规划了人工智能开发的三个独立阶段。第一阶段的重点是数据和人工智能在相关服务业中的利用,第二阶段的重点是人工智能的公共使用和服务业的扩张,第三阶段的重点是创建一个综合生态系统,从而将各个领域融合在一起。
资金:N/A
最新进展:2019年,日本的综合创新战略促进委员会推出了另一项人工智能战略,其目的是进一步推进人工智能,解决日本目前面临的问题,利用日本的优势开拓未来机遇。
欧盟。 人工智能战略: 人工智能协调计划
负责组织:欧盟委员会
要点:本战略文件概述了欧盟成员国、挪威和瑞士为增加投资和建立人工智能人才渠道而商定的承诺和行动。它强调公私伙伴关系的价值,创造欧洲的数据空间和发展伦理原则。
资助(2020年12月兑换率) :人工智能研究每年至少10亿欧元(11亿美元),战略及其他方面至少49亿欧元(54亿美元)
这些关于人工智能的多边举措表明,各国组织正在采取各种方法来解决人工智能的实际应用问题,并扩大这些解决方案的规模,以产生最大的全球影响。许多国家求助于国际组织以制定全球人工智能规范,还有一些国家则参与伙伴关系或双边协议。
人工智能的伦理或当前和未来人工智能应用所带来的伦理挑战是政府间努力的一个重点关注领域。
日本、韩国、英国、美国和欧盟成员国都是人工智能政府间努力的积极参与者。另一方面,作为一个主要的人工智能强国,中国选择了参与一些科技双边协议,强调“一带一路”数字丝绸之路框架下的人工智能合作。例如,中国与阿联酋在“一带一路”举措下的经济合作中提到了人工智能。
智东西认为,虽然过去的2020年世界收到新冠肺炎的严重影响,但对于AI的研究热情没有明显的消退。机器视觉、语音识别等方面取得很大进步外,在药物设计与发现领域人工智能投资也大幅增加:“药物、癌症、分子、药物发现 ”在2020年获得的私人人工智能投资金额最大,超过了138亿美元。这个金额是2019年投资金额的4.5倍,在某种程度上本次疫情对AI的研究也起到了很大的推动作用。