2017 年人工智能研发热点回眸

2017年又是人工智能突飞猛进的一年，也是人工智能产品更加进入人们的视野和生活的一年，以至于很多人把2017年称为“人工智能应用元年”。从受到广泛关注的人机对战比赛到惠及人们生活的无人驾驶、智能家居，从基础硬件的人工智能芯片到人脸识别解锁的手机，人工智能正在从方方面面改变人们的生活。

人机对战

2016年始，人机对战成为人工智能领域最受关注的话题。2016 年3 月，谷歌DeepMind 推出的AlphaGo以4∶1战胜职业围棋世界冠军李世乭，宣告机器在围棋领域超过人类顶尖选手的水平。2017年5月，强化后的AlphaGo Master又以3∶0战胜当时世界排名第一的棋手柯洁（图1）。经过了算法和模型的进一步优化，AlphaGo已经到了没有人类对手的级别。

2017年10月，DeepMind推出了围棋软件的又一新力作：AlphaGo Zero。虽然AlphaGo Master能够打败世界第一棋手柯洁，但是依靠了数以千计的人类业余和专业棋手对其进行训练。而AlphaGo Zero却跳过这一步骤，从完全的随机开始进行自我对弈，只用了40天自我学习就超越了花费2年时间训练模型的所有旧AlphaGo版本。DeepMind用这一新成果再一次树立了人机对战的里程碑。

AlphaGo Zero通过使用强化学习的新形式，让它能够成为自己的老师。它从一个除了规则以外对围棋一无所知的神经网络开始，通过将强大的搜索算法和神经网络结合，不断地通过自我对弈更新和训练模型，在每一次迭代中，系统的性能都能有所提高，自我对弈的质量也随之提高，从而让神经网络越来越精准。最终达到对自己的每一手棋及其对棋局产生的影响进行准确预测，最终预测游戏的胜者。

除了摆脱了人类数据的影响，AlphaGo Zero还将早期AlphaGo使用的用于选择下一手的“策略网络”和用于预测胜者的“价值网络”结合成一个网络，可以更有效的进行资源利用，并进行模型的培训和评估。随着硬件的发展和算法的优化，现已能够实现更快的运算，让机器拥有更多的自主权，人工智能也因此变得更加强大和高效。

人类知识并不可靠，人力成本又十分昂贵，AlphaGo Zero能够抛弃这一性价比并不高又十分掣肘的手段，在没有人力投入的情况下达到完全超越人类的表现，确实在人工智能领域迈出了重要一步。而单单在围棋领域取得突破，其实也只是处在实现摆脱人类知识、让人工智能具有更高自主性这一目标的初级阶段。类似的技术还可以应用于其他结构性的问题中，例如蛋白质折叠、减少能源消耗或者寻找革命性的新材料等。在围棋领域实现了“打遍天下无敌手”的人工智能，将在其他各个领域的人机对战中超越我们。2017年1月在德州扑克领域，凯耐基梅隆大学开发的Libratus在人机德州扑克比赛中战胜了4位人类顶级德州扑克玩家，也再一次印证了这一点。随着深度学习的不断发展，我们对人工智能在越来越多的领域战胜人类拭目以待。

无人驾驶

无人驾驶汽车是现阶段人工智能应用中能很大程度上改变人们生活的一个代表，所以一直受到很大的关注。世界很多国家都将无人驾驶视为人工智能应用的一个重要爆发点。

在特斯拉公司、优步公司相继将无人驾驶汽车和无人驾驶系统投入市场之后，中国各大公司也在无人驾驶汽车领域奋力追赶。在2017年7月5日召开的“百度AI开发者大会”上，百度公司首席执行官李彦宏以视频连线的方式展示了自己乘坐无人驾驶汽车行驶在北京五环路上的场景。百度公司无人驾驶系统被称为Apollo系统。除了能够在百度公司汽车上实现无人驾驶，百度公司还试图让其成为一个开放系统，其他汽车行业和无人驾驶领域的合作伙伴可以将其作为软件平台，帮助他们在自己的硬件系统上开发无人驾驶汽车。现有的Apollo 系统已经有600 多个开发者在使用。百度公司希望凭借自己的无人驾驶系统，能够成为汽车界的“安卓”。在无人驾驶汽车的商用和普及上，百度公司也是雄心满满。对自己乘坐无人驾驶汽车而在北京五环路上吃到1张罚单，李彦宏表示：“无人驾驶罚单已经来了，无人车量产还会远吗？”百度公司计划在2018年7月底，率先对无人驾驶小巴士实现小规模量产及试运营。

其实，无人驾驶巴士的上路测试2017年已经陆陆续续在很多国家开展。芬兰赫尔辛基在2016年投入了自动驾驶巴士线路。2017年1月在美国拉斯维加斯，Navya公司投入了为期10天的自动驾驶巴士试验，而同款巴士也在2017年6月与美国密歇根大学投入使用（图2）。2017年12月中国深圳对“阿尔法巴”无人驾驶公交车进行了试运行。可见，在指定的短途线路上进行低速无人驾驶运行已经没有太多技术难关。

在无人驾驶巴士领域，Navya已经实现了完全的自动驾驶，但对于无人驾驶小汽车来说，配备安全司机依然是必要的。随着无人驾驶个人汽车的量产和普及进一步提上日程，它们的安全性成为了人们热议的话题。在2016年，特斯拉公司、谷歌公司无人驾驶汽车相继发生车祸。2017年3月，优步公司也因车祸而暂停了无人驾驶项目的研究。虽然百度公司大胆的公布了自己的商用计划，但它的安全性也依然受到人们的质疑。谷歌公司最早开始无人驾驶研究但经过6年还未商用，更让人认为无人驾驶的普及为时过早。

虽然无人驾驶汽车已经在上路测试，但仍然有许多可以提高和突破的地方。随人工智能研发的门槛进一步降低，市场欢迎每一位有能力的开发者。2017年3月，微软公司将AirSim系统进行了开源，主要可以用来训练和测试机器人和无人机等。2017年11月，微软公司又新推出了汽车模拟系统，使得AirSim系统能够被用做测试无人驾驶汽车系统的安全性（图3）。AirSim系统能够呈现详细的城市三维环境图，搭建一个高度还原的虚拟环境。开发者使用这一系统可在虚拟环境中测试无人驾驶汽车的行驶，以此提高无人驾驶汽车系统的可用性和安全性。微软公司计划通过不同的传感器，模拟具有更好物理特征的汽车、气象建模及更多的显示环境来进一步扩展AirSim系统。作为一个开放平台，AirSim的易用性十分强大，它提供了包括C++和Python等多语言的API接口，还能够与其他的机器学习工具共同使用。例如可以使用微软认知工具包（CNTK）一起进行深度增强学习。有如此的开放平台，也能够大大的降低无人驾驶算法的开发难度，让更多人参与到人工智能新技术的研发中。

人脸识别

2017年推出的新款苹果手机iPhone X让人脸识别成为了2017年最火的人工智能应用。其实早在2012年，脸部解锁就应用在了三星公司的Galaxy Nexus上。在这几年中，微软公司、谷歌公司、百度公司、阿里公司等都在不断推广自己的人脸识别系统。苹果公司推出人脸识别解锁的手机是人脸识别应用普及的临门一脚，这一现象代表着这一人工智能应用已经发展的足够成熟。除手机解锁外，人脸识别在公共安全、金融等特定领域都具有非常广泛的应用。

微软公司的人脸识别竞赛一直被认为是人脸识别领域的顶级赛事。它基于微软的大规模现实世界面部图像数据集MS-Celeb-1M，含有10万位名人的约1000万张脸部图片。据2017年7月21日公布的结果，在比赛的百万名人识别子命题无限制类（可以自由使用外部数据）中，松下电器公司-新加坡国立大学拔得头筹，中国科学院重庆绿色智能技术研究院（CIGIT）和中国科学院合作队伍紧随其后；而在有限制类（只使用竞赛提供数据）中，获得第一的队伍是北京猎户星空科技有限公司。在无限制类中，除算法不同外，训练模型所用的数据量大小也影响最后的表现。而在有限制类中，只能使用竞赛提供的数据，这将有限制类的比拼限制到了单纯算法的比拼，难度很高。北京猎户星空科技有限公司是宜家公司2016年9月成立的人工智能公司，1年时间就获得了比赛的冠军，可见中国具有丰富的人工智能人才，整个行业都在以惊人的速度发展壮大。

自然语言处理

继2016年微软语音识别系统仅有5.9%的错误率、超过人类专业速记员之后，微软公司2017年8月又取得了巨大突破，将语音识别的错误率降低到了5.1%。在这一年间，微软公司改进了基于神经网络的听觉和语音模型，同时引入了带有双向LSTM的卷积神经网络（convolutional neural network combined with bidirectional long-short-term memory，CNN-BLSTM）模型来改善听觉模型。通过对整个对话的过程进行历史记录分析，实现了上下文感知，能够预测接下来可能会说的话，进一步加强了语音识别系统的功能，让系统能够适应对话话题和语境的快速转变。

在自然语言处理方面，机器翻译一直被认为是人工智能应用方面非常难的一个应用。2017年9月召开的机器翻译大会（WMT）首次增设了中文和英文间的新闻数据翻译任务。搜狗语音交互技术中心研发的搜狗神经网络机器翻译（Sogou neural machine translation）系统在[中文-英文]机器翻译任务中获得了冠军。Sogou NMT的模型主题采用了业界主流的神经网络翻译模型：基于循环神经网络（recurrent neural network,RNN）的多层编码器-解码器（encoder-decoder）结构，并带有注意力（attention）模块。在2017年，神经机器翻译在大规模翻译任务上胜过了统计机器翻译，将人工智能中的神经网络应用于机器翻译渐渐成为主流。研究者也开始将关注的重点转向解决更复杂的问题，例如翻译中常见的词对齐、罕见词、长句等难点问题。搜狗团队凭借着在自然语言处理和深度学习方面深厚的积累将翻译的准确性不断提高，成为了2017年中国在世界自然语言处理领域的一大亮点。

智能音箱

人工智能技术的逐渐成熟也使智能设备快速普及。语音识别和自然语言处理技术准确率的进一步提升，意味着语音用户界面（voice user interface，VUI）正在成为图形用户界面（graphical user interface，GUI）之后的新一代交互界面。通过与智能语音助手结合，许多公司都将音箱设定为智能家居的控制中心，越来越多的智能音箱设备如雨后春笋般地进入了市场。

2017年9月，亚马逊公司推出了第二代智能音箱家族：Echo、Echo Plus和Echo Spot（图4），分别针对入门需求、智能家居需求、桌面端的智能音箱需求。主要针对智能家居需求的Echo Plus内置了配合虚拟个人助理Alexa的全新的智能家居控制中心，其中的“Routine”功能能够用一句自定义的命令控制一连串设计好的动作。例如使用“Alexa，good morning”，Alexa就能根据设定好的节奏进行开灯、播放天气预报、煮咖啡等活动。

2016年10月谷歌公司推出了首款搭载Google Assistant智能助手的Google Home，2017年苹果公司也发布了智能音箱HomePod。在中国智能音箱市场则是更加激烈，随2015年京东公司和科大讯飞公司联合研发的叮咚音箱推出后，2017年百度公司、阿里公司、联想公司、喜马拉雅公司、海尔公司和小米公司都陆续发布了智能音箱产品。作为智能家居的控制中心，智能音箱的革新也意味着智能家居的实现和普及正在稳步发展中，智慧生活的实现指日可待。

人工智能医疗

医疗影像渐渐成为了人工智能在医疗领域应用的重点。由于医疗行业放射科医生短缺，而医疗影像又是很多病症诊疗的必备基础，使用机器替代人类进行医疗影像分析前景广阔。深度学习作为人工智能的核心，十分适合用来分析影像类数据。2017年腾讯公司推出了人工智能医疗产品——腾讯觅影。腾讯公司先后和四川、河北等十多家三甲医院建立了联合实验室，开展AI影像和AI辅诊量两方面的工作。在早期食道癌筛查中，通过不到4 s的诊断时间能达到准确率90%的诊断；在辅助眼科糖网筛查中，糖网识别率能够高达97%。

在人工智能医疗技术不断落地的同时，人工智能辅助诊疗方面的研发也在不断的取得新的成果。《Nature》杂志2017年1月发表的1篇论文介绍了一种根据照片分类辨别皮肤癌的算法，这也是人工智能在医疗方面一个非常重要的应用领域。有了人工智能的支持，医生的工作能够变得更简单，更多的人可以享受到更准确的医疗诊断。

人工智能芯片

人工智能应用的不断推广也为其核心的人工智能芯片提供了巨大的市场，巨大的运算量对芯片提出了更高的要求。新一代计算芯片可以提供更强大的计算力，同时在集群上实现的分布式计算能够帮助人工智能模型在更大的数据集上运行。据跟踪私人公司交易的服务提供商PitchBook的数据显示，2017年风险投资家已向专注于人工智能芯片初创企业投资了1.13亿美元，这几乎是2015年全年的3倍。在人工智能芯片的市场上，智能设备厂商、云计算厂商、传统芯片厂商都纷纷参与了进来。

2017年5月，谷歌公司发布了下一代高性能处理器（TPU），可以用于推理和机器训练。苹果公司也为下一代iPhone设计了自己的图形处理器（GPU），这两款产品有助于在人工智能应用产品上为用户特定的需求调整硬件，比如谷歌公司的云应用或者苹果公司的语音助手Siri。一些传统大型芯片公司已经推出了人工智能芯片，也希望在人工智能芯片领域分一杯羹。英特尔公司在之前一直没有推出人工智能芯片产品，但其在2016年相继收购Movidius、Nervana等人工智能硬件公司后，在2017年10月推出特别为人工智能设计的Nervana神经网络处理器（nervana neural network processor，NNP）（图5）。但是英特尔公司依然没有赶上先一步占领人工智能芯片蓝海的英伟达公司，英伟达公司将本是被设计来服务于游戏视觉的GPU率先应用在了人工智能上，其精准入局也让它的无人驾驶汽车应用发展的如火如荼。

2017 年人工智能研发热点回眸

图5 英特尔Nervana神经网络处理器

英国的Graphcore 公司，美国的Mythic 公司、Wave Computing公司和Cerebras公司，中国的深鉴科技公司和寒武纪科技公司等多家芯片创业公司，都在为人工智能应用开发新的芯片。2017年11月，寒武纪科技公司发布了新一代人工智能芯片，采用与AlphaGo类似的深度学习技术，适用范围覆盖了图像识别、安防监控、智能驾驶、无人机、语音识别、自然语言处理等人工智能的重点应用领域。随着互联网企业的入局及芯片厂商布局的加速，围绕人工智能芯片的争夺战尤为激烈。

结论

随人工智能技术成果的日益丰富，人工智能的应用在飞速发展。在不远的将来，人工智能会在很大程度上解决人类健康、贫困、教育、环保等方面的问题。而在未来，人工智能将让人类生活的更加便捷和安全。