人工智能深度研究——系统平台战略篇

温馨提示：如需原文档，可在PC端登陆未来智库官网（www.vzkoo.com）搜索下载本“人工智能深度研究”。

1、政策、技术、资本三轮驱动

A、全球主要国家均将人工智能作为未来主导性战略，美中领跑

美中暂时领先，中国在人工智能领域强在应用层，基础和技术层是相对短板。全球已有超 22 个国家发布 AI 计划，2017 年与 AI 相关的 VC 投资达 140 亿美元。美国和中国在人工智能领域处于领先位置，根据腾讯研究院的统计，全球人工智能企业总数达到2542家，其中美国拥有 1078 家，占 42%;中国其次，拥有 592 家，占据 23%。其余 872 家企业分布在瑞典、新加坡、日本、英国、澳大利亚、以色列、印度等国家。从中美两国在人工智能版图的产业布局看，中国在基础层(计算硬件及基础设施，核心为处理器、AI 芯片和底层系统、数据等) 和技术层(算法理论、开发平台和应用技术，包括开源框架、自然语言处理、计算机视觉与图像等)与美国差距巨大，在应用层(AI 向各传统行业的渗透，包括机器学习应用、智能无人机、智能机器人、自动驾驶辅助驾驶、语音识别等)则与美国平分秋色。

美国在基础层和技术层的 AI 企业数量约为中国的两倍，在应用层两国公司无论是数量还是融资金额差距较小。这说明在人工智能领域，中美两国延续了在互联网时代的竞争格局和发展路线，即美国的产业发展从底层技术开始再向上游应用拓展，而中国则开始更多在应用侧进行创新，逐步向底层技术进行渗透。美国 AI创业公司中排名前三的领域分别为自然语言处理、机器学习应用以及计算机视觉与图像;中国 AI 创业公司中排名前三的领域分别为计算机视觉与图像、智能机器人以及自然语言处理。在基础和技术层的处理器/ 芯片，技术平台领域中国与美国存在巨大差距。

人工智能深度研究——系统平台战略篇

人工智能上升至中国国家战略层面，行业发展全面加速:2017 年 7 月，国务院印发《新一代人工智能发展规划的通知》，首次从国家战略层面对人工智能进行了系统布局，规划提到至 2030 年，人工智能行业将在中国产生 10 兆的产业带动效益;2017 年 10 月，人工智能写入十九大报告;17 年 12 月，《促进新一代人工智能产业发展三年行动计划(2018-2020 年)》; 18 年 3 月，人工智能再次被写入政府工作报告。政策密集出台，行业已进入发展黄金阶段。

5G+AI 是特朗普政府让美国再次伟大的关键:美国希望在人工智能领域延续移动互联网时代领先优势，在5G领域重新抢占制高点。 2019 年 2 月，美国总统特朗普签署行政命令，正式启动美国人工智能计划，这是美国政府首次推出国家层面的人工智能促进计划。美国人工智能计划包括研发领域、开放资源、政策制定、人才培养、国际合作等五个关键领域。5G+AI 将成为支撑川普承诺‚再次让美国变得伟大‛的关键。

人工智能深度研究——系统平台战略篇

B、技术变革促使 AI 突破应用瓶颈，推动产业应用爆发

人工智能的概念形成于 20 世纪 50 年代，诞生于1956年的达特茅斯会议。其发展阶段经历了三次浪潮:第一次是50-60年代注重逻辑推理的机器翻译时代，在此阶段机器人和智能软件开始出现;第二次是 70-80 年代依托知识积累构建模型的专家系统时代，但由于缺乏实用性行业很快又一次趋冷; 第三次是 2006 年起深度学习算法的推出，开始了重视数据、自主学习的认知智能时代。在数据、算法和计算力条件成熟的条件下，本次人工智能的爆发浪潮中技术开始真正实现落地，深入到应用层面，帮助传统行业创造切实经济效果。

人工智能深度研究——系统平台战略篇

经过六十多年的发展，人工智能已从实验室(AI in vitro)全面走向了产业与行业的应用和研发(AI in vivo)。根据 Gartner 2018年发布的人工智能技术成熟度曲线，VR/AR 等技术已逐步进入稳步爬升的光明期( Slope of Enlightement)，语音识别技术甚至已经到达实质生产的高峰期(Plateau of Productivity)。

C、资本涌入加速产业成熟，AI+、视觉、大数据等领域成为投资热点

根据《2018 世界人工智能产业发展蓝皮书》，从 2013-2018Q1 全球人工智能投融资的分布来看，投资热点主要集中在 AI+(垂直行业)、计算机视觉、大户数及数据服务和智能机器人等领域。

人工智能深度研究——系统平台战略篇

资本不断涌入，助推 AI 技术及应用进一步走向成熟:2017 年我国人工智能行业融资金额达 645 亿，融资事件达 492 起;2018 年前三季度我国 AI 发生融资事件 441 起，总金额达825亿元。据 CB Insight 数据，2017 年全球人工智能融资规模达到152.42亿美元，中国已对美国实现超越，融资规模占比 49%。资本的涌入将进一步催熟 AI 技术，加快技术在应用层的下沉。

人工智能深度研究——系统平台战略篇

D、人工智能重塑产业生态，芯片和软件平台是产业制高点

ICT 产业正在跨界和重构，传统的芯片商、运营商、设备商和互联网公司及云服务商的合作和竞争边界变得越来越模糊，设备商和云服务商巨头进入芯片领域成为普遍趋势。

AI 颠覆芯片产业格局，行业进入群雄逐鹿阶段:不同于传统通用芯片功能，AI时代，底层芯片的设计目的并非为了执行逻辑复杂的指令，而是为了实现大规模数据训练和推理。随着AI+成为普遍商业模式，人工智能已成为芯片产业最重要的增长动力，未来将加速普及渗透。芯片市场蛋糕将越做越大，拥有不同功能和定位的芯片将长期共存，百花齐放。全球 AI 芯片产业目前已初步形成五大阵营:一是传统的芯片企业转型升级做 AI 芯片,典型海外公司如 Intel，英伟达，赛灵思，高通，国内公司如杭州国芯、瑞芯微等;二是初创 AI 芯片公司，海外如SambaNova Systems、Movidius，国内如寒武纪、地平线、深鉴科技, 耐能，肇观等;三是互联网公司巨头进入 AI 芯片领域，海外如 Google、Facebook，Amazon 等，国内包括阿里巴巴、百度等;四是传统的 ICT(Information and Communication Technology)巨头进入AI领域，海外如 IBM，国内如华为;五是中国独有的产业生态，即从矿机芯片向 AI 芯片进行转型，典型的如比特大陆、嘉楠耘智等。

人工智能深度研究——系统平台战略篇

人工智能的软件技术平台将是巨头的必争之地:人工智能平台被认为是AI领域的‚下一代操作系统‛，这一领域将成为 Google、微软、 Facebook、 Amazon 等大玩家的竞争重点。Google 推出了 TensorFlow 跨平台深度学习架构，能够实现云端大规模学习到终端多平台部署的无缝衔接; Microsoft 推出的 CNTK 支持对常用深度神经网络架构的结构性执行，比如卷积神经网络 (CNNs)，循环神经网络 (RNNs )和长短期记忆网络(LSTMs)，同时支持多个计算设备以及多个 GPU 的计算;此外 Amazon, Facebook，阿里，腾讯等均已推出了自己的 AI 软件平台。我们认为，人工智能平台的技术壁垒高，马太效应强，且需要长期持续的的大规模研发资本投入，未来这一领域将是国际巨头间博弈。

2、AI是全新的生产要素及工具,AI+行业将成为普遍商业模

A、高数字化行业将优先实现人工智能的应用

人工智能作为全新的生产要素，将改变企业竞争及增长方式:人工智能作为全新的生产要素，将至少在三个方面推动增长:首先是智能自动化效应， AI 能够自动执行实体环境中对敏捷性及适应性要求较高的复杂任务，同时伴随大规模的重复工作能够进行自我学习以实现持续升级;第二，AI 可以补充和增强现有劳动力及资本，对其赋能，提高资源利用效率;第三，人工智能可以激发大量创新，如自动驾驶，新零售等。故人工智能未来将成为社会发展的基础设施，作为新的生产要素彻底改变企业的竞争及增长方式。据埃森哲数据，未来与 AI 深度融合的企业能够将盈利能力平均提升 38%，同时 AI 将为包括教育、制造、批发、零售等16个行业额外带来超 14 万亿美元的总附加值。

人工智能深度研究——系统平台战略篇

人工智能的应用进展取决于数字化程度，高数字化行业将优先实现应用: AI 时代是数据驱动的时代，深度学习算法的优化需要大规模数据来训练提升，数据越丰富完整，应用效果越完美。高数字化程度的行业拥有较密集数据资源，成为 AI优先落地的领域。在落地应用场景中，目前来看安防、高技术/电信业、金融、汽车等行业落地最快，医疗、零售、旅游、地产等行业较为滞后。

与以往信息化不同，AI 深入到各行各业需要深入到生产系统，与线下、本地各种场景相结合，采用云服务是必然的。ABC 融合是云服务进入 2.0 阶段的标志，行业数字化还需遵循 C—>B—>A 的路径，即先云化，再有大数据最后实现智能化。未来人工智能将成为基础设施，科技巨头将成为人工智能基础设施的提供者，普通企业拥抱人工智能的前提是先云化，实现核心业务在线才能加入人工智能的大生态圈，这将不是 IT 支出转云服务支出‚左右互搏‛的零和游戏，而是涉及未来生死存亡的抉择。

B、安防、自动驾驶是当前和未来人工智能重点应用领域

人工智能触发的产业变革，将涉及所有行业，从交通、教育、医疗到翻译、运维和自动驾驶等等。我们认为，人工智能在行业的应用进展取决于行业数字化程度，科技行业之外的应用虽然目前整体上还处于早期阶段，但在部分领域已经取得了巨大的进展。人工智能率先应用的场景，一定是有海量数据和海量计算需求的场景，安防和自动驾驶正是这样的场景之一。

AI 推动安防行业进一步升级，拓宽行业成长空间 : 受益于 AI 机器视觉技术的迅速成熟，安防行业亦逐步由‚看得见‛—‚ 看得清‛—‚看得懂‛发展，智能安防能够自行提取更多细微特征，大幅减少人力及开发成本，将原来的事后追责转变为事前预防及事中识别，大幅提升政府/企业工作效率，如 2017 年商汤科技的人脸识别在重庆落地后，相比人工效率提升200倍。安防行业从过去的模拟到数字再到高清化时代，每一次产业升级都伴随着市场需求的进一步释放。我们认为，在智能化时代，安防行业的市场边界将进一步拓宽，未来 AI+视频监控将逐步下沉至自动驾驶、智慧医疗、环境监测等下游新兴应用，市场空间将进一步拓宽。预计 2020 年我国安防行业整体规模将超过 9000 亿元。

自动驾驶是人工智能的重要落地领域:Intel 曾经预估, 由于激光雷达 (每小时可产生 36-252 Gigabyte 的影像资料)和摄像头(每小时可产生 72-144 Gigabyte 的影像资料)的大量使用, 每辆无人驾驶车每天将产生4 Terabyte or 4,000 Gigabyte 的路况原始影像资料。

目前各整车厂及科技巨头均在自动驾驶领域有所布局: 整车厂方面，奥迪 L3 级 A8 已实现量产上市;特斯拉已宣布覆盖各类驾驶场景的完全自动驾驶将于 19 年年末上市;通用汽车 18 年计划生产数千辆自动驾驶汽车用于 Lyft 出租车服务。科技巨头方面，谷歌 Waymo18 年已拿到首个商业自动驾驶打车服务执照;百度 Apollo 于 11 月与一汽共同宣布了中国首款L4级自动驾驶乘用车的量产计划。

人工智能深度研究——系统平台战略篇

华为在自动驾驶领域近期也动作频频，去年10月华为联合奥迪发布了自动驾驶方案 MDC600。利用 8 颗昇腾芯片+CPU+ISP 所组成的系统，基于昇腾自动驾驶方案的奥迪 Q7 自动驾驶汽车号称达到了 L4 水平。我们认为在L3以上的级别，自动驾驶未来的数据处理方式将从单一的自带处理单元本地处理，发展为自带处理单元和网络边缘服务器处理简单计算过程，云端处理大量复杂计算过程的模式。在自动驾驶领域，我们也将看到人工智能多场景的融合，即设备端智能(车)+边缘运算智能(MEC)+云端计算智能的统一。

3、计算机视觉、智能语音是AI时代入口，中国初创龙头企业具备全球竞争力

A、计算机视觉:AI 行业最具商业化价值的赛道

计算机视觉是国内外 AI 企业最集中的领域，商业成熟度较高:从 AI 企业的应用技术方向分布来看，计算机视觉技术企业在全球AI企业中占比约 40%，在国内占比约 46%;无论国外还是国内，计算机视觉都是 AI 企业最集中的领域。从市场规模来看，2017 年计算机视觉市场占全球 AI 市场总规模的 16.9%，排在语音识别之后;而国内计算机视觉市场占 AI 市场的 34.9%，排名第一。国内外计算机视觉的市场规模差异要远大于企业分布差异，说明国内计算机视觉公司的总体盈利能力较其他 AI 领域的公司较强，商业成熟度较高。

人工智能深度研究——系统平台战略篇

计算机视觉是 AI 领域应用场景最丰富、商业化价值最大的赛道:目前，AI 技术处理的数据类型不外乎四类:文字、语音、图像和视频。从信息维度来看，从文字到视频维度是递增的，文字的信息维度最少、包含的信息量也最少，视频的信息维度最多、包含的信息量也更大。反映在数据量占比上，以线上数据为例，根据 Cisco 的研究，到 2022 年全球线上视频流量占总流量的比例将从 2017年的 75%上升到 82%，说明线上数据将越来越被视频数据所主导。信息维度更高加之数据量更大，因此以图像和视频为主要处理对象的计算机视觉要比以文字或语音为主要处理对象的其它 AI 技术具有更加丰富的应用场景和商业化价值。我们认为，当前资本市场也正以其资源配置、资产定价功能充分反映计算机视觉相对其它AI领域的优势。例如，根据公开资料，当前计算机视觉行业四家头部初创企业(商汤、旷视、依图、云从)的总估值已经超过 1000 亿人民币，也超过了语音识别行业几家头部初创企业( 思必驰、云知声、出门问问、图灵机器人、捷通华声)总估值加上 A 股 AI 语音龙头科大讯飞的市值总和。

科技巨头把控基础层，初创企业领跑应用层:计算机视觉架构从下至上:1) 基础层——核心芯片被 Intel、Nvidia 等传统芯片厂商把控，新型芯片厂商尚未崛起，规模应用有待时日;开源平台以谷歌的 Tensorflow、Facebook 的Caffe等为主，其他企业的深度学习框架多为二次开发;2)技术层—— 算法，初创企业占优;云计算，几乎被亚马逊的 AWS、谷歌的 Cloud、微软的Azure、阿里云等垄断;3)应用层——垂直行业龙头占据场景，技术层初创企业向上渗透。根据 IDC 的统计，2017 年中国计算机应用市场商汤、旷视、依图、云从等算法及软件解决方案公司‚ 四小龙 ‛总体市场份额达 69.4%，其中商汤市场份额20.6%排名第一。

人工智能深度研究——系统平台战略篇

国内以安防、金融、互联网为主 vs. 国外消费、机器人(及机器视觉)、智能驾驶领先:根据 IDC 的市场跟踪，2018 年中国计算机视觉技术输出规模最大的 3个行业是政府、金融和互联网，最大的两个场景为政府行业中的平安城市以及金融行业中基于人脸识别的身份认证。而根据Tractica的预测，2018 年全球计算机视觉技术输出规模最大的 3 个行业分别为消费、机器人(及机器视觉)以及智能驾驶。我们认为，造成国内外市场结构巨大差异的原因，主要是政府对市场的干预程度。政府的干预体现在两个方面: 1)政府作为市场玩家之一参与市场的深度。在国内，基于公共安防效率及成本方面的考虑，政府成为最早和最积极采用计算机视觉产品的市场玩家之一。由于安防行业商业成熟度高、实际买单方(政府) 信用和购买力好、图像及视频数据多，因而计算机视觉最容易落地。2)政府作为监管者出台相关政策干预市场的强度。在欧美，生物特征作为关键的个人信息，在被科技公司收集和使用时受到法律法规的严格保护。例如，去年 5 月 25 日，欧盟史上适用范围最广、定则条例最严、处罚金额最昂贵的数据保护法案 GDPR 生效，该法案将指纹、人脸、视网膜等信息全部纳入个人资产范畴，对科技公司利用上述信息盈利进行了严格规定和限制。因此，欧美计算机视觉的主要落地方向多为对个人隐私保护要求较低的行业。政策因素(如实名制、反洗钱等)也是导致国内金融业主动拥抱计算机视觉技术的主要原因。

人工智能深度研究——系统平台战略篇

B、中短期核心竞争壁垒是技术和产品能力，长期是生态构建能力

在这里技术能力是指企业算法的设计能力、迭代速度等，产品能力是指企业技术的落地能力。中短期来看，包括人脸识别、人体识别、图像识别等在内的主要计算机视觉技术的研发将保持基于使用神经网络的深度学习算法，而神经网络的种类选择、结构设计以及参数调整等是一连串极其复杂的工作，因此算法的优劣和迭代速度将直接取决于算法设计人员的知识和经验储备，也会进一步决定计算机视觉技术的准确率、可靠性等关键性能。此外，计算机视觉技术在场景中落地时需要企业具备大量的除算法以外的know how，例如在软硬件结合以及保护终端用户隐私上的知识和经验。现阶段，掌握技术的 AI 人才(尤其是顶级人才)主要分布在高校及科研院所，产业内的人才供应不足，加之多数场景下计算机视觉的落地能力不足，技术( 人才)的争夺与产品(落地能力)的竞争将决定企业的发展速度。

技术层面，随着自动机器学习技术 AutoML 的出现，机器学习模型的设计门槛随之降低。AutoML 的出发点是用强大的算力通过更多次的训练提高模型的准确度，其最大特点是将机器学习模型的设计过程自动化。算法设计人员只需了解模型的基本概念并提供标签数据即可，神经网络的参数及结构调整是自动完成的，无需人工干预。目前 AutoML 已经进入落地阶段。去年 1 月谷歌发布了提供自定义图像识别系统自动开发服务的 Cloud AutoML Vision，用户从导入数据到训练模型都可以通过拖放式界面完成。AutoML 已经被谷歌应用于 CIFAR-10 高度基准测试数据集，并且训练出了与手工设计不相上下的模型。我们认为，随着 AutoML 技术的成熟，算法设计的门槛将越来越低，但是相应的，算力的重要性会越来越明显，长期来看有可能成为计算机视觉企业的核心竞争力之一。

人工智能深度研究——系统平台战略篇

产品层面，我们认为，随着竞争的加剧，成功的企业不仅要具备大量的跟技术落地相关的 know how，还必须能够主动地去挖掘甚至创造客户的需求，具备类似苹果在智能手机上的理解力。这就要求企业在纵向上能够主导整个产业链，横向上能够接入更多开发者和场景，因此长期看生态构建能力将成为主要竞争壁垒。

C、头部算法企业横向建立平台，垂直领域龙头纵向深耕行业，科技巨头立体式打造全产业生态。

头部算法企业的布局是横向拓展基础技术，建立基础平台。例如，商汤以人脸识别技术起家，逐渐拓展到人体分析、机器人、无人驾驶等领域，加上 GPU 超算中心和云计算平台，逐渐将自身打造成一个基础的人工智能平台，然后探索在应用端的迅速落地。

垂直领域龙头公司的布局是纵向打通计算机视觉框架，深耕所在行业。例如，安防设备龙头海康威视逐渐脱离了与初创算法企业的合作，自主研发关键技术，并在 ILSVRC(2016)图像分类获得第一名;此外，还推出了 AI Cloud 平台，着力解决算力问题，而大华积极投资其基础层边缘运算芯片的研发。通过纵向打通基础层、技术层和应用层，垂直领域龙头公司可以提出更加智能的行业解决方案。

科技巨头公司的布局是以平台为核心立体式地推进，打造全产业生态。例如，Google 以 TensorFlow 及 Google Cloud 为核心，横向上进军图像分析、文字识别等技术，推出Google Lens 等视觉服务产品;纵向上向下拓展基础硬件推出 TPU 张量处理器 1，2，3 芯片，向上拓展医疗(Verily)、无人驾驶(Waymo)等垂直领域，逐渐打造包括计算机视觉在内的人工智能大生态。

D、智能语音:产业进入爆发期，看好对话式人工智能发展

智能语音技术逐渐成熟，未来几年市场将维持高速增长:根据 Gartner 发布的 2018 年 AI 技术成熟度曲线，语音识别已经进入‚实质生产高峰期‛。此外，像自然语言处理、虚拟助理等相关智能语音技术历经淘洗之后即将落入‚泡沫化低谷期‛，商业模式越来越成熟，也将进一步推动智能语音的落地。根据 ReportLinker 的预测，全球智能语音市场规模将从 2018 年的 75 亿美元增长至 2024 年的 215 亿美元，其中医疗健康、移动银行以及智能终端智能语音技术快速增长的需求将成为主要的驱动因素。

国内外市场均已相对集中，头部企业占据大部分市场份额:根据中商产业研究院的数据，2018 年智能语音全球市场 CR5 达到 88%，中国市场 CR5 达到 84.6%，均已呈现出相对较为集中的市场格局。值得注意的是，国内的市场格局与国外存在着明显的差异，主导国外市场的巨头玩家如Nuance、谷歌等并没有在中国市场取得同样的市场地位。我们认为，这种现象主要是由两方面原因造成的:一是由于中文与外语在分词及句法的逻辑等方面有着明显的不同，并且中国有大量独具特色的方言，这种语言上的差异使得国内企业在中文处理上独具优势;二是受益于国内互联网和移动互联网的高速发展，智能语音在国内具有更加丰富的落地场景和商业化环境。这种‚天时‛、‚地利‛的优势使得中国企业领跑国内市场。

现阶段，产品化能力是智能语音初创企业的核心壁垒:一方面，从技术的角度，在无噪音环境下，机器的语音识别准确率已经达到相当高水平，未来上升空间有限。科研界将错词率(Word Error Rate, WER)视为衡量语音识别技术的核心指标(准确率=1-WER)，其中人类的平均 WER 为 5.9% (即 94.1%的准确率)，受过严格专业训练的速记员平均 WER 为 3%(即 97%的准确率)。自 2016 年机器的语音识别准确率首次超过人类平均水平以来，目前最好的算法已经可以将准确率做到 97.03%，超越专业速记员。另一方面，从商业化角度，技术难以成为企业核心壁垒，产品化能力才是成长的关键。这是因为技术的门槛越来越低，单纯依靠提供技术的商业模式将面临越来越大的竞争因而难以持续，这一点从近几年头部智能语音初创企业如云知声、思必驰等纷纷从技术提供商转向产品/服务提供商就可以看出。

技术全栈化已经成为新的趋势，产业链延伸是当前最好的策略: 对于智能语音而言，多数场景下普遍存在的问题是落地体验不好，而这带来了技术上和产业上的两层影响: 技术上，落地体验的改善有赖于从硬件到软件、从算法到产品各个环节的紧密协调，在这种情况下，头部企业多倾向于走技术全栈化路线，即打通全链条上的技术环节;产业上，为了实现更好地商业化，企业倾向于通过上下游延伸创造更多价值。最能说明上述两个趋势的例证是当前几乎所有的头部初创企业都在布局专用语音芯片，主要原因是专用语音芯片的应用性能可以达到通用芯片的 40-50 倍，而同时成本只有通用芯片的 1/4-1/3。

对话式人工智能即将规模化落地，看好智能家居、随身设备、智能车载三个场景: 与一般的智能语音应用相比，对话式人工智能中人与机器之间是双向交互的，机器在追求理解人的意图的同时也会给人以反馈(比如要求人进一步明确意图或者给出选择等)。对话式人工智能的整个人机交互过程可分为唤醒、识别、理解、反馈四个环节。我们认为对话式人工智能将率先在智能家居、随身设备、智能车载三个场景中实现大规模落地，原因是: 1)上述三个场景作为家庭IoT、个人 IoT 以及车联网的重要入口，是头部企业争夺的重点，例如亚马逊的 Echo、谷歌的 Assistant, 苹果的 Siri、思必驰的飞歌GS2正是分别瞄准上述场景;2)上述三个场景对智能语音技术的要求相对较低，例如智能家居和智能车载都是在相对封闭的环境，语音唤醒成功率和语音识别的准确率会相对较高;3)在这三个场景里C端用户对交互式人工智能的接受程度较高，IDC 调研数据显示 89%的人有意向在未来两年内采用对话式人工智能终端。另外，根据IDC预测，到 2020 年中国对话式人工智能在上述三个关键领域的渗透率将分别达到 27%、68%、51%。

市场玩家的布局: 通用平台商打造开放语音生态，专业应用商抢占重点赛道: 智能语音市场玩家大体上可以分为两种，一种是通用平台商，另一种是专业应用商。通用平台商如谷歌、百度等科技巨头，致力于围绕智能语音开放系统打造智能语音生态。以百度为例，公司在2017 年全面开放了语音接口，目前依托 DuerOS 打造出较为完整的技术、开发与商业生态系统，截至 2018 年 7 月底搭载 DuerOS 的智能设备激活数量已突破 1 亿台。专业应用商以垂直领域和细分场景为突破口，均有重点布局的赛道。例如，云知声重点布局家居、车载与医疗，思必驰重点布局家居、车载与机器人，两者多有重合但侧重也有差异。

4. 领先初创企业介绍:商汤、旷视、依图、云从、云知声

A、商汤:AI 算法提供商龙头，平台化战略赋能公司和行业

AI 算法提供商龙头，‚1+1+X‛打造核心平台:公司成立于 2014 年，创始人为香港中文大学工程学院教授汤晓鸥，业务聚焦于计算机视觉和深度学习领域，拥有 2200 位员工，其中约 150 位拥有世界顶级大学博士学位。2018年 9 月，公司被科技部选为‚智能视觉‛国家新一代人工智能开放创新平台建设依托单位。公司采取平台化战略，主要的业务模式是首先进行前期基础技术研究，然后结合当前行业应用热点生成相关产品和服务，最后进行营销和推广，即‚1(基础研发)+1(产品和服务化)+X(行业应用)‛打法。当前公司战略推进顺利，去年5月 31 日公司公告表示 2017 年已实现全面盈利，业务营收连续三年保持400%同比增长，2018 年主营业务合同收入同比增长10多倍。

内生+外延，围绕计算机视觉展开全方位布局:公司通过内生和外延不断拓展技术和业务边界，提前进行产业布局。内生上，公司以人脸识别技术起家，当前核心技术已覆盖人脸、人体、图像、视频、SLAM 与3D、机器人、无人驾驶等多领域计算机视觉技术，并且仍在不断横向拓展，进而衍生出智能视频、身份验证、移动互联网、智慧商业等多类产品和服务，覆盖智慧城市、智能终端、互联网娱乐、智慧金融、智慧商业、遥感、移动运营商、无人驾驶、AR/VR 等多个应用场景。外延上，公司通过成立投资部门通过直投或者产业基金方式向下游延伸布局新应用和新场景，投资标的以在垂直领域已建立起行业场景、占据一定地位或者已具备一定行业认知及客户资源但技术和产品尚不成熟的初创企业为主，例如医疗健康领域的AI 初创企业禾连健康、VR 看房企业51VR 等。

人工智能深度研究——系统平台战略篇

算法储备丰富、算力供应充沛，长期发展具有深厚底蕴:根据公开资料统计，公司 2015-2017 年在三大顶级计算机视觉会议(CPVR、ICCV 及 ECCV)上共发表了 119 篇论文，内容涵盖深度学习、无人驾驶、物体检测等诸多领域，数量上仅次于微软和 CMU，远领先于国内其他企业。 2018 年，公司以 81 篇 CVPR 和 ECCV 论文创下中国 AI 学术新纪录，展示出越来越强的学术研究能力，也说明公司在算法领域有着丰富的储备。此外，公司自主研发了支持千亿级参数模型、百亿训练样板、亿级类别分类任务的深度学习框架 Parrots，以及拥有超过 6000 块 GPU 并支持千卡并行训练的亚洲最大超算中心，算力供应充沛，保证了模型可以得到快速验证。我们认为，公司重视基础研究，强调技术原创，在算法、算力上都能充分保障自身技术顺畅迭代，长期发展具有深厚底蕴。

人工智能深度研究——系统平台战略篇

B、旷视:优秀的人脸识别平台企业，战略进军 IoT

人脸识别先行者，软硬件结合深入垂直场景: 公司早于‚四小龙‛其它三家公司成立，三位联合创始人印奇、唐文斌、杨沐均毕业于清华姚班，当前拥有约 1500 名员工。公司早期业务以开发 C 端人脸识别相关互联网应用为主，后转向提供 B 端计算机视觉相关产品和服务，旗下 Face++是当前世界上使用量最大的人脸识别引擎。公司主要的业务模式是基于核心计算机视觉技术，深入垂直场景提供行业解决方案。目前，公司旗下的 Face++是目前，相关产品和服务已经广泛应用于金融、安防、手机等多个领域，拥有包括阿里、蚂蚁金服、富士康等在内的上千家核心客户。公开信息显示，依靠多领域的业务落地，公司近年来实现了 5 至 7 倍的营收增长，2017 年已实现盈利，主要收入来自于金融和安防。

战略进军AIoT，打造个人、城市、供应链‚大脑‛: 2019 年1 月16 日，公司公布了从AI 到AIoT 的全新战略，战略定位从算法提供商全面升级为AIoT 解决方案提供商，并推出了智能供应链操作系统‚河图‛。根据我们的梳理，公司目前个人生活大脑、智慧城市大脑、智能供应链大脑三大‚大脑‛场景业务群，其中:个人生活大脑以连接个人终端为主，聚焦于为C 端用户提供人脸解锁、人脸支付等服务，应用场景包括手机解锁、身份验核等;智慧城市大脑以连接城市摄像终端为主，聚焦于为G 端客户提供智能门禁、智能迎宾等产品/服务，应用场景包括智慧社区、教育管理等; 供应链大脑以连接工业机器人为主，聚焦于为B 端客户提供‚货到人‛、‚订单到人 ‛等解决方案，应用场景包括智能工厂、智能仓储、新零售等。近两年公司在外延方面表现活跃，先后投资了机器人、娱乐、零售等多个领域的初创企业，业务布局持续延伸。

强大的软硬件结合能力以及‚阿里系‛背景是公司核心差异化优势:公司自 2015 年起涉足硬件，陆续推出了摄像头、人脸识别面板机、人证核验一体机、服务器、搬运机器人等十余款软硬件结合产品，在初创企业中处于绝对领先地位。我们认为，从算法到产品/ 服务有天然隔阂，优秀的算法并不能保证优秀的产品。公司的历史发展表明其具有强大的软硬件结合能力，能够保障其技术端领先优势在产品端的延续。我们认为，软硬件一体化是打造商业闭环的必要条件，仅依靠算法无法满足行业客户的整体需求，安防行业内 AI 算法提供商可以获得部分项目机会但始终无法撼动安防设备龙头的地位即是最明显的例证。此外，公司还是‚四小龙‛中唯一一家两次获得‚ 阿里系‛投资的企业，我们判断公司是阿里在计算机视觉领域选定的战略抓手，未来‚阿里系‛可能会有更多资源注入，从支付宝、滴滴、天猫超市等‚阿里系‛公司相继采用公司产品来看也能部分验证该想法。我们认为，公司软硬件结合能力突出，保障了技术端优势在产品端的延续，具备打造商业闭环的潜力;同时，公司背靠股东‚阿里系‛，在金融、出行等多个领域有望被注入更多资源，有较强的盈利支撑，因此具备极大竞争优势。

C、依图:注重实战，业务聚焦于安防和医疗

实战型 AI 公司，善于从行业里寻找研究课题:公司成立于 2012 年，创始人为 ULCA统计学博士朱珑及前阿里资深云计算专家林晨曦，当前拥有约 700 名员工。公司与‚四小龙‛中其他几家企业最大的不同点是其技术并非来自创始团队的科研成果转化，而是从零开始，先选择行业，然后针对企业需求进行课题研究。基于这种打法，公司于 2013 年为苏州公安开发了车辆识别系统，将套牌车的识别率从不足 30%提高到 90%，在初战告捷后又推出了人脸识别系统并同样取得成功，吸引了公安客户。我们认为，公司的这种基因和业务模式决定了其更加注重实战，也意味着具有更强的行业痛点挖掘能力。

业务聚焦于安防和医疗，积极布局智慧金融:公司的战略是深耕行业、深挖痛点，业务聚焦于安防和医疗两个行业:安防领域，公司的主要产品为‚蜻蜓眼 ‛系列，包括蜻蜓眼人像大平台和蜻蜓眼车辆大平台，目前已在全国二十多个省份、上百个地市公安系统以及海关总署、中国边检等得以应用;医疗领域，公司的主要产品为care.ai 系列，深入疾病预防、检查、诊断、治疗和科研等各个环节，目前已落地全国100 多家三甲医院。除安防和医疗外，2015 年公司通过为招商银行提供人脸识别技术切入金融领域，相继提出了、远程核身、刷脸取款、智能网点等多个解决方案，客户以银行和互联网金融公司为主。此外，公司还通过外延方式进一步布局，除继续深化在医疗领域的布局外，还投资了芯片初创企业ThinkForce，展示了进军芯片的意图。

先发优势明显，实战指标领先:公司是最早进入智能安防领域的AI 企业之一，2014 年起即已实现智能安防产品的规模化落地。公司实战指标处于国内领先地位。以人脸识别的准确率为例，公司在由美国国家标准局NIST 组织的人脸识别供应商测试FRVT(2018)最新报告中综合排名世界第一，在相同误报率下漏报率是商汤的30%-45%。不同于由学术机构组织的人脸识别竞赛，FRVT 更贴近安防实战，测试集来自美国国土安全局真实业务场景，数据更加复杂和多样，因此参赛者的成绩很大程度上可以代表其实战水平。我们认为，公司实战指标之所以领先，是由于其人脸识别产品较早实现了规模化落地，因而在使用真实场景数据改善算法方面具有先发优势，这对其技术进步起到了巨大的推动作用。

D、云从:AI 国家队，银行、机场人脸识别产品第一大供应商

公司是银行和机场人脸识别产品第一大供应商:公司成立于 2015 年，创始人是 UIUC 博士、中科院‚百人计划‛人选周曦，当前拥有员工400余人。公司聚焦于计算机视觉技术，产品以人脸识别、文字识别、活体检测为主，应用方向集中在金融、交通、安防三大行业，目前是国内银行和机场人脸识别产品的第一大供应商:在银行领域，截至2018年 3 月，在 121 家已完成招标、具备自建系统能力的银行中，公司中标了包括四大行之内的 88 家总行平台，市场占有率高达72.7%;在机场领域，截至2018年 7 月，已有 54 家机场选择公司产品，覆盖全国75%的枢纽机场。

公司深耕三大行业，布局智慧商业:公司的业务布局思路为在金融、交通、安防三大行业内深挖应用场景，同时通过合作布局商业。例如，在金融行业，公司积极拓展非银机构，向杭州消费金融、分期 GO 等互联网金融公司提供实名认证等服务; 在交通行业，与中国民航管理干部学院共同成立智慧民航联合研究中心引领机场智慧化等等。在商业领域，公司中标中国电信生物识别平台项目，将联手电信实现全网实名制，杜绝电信诈骗。‚国家队‛背景有助于公司拓展安全敏感行业。公司是孵化于中科院重庆研究院的高科技企业，股东名单中有多只国家战略投资基金，是‚ 四小龙 ‛中唯一没有外资入股的企业。此外，公司还是唯一一家参与人脸识别国标、部标、行标制定的研发企业，并且承担了发改委牵头的国家人工智能基础平台重大项目。我们认为，上述事实给公司贴上了‚国家队‛的标签，在国内核心技术自主可控的大趋势下，公司的‚国家队‛背景有助于其在安全敏感行业的拓展。

E、云知声:云端芯战略，重点布局家居、车载及医疗三大领域

公司是优秀的智能语音专业应用提供商，多个垂直领域市场地位领先:公司成立于 2012年，发展至今历经三个阶段:第一个阶段为以发育云端语音识别能力为主，通过开放语音平台吸引了近一万家企业客户接入; 第二个阶段定位做 AIoT，开始在‘端’上发力，探索技术的产品化，例如与乐视合作推出可以进行远距离自然语言交互的乐视第三代 TV;第三个阶段场景落地阶段，通过为家电厂商美的、汽车厂商上海通用、公立医院北京协和等提供智能语音解决方案，落地智能家居、智能车载、智能医疗等场景。公司官网显示，公司目前的合作伙伴已经超过 2 万家，覆盖用户达 2 亿，其中开放语音云覆盖的城市超过 470 个，覆盖设备超过 9000 万台。此外，公开资料显示，在智慧教育领域，公司的教育评测平台的高峰调用量达到每天 3 亿次;在智能车载领域，已经落地 30 多个车型;在智慧医疗领域，已与 500 多家医院达成合作，均处于同行业领先地位。

云端芯全产业链布局，重点经营家居、车载、医疗三大领域，抢占教育、机器人赛道:公司2014 年正式定位做AIoT服务商，确立了‚云端芯‛战略，即将基于云端的智能语音技术与终端设备和芯片紧密联合，通过云端提供服务、设备端实现算法、芯片提供算力的全栈方式打造生态闭环。公司近一年在芯片端的发力迹象比较明显，于2018 年5 月制定了UniOne 系列芯片计划，并推出了面向智能家居和智能音箱的第一代芯片‚雨燕 ‛，同时计划于2019 年和2020 年推出面向智能车载领域的第二代芯片‚雪豹‛和面向智慧城市的第三代芯片‚旗鱼。

公司重点经营家居、车载以医疗三大领域:家居领域，面向家电厂商推出了UniHome 智能语音解决方案芯片;车载领域，面向车联网产品开发商以及整车厂商推出了UniCar‚云端芯‛一体化解决方案;医疗领域，面向医生推出了智能语音录入软硬件一体化解决方案。除上述三大领域外，公司还积极抢占教育和机器人赛道: 教育领域，推出了面向教育机构的智能语音评测系统;机器人领域，推出了软硬件一体的行业服务机器人和面向儿童早教的UniToy 机器人解决方案，此外还有面向客服的SaaS 模式的SAMANTHA 智能电话机器人。

人才优势、先发优势铸就公司核心竞争力: 根据IDC 的调研，对话式人工智能落地面临的两个最大问题是人才及落地案例的缺乏。公司的核心团队来自IBM、摩根大通、中科院、剑桥等全球顶尖公司和院校，人工智能研究院研究员中博士占比超过45%，产品和运营团队来自Nuance、阿里巴巴等国内外知名公司，人才优势明显;另外，公司较早进入家居、车载、医疗领域，在跟B 端企业合作上以及终端用户需求的理解和隐私保护等方面都具备较多know how，后进者难以在短时间内完成追赶。我们认为，人才优势结合先发优势助力公司在场景拓展和深耕上都具备极大竞争优势，看好公司发展。