人工智能深度研究——系统平台战略篇
温馨提示:如需原文档,可在PC端登陆未来智库官网(www.vzkoo.com)搜索下载本“人工智能深度研究”。
1、 政策 、技术、资本三轮驱动
A、 全球主要国家均将人工智能作为未来主导性战略,美中领跑
美 中暂时领 先,中国 在人工智 能领域强 在应用层 ,基础和 技术层是 相对短 板。全球已有超 22 个国家发布 AI 计划,2017 年与 AI 相关的 VC 投资达 140 亿美元。美国 和中国在 人工智能 领域处于 领先位置 ,根据腾 讯研究院 的统计, 全球人工智能企业总数达到2542家,其中美国拥有 1078 家,占 42%;中国 其次,拥有 592 家,占据 23%。其余 872 家企业分布在瑞典、新加坡、日本、 英国、澳大利 亚、以色 列、印度 等国家。 从中美两 国在人工 智能版图 的产业布 局看,中国在基础层(计算硬件及基础设施,核心为处理器、AI 芯片和底层系 统、数据等) 和技术层(算法理 论、开发 平台和应 用技术, 包括开源 框架、自 然语言处理、计算机视觉与图像等)与美国差距巨大,在应用层(AI 向各传统 行业的渗透, 包括机器 学习应用 、智能无 人机、智 能机器人 、自动驾 驶辅助驾 驶、语音识别等)则与美国平分秋色。
美国在基础层和技术层的 AI 企业数量约为中国的两倍,在应用层两国公司 无论是数量还 是融资金 额差距较 小。这说 明在人工 智能领域 ,中美两 国延续了 在互联网时代 的竞争格 局和发展 路线,即 美国的产 业发展从 底层技术 开始再向 上游应用拓展 ,而中国 则开始更 多在应用 侧进行创 新,逐步 向底层技 术进行渗 透。美国 AI创业公司中排名前三的领域分别为自然语言处理、机器学习应用以 及计算机视觉与图像;中国 AI 创业公司中排名前三的领域分别为计算机视觉与 图像、智能机器人以及自然 语言处理。在基础 和技术层的处理器/ 芯片,技术平 台领域中国与美国存在巨大差距。
人工智能上升至中国国家战略层面,行业发展全面加速:2017 年 7 月, 国务院印发《新一代人工智能发展规划的通知》,首次从国家战略层面对人 工智能进行了系统布局,规划提到至 2030 年,人工智能行业将在中国产 生 10 兆的产业带动效益;2017 年 10 月,人工智能写入十九大报告;17 年 12 月,《促进新一代人工智能产业发展三年行动计划(2018-2020 年)》; 18 年 3 月,人工智能再次被写入政府工作报告。政策密集出台,行业已进 入发展黄金阶段。
5G+AI 是特朗普政府让美国再次伟大的关键:美国希望在人工智能领域延 续移动互联网时代领先优势,在5G领域重新抢占制高点。 2019 年 2 月, 美国总统 特朗普签 署行政 命令, 正式启 动美国人 工智能 计划, 这是美 国政 府首次推 出国家层 面的人 工智能 促进计 划。美国 人工智 能计划 包括研 发领 域、开放资源、政策制定、人才培养、国际合作等五个关键领域。5G+AI 将成为支撑川普承诺‚再次让美国变得伟大‛的关键。
B、技术变革促使 AI 突破应用瓶颈,推动产业应用爆发
人工智能的概念形成于 20 世纪 50 年代,诞生于1956年的达特茅斯会议。 其发展阶段经历了三次浪潮:第一次是50-60年代注重逻辑推理的机器翻译时 代,在此阶段机器人和智能软件开始出现;第二次是 70-80 年代依托知识积累 构建模型的专 家系统时 代,但由 于缺乏实 用性行业 很快又一 次趋冷; 第三次是 2006 年起深度学习算法的推出,开始了重视数据、自主学习的认知智能时代。 在数据、算法 和计算力 条件成熟 的条件下 ,本次人 工智能的 爆发浪潮 中技术开 始真正实现落地,深入到应用层面,帮助传统行业创造切实经济效果。
经过六十多年的发展,人工智能已从实验室(AI in vitro)全面走向了产业 与行业的应用和研发(AI in vivo)。根据 Gartner 2018年发布的人工智能技术 成熟度曲线,VR/AR 等技术已 逐步进入稳步爬升的光明期( Slope of Enlightement),语音识别技术甚至已经到达实质生产的高峰期(Plateau of Productivity)。
C、 资 本 涌入加速 产业成熟,AI+、 视觉、大数据等 领域成为投资热点
根据《2018 世界人工智能产业发展蓝皮书》,从 2013-2018Q1 全球人工智 能投融资的分布来看,投资热点主要集中在 AI+(垂直行业)、计算机视觉、大 户数及数据服务和智能机器人等领域。
资本不断涌入,助推 AI 技术及应用进一步走向成熟:2017 年我国人工智 能行业融资金额达 645 亿,融资事件达 492 起;2018 年前三季度我国 AI 发生融资事件 441 起,总金额达825亿元。据 CB Insight 数据,2017 年 全球人工智能融资规模达到152.42亿美元,中国已对美国实现超越,融资规模占比 49%。资本的涌入将进一步催熟 AI 技术,加快技术在应用层 的下沉。
D、 人 工 智能重塑 产业生态,芯片和软件平台是产业制 高点
ICT 产业正在跨界和重构,传统的芯片商、运营商、设备商和互联网公司 及云服务商的 合作和竞 争边界变 得越来越 模糊,设 备商和云 服务商巨 头进入芯 片领域成为普遍趋势。
AI 颠覆芯片产业格局,行业进入群雄逐鹿阶段:不同于传统通用芯片功能,AI时代,底层芯片的设计目的并非为了执行逻辑复杂的指令,而是为了实 现大规模数据训练和推理。随着AI+成为普遍商业模式,人工智能已成为 芯片产业最重 要的增长 动力,未 来将加速 普及渗透 。芯片市 场蛋糕将 越做 越大,拥有不同功能和定位的芯片将长期共存,百花齐放。全球 AI 芯片产 业目前已初步形成五大阵营:一是传统的芯片企业转型升级做 AI 芯片,典 型海外公司如 Intel,英伟达,赛灵思,高通,国内公司如杭州国芯、瑞芯 微等;二是初创 AI 芯片公司,海外如SambaNova Systems、Movidius, 国内如寒武纪、地平线、深鉴科技, 耐能,肇观等;三是互联网公司巨头 进入 AI 芯片领域,海外如 Google、Facebook,Amazon 等,国内包括阿 里巴巴、百度等;四是传统的 ICT(Information and Communication Technology)巨头进入AI领域,海外如 IBM,国内如华为;五是中国独有 的产业生态,即从矿机芯片向 AI 芯片进行转型,典型的如比特大陆、嘉楠 耘智等。
人工智能的软件技术平台将是巨头的必争之地:人工智能平台被认为是AI领域的‚下一代操作系统‛,这一领域将成为 Google、微软、 Facebook、 Amazon 等大玩家的竞争重点。Google 推出了 TensorFlow 跨平台深度学 习架构,能够实现云端大规模学习到终端多平台部署的无缝衔接; Microsoft 推出的 CNTK 支持对常用深度神经网络架构的结构性执行,比如 卷积神经网络 (CNNs),循环神经网络 (RNNs )和长短期记忆网络(LSTMs),同时支持多个计算设备以及多个 GPU 的计算;此外 Amazon, Facebook,阿里,腾讯等均已推出了自己的 AI 软件平台。我们认为,人 工智能平台的 技术壁垒 高,马太 效应强, 且需要长 期持续的 的大规模 研发 资本投入,未来这一领域将是国际巨头间博弈。
2、AI是全新的生产要素及工具,AI+行业将成为普遍商业模
A、 高 数 字 化行业 将优先实现人工智能的应用
人工智能作为全新的生产要素,将改变企业竞争及增长方式:人工智能作 为全新的生产 要素,将 至少在三 个方面推 动增长:首 先是智能 自动化效 应, AI 能够自动执行实体环境中对敏捷性及适应性要求较高的复杂任务,同时 伴随大规模的重复工作能够进行自我学习以实现持续升级;第二,AI 可以 补充和增强现 有劳动力 及资本, 对其赋能 ,提高资 源利用效 率;第三 ,人 工智能可以激 发大量创 新,如自 动驾驶, 新零售等 。故人工 智能未来 将成 为社会发展的 基础设施 ,作为新 的生产要 素彻底改 变企业的 竞争及增 长方 式。据埃森哲数据,未来与 AI 深度融合的企业能够将盈利能力平均提升 38%,同时 AI 将为包括教育、制造、批发、零售等16个行业额外带来超 14 万亿美元的总附加值。
人工智能的应用进展取决于数字化程度,高数字化行业将优先实现应用: AI 时代是数据驱动的时代,深度学习算法的优化需要大规模数据来训练 提升,数据越丰富完整,应用效果越完美。高数字化程度的行业拥有较 密集数据资源,成为 AI优先落地的领域。在落地应用场景中,目前来看 安防、高技 术/电信业 、金融 、汽车等 行业落地 最快,医 疗、零售 、旅游、 地产等行业较为滞后。
与以往信息化不同,AI 深入到各行各业需要深入到生产系统,与线下、本 地各种场景相结合,采用云服务是必然的。ABC 融合是云服务进入 2.0 阶段的 标志,行业数字化还需遵循 C—>B—>A 的路径,即先云化,再有大数据最后 实现智能化。 未来人工 智能将成 为基础设 施,科技 巨头将成 为人工智 能基础设 施的提供者, 普通企业 拥抱人工 智能的前 提是先云 化,实现 核心业务 在线才能 加入人工智能的大生态圈,这将不是 IT 支出转云服务支出‚左右互搏‛的零和 游戏,而是涉及未来生死存亡的抉择。
B、 安 防 、自动驾 驶是当前和未来人工智能重点应用领 域
人工智能触发 的产业变 革,将涉 及所有行 业,从交 通、教育 、医疗到 翻译、 运维和自动驾 驶等等。 我们认为 ,人工智 能在行业 的应用进 展取决于 行业数字 化程度,科技 行业之外 的应用虽 然目前整 体上还处 于早期阶 段,但在 部分领域已经取得了巨 大的进展 。人工智 能率先应 用的场景 ,一定是 有海量数 据和海量 计算需求的场景,安防和自动驾驶正是这样的场景之一。
AI 推动安防行业进一步升级,拓宽行业成长空间 : 受益于 AI 机器视觉技 术的迅速成熟 ,安防行 业亦逐步 由‚看得 见‛—‚ 看得清‛—‚看得 懂‛发展,智能安 防能够自 行提取更 多细微特 征,大幅 减少人力 及开发成 本, 将原来的事后追责转变为事 前预防及事中识别, 大幅提升政府/企业工 作效 率,如 2017 年商汤科技的人脸识别在重庆落地后,相比人工效率提升200倍。安防行业从过去的模拟到数字再到高清化时代,每一次产业升级 都伴随着市场 需求的进 一步释放 。我们认 为,在智 能化时代 ,安防行 业的 市场边界将进一步拓宽,未来 AI+视频监控将逐步下沉至自动驾驶、智慧 医疗、环境监测等下游新兴应用,市场空间将进一步拓宽。预计 2020 年 我国安防行业整体规模将超过 9000 亿元。
自动驾驶是人工智能的重要落地领域:Intel 曾经预估, 由于激光雷达 (每小 时可产生 36-252 Gigabyte 的影像资料)和摄像头(每小时可产生 72-144 Gigabyte 的影像资料)的大量使用, 每辆无人驾驶车每天将产生4 Terabyte or 4,000 Gigabyte 的路况原始影像资料。
目前各整 车厂及科 技巨头 均在自 动驾驶 领域有所 布局: 整车厂 方面, 奥迪 L3 级 A8 已实现量产上市;特斯拉已宣布覆盖各类驾驶场景的完全自动驾 驶将于 19 年年末上市;通用汽车 18 年计划生产数千辆自动驾驶汽车用于 Lyft 出租车服务。科技巨头方面,谷歌 Waymo18 年已拿到首个商业自动 驾驶打车服务执照;百度 Apollo 于 11 月与一汽共同宣布了中国首款L4级 自动驾驶乘用车的量产计划。
华为在自动驾驶领域近期也动作频频,去年10月华为联合奥迪发布了自 动驾驶方案 MDC600。利用 8 颗昇腾芯片+CPU+ISP 所组成的系统,基于昇腾 自动驾驶方案的奥迪 Q7 自动驾驶汽车号称达到了 L4 水平。我们认为在L3以 上的级别,自 动驾驶未 来的数据 处理方式 将从单一 的自带处 理单元本 地处理, 发展为自带处 理单元和 网络边缘 服务器处 理简单计 算过程, 云端处理 大量复杂 计算过程的模 式。在自 动驾驶领 域,我们 也将看到 人工智能 多场景的 融合,即 设备端智能(车)+边缘运算智能(MEC)+云端计算智能的统一。
3、计算机视觉、智能语音是AI时代入口,中国初创龙头企业具备全球竞争力
A、计算机视觉:AI 行业最具商业化价值的赛道
计算机视觉是国内外 AI 企业最集中的领域,商业成熟度较高:从 AI 企业 的应用技术方向分布来看,计算机视觉技术企业在全球AI企业中占比约 40%,在国内占比约 46%;无论国外还是国内,计算机视觉都是 AI 企业 最集中的领域。从市场规模来看,2017 年计算机视觉市场占全球 AI 市场 总规模的 16.9%,排在语音识别之后;而国内计算机视觉市场占 AI 市场的 34.9%,排名 第一 。国内 外计 算机视 觉的 市场规 模差 异要 远大于 企业 分布差异,说明国内计算机视觉公司的总体盈利能力较其他 AI 领域的公司较强, 商业成熟度较高。
计算机视觉是 AI 领域应用场景最丰富、商业化价值最大的赛道:目前,AI 技术处理 的数据类 型不外 乎四类:文字 、语音、 图像和 视频。 从信息 维度 来看,从 文字到视 频维度 是递增 的,文 字的信息 维度最 少、包 含的信 息量 也最少, 视频的信 息维度 最多、 包含的 信息量也 更大。 反映在 数据量 占比 上,以线上数据为例,根据 Cisco 的研究,到 2022 年全球线上视频流量占 总流量的比例将从 2017年的 75%上升到 82%,说明线上数据将越来越被 视频数据 所主导。 信息维 度更高 加之数 据量更大 ,因此 以图像 和视频 为主 要处理对象的计算机视觉要比以文字或语音为主要处理对象的其它 AI 技术 具有更加 丰富的应 用场景 和商业 化价值 。我们认 为,当 前资本 市场也 正以 其资源配置、资产定价功能充分反映计算机视觉相对其它AI领域的优势。 例如,根 据公开资 料,当 前计算 机视觉 行业四家 头部初 创企业(商汤 、旷 视、依图、云从)的总估值已经超过 1000 亿人民币,也超过了语音识别 行业几家 头部初创 企业( 思必驰 、云知 声、出门 问问、 图灵机 器人、 捷通华声)总估值加上 A 股 AI 语音龙头科大讯飞的市值总和。
科技巨头把控基础层,初创企业领跑应用层:计算机视觉架构从下至上:1) 基础层——核心芯片被 Intel、Nvidia 等传统芯片厂商把控,新型芯片厂商 尚未崛起,规模应用有待时日;开源平台以谷歌的 Tensorflow、Facebook 的Caffe等为主,其他企业的深度学习框架多为二次开发;2)技术层—— 算法,初创企业占优;云计算,几乎被亚马逊的 AWS、谷歌的 Cloud、微 软的Azure、阿里云等垄断;3)应用层——垂直行业龙头占据场景,技术 层初创企业向上渗透。根据 IDC 的统计,2017 年中国计算机应用市场商汤、 旷视、依 图、云从 等算法 及软件 解决方 案公司‚ 四小龙 ‛总体 市场份 额达 69.4%,其中商汤市场份额20.6%排名第一。
国内以安防、金融 、互联网为主 vs. 国外消费、机器人(及机器视觉)、 智 能驾驶领先:根据 IDC 的市场跟踪,2018 年中国计算机视觉技术输出规模 最大的 3个行业是政府、金融和互联网,最大的两个场景为政府行业中的 平安城市以及金融行业中基于人脸识别的身份认证。而根据Tractica的预 测,2018 年全球计算机视觉技术输出规模最大的 3 个行业分别为消费、机 器人(及机器视觉)以及智能驾驶。 我们认为,造成国内外市场结构巨大 差异的原因 ,主要 是政府 对市场的 干预程 度。政 府的干预 体现在 两个方 面: 1)政府作为市场玩家之一参与市场的深度。在国内,基于公共安防效 率及 成本方面 的考虑, 政府成 为最早 和最积 极采用计 算机视 觉产品 的市场 玩家 之一。由于 安防行 业商业 成熟度高 、实际 买单方(政府) 信用和 购买力 好、 图像及视频数据多,因而计算机视觉最容易落地。2)政府作为监管者 出台 相关政策 干预市场 的强度 。在欧 美,生 物特征作 为关键 的个人 信息, 在被 科技公司收集和使用时受到法律法规的严格保护。例如,去年 5 月 25 日, 欧盟史上 适用范围 最广、 定则条 例最严 、处罚金 额最昂 贵的数 据保护 法案 GDPR 生效,该法案将指纹、人脸、视网膜等信息全部纳入个人资产范畴, 对科技公 司利用上 述信息 盈利进 行了严 格规定和 限制。 因此, 欧美计 算机 视觉的主 要落地方 向多为 对个人 隐私保 护要求较 低的行 业。政 策因素(如 实名制、 反洗钱等)也是 导致国 内金融 业主动拥 抱计算 机视觉 技术的 主要 原因。
B、 中 短 期核心竞 争壁垒是技术和产品能力,长期是生 态构建能力
在这里技术 能力是指 企业算法 的设计能 力、迭代 速度等, 产品能力 是指企 业技术的落地 能力。中 短期来看 ,包括人 脸识别、 人体识别 、图像识 别等在内 的主要计算机 视觉技术 的研发将 保持基于 使用神经 网络的深 度学习算 法,而神 经网络的种类 选择、结 构设计以 及参数调 整等是一 连串极其 复杂的工 作,因此 算法的优劣和 迭代速度 将直接取 决于算法 设计人员 的知识和 经验储备 ,也会进 一步决定计算 机视觉技 术的准确 率、可靠 性等关键 性能。此 外,计算 机视觉技 术在场景中落地时需要企业具备大量的除算法以外的know how,例如在软硬 件结合以及保护终端用户隐私上的知识和经验。现阶段,掌握技术的 AI 人才(尤其是顶级 人才)主 要分布在 高校及科 研院所, 产业内的 人才供应 不足,加 之多数场景下 计算机视 觉的落地 能力不足 ,技术( 人才)的 争夺与产 品(落地 能力)的竞争将决定企业的发展速度。
技术层面,随着自动机器学习技术 AutoML 的出现,机器学习模型的设计 门槛随之降低。AutoML 的出发点是用强大的算力通过更多次的训练提高模型 的准确度,其 最大特点 是将机器 学习模型 的设计过 程自动化 。算法设 计人员只 需了解模型的 基本概念 并提供标 签数据即 可,神经 网络的参 数及结构 调整是自 动完成的,无需人工干预。目前 AutoML 已经进入落地阶段。去年 1 月谷歌发 布了提供自定义图像识别系统自动开发服务的 Cloud AutoML Vision,用户从导 入数据到训练模型都可以通过拖放式界面完成。AutoML 已经被谷歌应用于 CIFAR-10 高度基准测试数据集,并且训练出了与手工设计不相上下的模型。 我们认为,随着 AutoML 技术的成熟,算法设计的门槛将越来越低,但是相应 的,算力的重 要性会越 来越明显 ,长期来 看有可能 成为计算 机视觉企 业的核心 竞争力之一。
产品层面, 我们认为 ,随着竞 争的加剧 ,成功的 企业不仅 要具备大 量的跟 技术落地相关的 know how,还必须能够主动地去挖掘甚至创造客户的需求, 具备类似苹果 在智能手 机上的理 解力。这 就要求企 业在纵向 上能够主 导整个产 业链,横向上 能够接入 更多开发 者和场景 ,因此长 期看生态 构建能力 将成为主 要竞争壁垒。
C、头部算法企业横向建立平台,垂直领域龙头纵向深耕行业,科技巨头立体 式打造全产业生态。
头部算法企 业的布局 是横向拓 展基础技 术,建立 基础平台 。例如, 商汤以 人脸识别技术起家,逐渐拓展到人体分析、机器人、无人驾驶等领域,加上 GPU 超算中心和云计算平台,逐渐将自身打造成一个基础的人工智能平台,然 后探索在应用端的迅速落地。
垂直领域龙 头公司的 布局是纵 向打通计 算机视觉 框架,深 耕所在行 业。例 如,安防设备 龙头海康 威视逐渐 脱离了与 初创算法 企业的合 作,自主 研发关键 技术,并在 ILSVRC(2016)图像分类获得第一名;此外,还推出了 AI Cloud 平台,着力解 决算力问 题,而大 华积极投 资其基础 层边缘运 算芯片的 研发。通 过纵向打通基 础层、技 术层和应 用层,垂 直领域龙 头公司可 以提出更 加智能的 行业解决方案。
科技巨头公 司的布局 是以平台 为核心立 体式地推 进,打造 全产业生 态。例 如,Google 以 TensorFlow 及 Google Cloud 为核心,横向上进军图像分析、 文字识别等技术,推出Google Lens 等视觉服务产品;纵向上向下拓展基础硬 件推出 TPU 张量处理器 1,2,3 芯片,向上拓展医疗(Verily)、无人驾驶(Waymo)等垂直领域,逐渐打造包括计算机视觉在内的人工智能大生态。
D、 智 能 语音:产 业进入爆发期,看好对话式人工智能 发展
智能语音技术逐渐成熟,未来几年市场将维持高速增长:根据 Gartner 发 布的 2018 年 AI 技术成熟度曲线,语音识别已经进入‚实质生产高峰期‛。 此外,像 自然语言 处理、 虚拟助 理等相 关智能语 音技术 历经淘 洗之后 即将 落入‚泡沫化低谷期‛,商业模式越来越 成熟,也将进一步推动智能语 音的 落地。根据 ReportLinker 的预测,全球智能语音市场规模将从 2018 年的 75 亿美元增长至 2024 年的 215 亿美元,其中医疗健康、移动银行以及智 能终端智能语音技术快速增长的需求将成为主要的驱动因素。
国 内外市 场均已 相对集 中,头部 企业占 据大部 分市场 份额:根据中商产业 研究院的数据,2018 年智能语音全球市场 CR5 达到 88%,中国市场 CR5 达到 84.6%,均已呈现出相对较为集中的市场格局。值得注意的是,国内 的市场格局与国外存在着明显的差异,主导国外市场的巨头玩家如Nuance、谷歌等并没有在中国市场取得同样的市场地位。我们认为,这种 现象主要 是由两方 面原因 造成的:一是 由于中文 与外语 在分词 及句法 的逻 辑等方面 有着明显 的不同 ,并且 中国有 大量独具 特色的 方言, 这种语 言上 的差异使 得国内企 业在中 文处理 上独具 优势;二 是受益 于国内 互联网 和移 动互联网 的高速发 展,智 能语音 在国内 具有更加 丰富的 落地场 景和商 业化 环境。这种‚天时‛、‚地利‛的优势使得中国企业领跑国内市场。
现 阶段, 产品化 能力是 智能语 音初创企 业的核 心壁垒:一方面,从技 术的 角度,在 无噪音环 境下, 机器的 语音识 别准确率 已经达 到相当 高水平 ,未 来上升空间有限。科研界将错词率(Word Error Rate, WER)视为衡量语 音识别技术的核心指标(准确率=1-WER),其中人类的平均 WER 为 5.9% (即 94.1%的准确率),受过严格专业训练的速记员平均 WER 为 3%(即 97%的准确率)。自 2016 年机器的语音识别准确率首次超过人类平均水平 以来,目前最好的算法已经可以将准确率做到 97.03%,超越专业速记员。 另一方面 ,从商业 化角度 ,技术 难以成 为企业核 心壁垒 ,产品 化能力 才是 成长的关 键。这是 因为技 术的门 槛越来 越低,单 纯依靠 提供技 术的商 业模 式将面临 越来越大 的竞争 因而难 以持续 ,这一点 从近几 年头部 智能语 音初 创企业如云知声、 思必驰等纷纷 从技术提供 商转向产品/服 务提供商就 可以 看出。
技 术全栈 化已经 成为新的 趋势, 产业链 延伸是 当前最 好的策略: 对于智能 语音而言 ,多数场 景下普 遍存在 的问题 是落地体 验不好 ,而这 带来了 技术 上和产业 上的两层 影响: 技术上 ,落地 体验的改 善有赖 于从硬 件到软 件、 从算法到 产品各个 环节的 紧密协 调,在 这种情况 下,头 部企业 多倾向 于走 技术全栈 化路线, 即打通 全链条 上的技 术环节;产业上 ,为了 实现更 好地 商业化, 企业倾向 于通过 上下游 延伸创 造更多价 值。最 能说明 上述两 个趋 势的例证 是当前几 乎所有 的头部 初创企 业都在布 局专用 语音芯 片,主 要原 因是专用语音芯片的应用性能可以达到通用芯片的 40-50 倍,而同时成本 只有通用芯片的 1/4-1/3。
对 话式人 工智能即 将规模 化落地 ,看好 智能家居 、随身 设备、 智能车载 三 个 场景: 与一般的智能 语音应用 相比, 对话式 人工智能 中人与 机器之 间是 双向交互 的,机器 在追求 理解人 的意图 的同时也 会给人 以反馈(比如 要求 人进一步明确意图或者给出选择等)。对 话式人工智能的整个人机交互 过程 可分为唤 醒、识别 、理解 、反馈 四个环 节。我们 认为对 话式人 工智能 将率 先在智能家 居、随 身设备 、智能车 载三个 场景中 实现大规 模落地 ,原因 是: 1)上述三个场景作为家庭IoT、个人 IoT 以及车联网的重要入口,是头部 企业争夺的重点,例如亚马逊的 Echo、谷歌的 Assistant, 苹果的 Siri、思 必驰的飞歌GS2正是分别瞄准上述场景;2)上述三个场景对智能语音技 术的要求 相对较低 ,例如 智能家 居和智 能车载都 是在相 对封闭 的环境 ,语音唤醒成功率和语音识别的准确率会相对较高;3)在这三个场景里C端 用户对交互式人工智能的接受程度较高,IDC 调研数据显示 89%的人有意 向在未来两年内采用对话式人工智能终端。另外,根据IDC预测,到 2020 年中国对话式人工智能在上述三个关键领域的渗透率将分别达到 27%、68%、51%。
市 场玩家 的布局: 通用平 台商打 造开放 语音生态 ,专业 应用商 抢占重点 赛 道: 智能语音市场玩家大 体上可 以分为 两种, 一种是通 用平台 商,另 一种 是专业应 用商。通 用平台 商如谷 歌、百 度等科技 巨头, 致力于 围绕智 能语 音开放系统打造智能语音生态。以百度为例,公司在2017 年全面开放了 语音接口,目前依托 DuerOS 打造出较为完整的技术、开发与商业生态系 统,截至 2018 年 7 月底搭载 DuerOS 的智能设备激活数量已突破 1 亿台。 专业应用商 以垂直 领域和 细分场景 为突破 口,均 有重点布 局的赛 道。例 如, 云知声重点 布局家 居、车 载与医疗 ,思必 驰重点 布局家居 、车载 与机器 人, 两者多有重合但侧重也有差异。
4. 领先初创企业介绍:商汤、旷视、依图、云从、云知声
A、商汤:AI 算法提供商龙头,平台化战略赋能公司和行业
AI 算法提供商龙头,‚1+1+X‛打造核心平台:公司成立于 2014 年,创始 人为香港 中文大学 工程学 院教授 汤晓鸥 ,业务聚 焦于计 算机视 觉和深 度学 习领域,拥有 2200 位员工,其中约 150 位拥有世界顶级大学博士学位。2018年 9 月,公司被科技部选为‚智能视觉‛国家新一代人工智能开放创 新平台建 设依托单 位。公 司采取 平台化 战略,主 要的业 务模式 是首先 进行 前期基础 技术研究 ,然后 结合当 前行业 应用热点 生成相 关产品 和服务 ,最 后进行营销和推广,即‚1(基础研发)+1(产品和服务化)+X(行业应 用)‛打法。当前公司战略推进顺利,去年5月 31 日公司公告表示 2017 年已实现全面盈利,业务营收连续三年保持400%同比增长,2018 年主营 业务合同收入同比增长10多倍。
内生+外延 ,围绕计算机视觉展 开全方位布局:公司通过内生和外延不断拓 展技术和 业务边界 ,提前 进行产 业布局 。内生上 ,公司 以人脸 识别技 术起 家,当前核心技术已覆盖人脸、人体、图像、视频、SLAM 与3D、机器人、 无人驾驶 等多领域 计算机 视觉技 术,并 且仍在不 断横向 拓展, 进而衍 生出 智能视频 、身份验 证、移 动互联 网、智 慧商业等 多类产 品和服 务,覆 盖智 慧城市、 智能终端 、互联 网娱乐 、智慧 金融、智 慧商业 、遥感 、移动 运营 商、无人驾驶、AR/VR 等多个应用场景。外延上,公司通过成立投资部门通过直投 或者产业 基金方 式向下 游延伸 布局新应 用和新 场景, 投资标 的以 在垂直领 域已建立 起行业 场景、 占据一 定地位或 者已具 备一定 行业认 知及 客户资源但技术和产品尚不成熟的初创企业为主,例如医疗健康领域的AI 初创企业禾连健康、VR 看房企业51VR 等。
算 法储备 丰富、 算力供 应充沛, 长期发 展具有 深厚底 蕴:根据公开资料统 计,公司 2015-2017 年在三大顶级计算机视觉会议(CPVR、ICCV 及 ECCV)上共发表了 119 篇论文,内容涵盖深度学习、无人驾驶、物体检 测等诸多领域,数量上仅次于微软和 CMU,远领先于国内其他企业。 2018 年,公司以 81 篇 CVPR 和 ECCV 论文创下中国 AI 学术新纪录,展 示出越来 越强的学 术研究 能力, 也说明 公司在算 法领域 有着丰 富的储 备。 此外,公 司自主研 发了支 持千亿 级参数 模型、百 亿训练 样板、 亿级类 别分 类任务的深度学习框架 Parrots,以及拥有超过 6000 块 GPU 并支持千卡 并行训练 的亚洲最 大超算 中心, 算力供 应充沛, 保证了 模型可 以得到 快速 验证。 我们认为,公司重视基础研究,强调技术原创,在算法、算力上都 能充分保障自身技术顺畅迭代,长期发展具有深厚底蕴。
B、旷视:优秀的人脸识别平台企业,战略进军 IoT
人 脸识别 先行者 ,软硬 件结合 深入垂 直场景: 公司早于‚四小龙‛其 它三 家公司成 立,三位 联合创 始人印 奇、唐 文斌、杨 沐均毕 业于清 华姚班 ,当 前拥有约 1500 名员工。公司早期业务以开发 C 端人脸识别相关互联网应 用为主,后转向提供 B 端计算机视觉相关产品和服务,旗下 Face++是当 前世界上 使用量最 大的人 脸识别 引擎。 公司主要 的业务 模式是 基于核 心计 算机视觉技 术,深 入垂直 场景提供 行业解 决方案。 目前, 公司旗 下的 Face++是目前,相关产品和服务已经广泛应用于金融、安防、手机等多个 领域,拥 有包括阿 里、蚂 蚁金服 、富士 康等在内 的上千 家核心 客户。 公开 信息显示,依靠多领域的业务落地,公司近年来实现了 5 至 7 倍的营收增 长,2017 年已实现盈利,主要收入来自于金融和安防。
战略进军AIoT,打造个 人、城市、供应链‚大脑‛: 2019 年1 月16 日, 公司公布了从AI 到AIoT 的全新战略,战略定位从算法提供商全面升级为AIoT 解决方案提供商,并推出了智能供应链操作系统‚河图‛。根据我们 的梳理,公司目前个人生活大脑、智慧城市大脑、智能供应链大脑三大‚大脑‛场景业务 群,其 中:个 人生活 大脑以连 接个人 终端为 主,聚 焦于 为C 端用户提供人脸解锁、人脸支付等服务,应用场景包括手机解锁、身 份验核等;智慧城市大脑以连接城市摄像终端为主,聚焦于为G 端客户提 供智能门禁、智能迎宾等产品/服务,应用 场景包括智慧社区、教育管理 等; 供应链大脑以连接工业机器人为主,聚焦于为B 端客户提供‚货到人‛、‚订单到人 ‛等解 决方案 ,应用场 景包括 智能工 厂、智能 仓储、 新零售 等。 近两年公 司在外延 方面表 现活跃 ,先后 投资了机 器人、 娱乐、 零售等 多个 领域的初创企业,业务布局持续延伸。
强大的软硬件结合能力以及‚阿里系‛背景是公司核心差异化优势:公司 自 2015 年起涉足硬件,陆续推出了摄像头、人脸识别面板机、人证核验 一体机、 服务器、 搬运机 器人等 十余款 软硬件结 合产品 ,在初 创企业 中处 于绝对领先地位。 我们认为,从 算法到产品/ 服务有天然隔 阂,优秀的 算法 并不能保 证优秀的 产品。 公司的 历史发 展表明其 具有强 大的软 硬件结 合能 力,能够 保障其技 术端领 先优势 在产品 端的延续 。我们 认为, 软硬件 一体 化是打造商 业闭环 的必要 条件,仅 依靠算 法无法 满足行业 客户的 整体需 求, 安防行业内 AI 算法提供商可以获得部分项目机会但始终无法撼动安防设备 龙头的地 位即是最 明显的 例证。 此外, 公司还是‚四小 龙‛中 唯一一 家两 次获得‚ 阿里系‛投资的 企业, 我们判 断公司是 阿里在 计算机 视觉领 域选 定的战略抓 手,未 来‚阿 里系‛可 能会有 更多资 源注入, 从支付 宝、滴 滴、 天猫超市 等‚阿里 系‛公 司相继 采用公 司产品来 看也能 部分验 证该想 法。 我们认为, 公司软 硬件结 合能力突 出,保 障了技 术端优势 在产品 端的延 续, 具备打造商业闭环的潜力;同时,公司背 靠股东‚阿里系‛,在金融、 出行 等多个领 域有望被 注入更 多资源 ,有较 强的盈利 支撑, 因此具 备极大 竞争 优势。
C、 依 图:注重实 战,业务聚焦于安防和医疗
实战型 AI 公司,善于从行业里寻找研究课题:公司成立于 2012 年,创始 人为 ULCA统计学博士朱珑及前阿里资深云计算专家林晨曦,当前拥有约 700 名员工。公司与‚四小龙‛中其他几家企业最大的不同点是其技术并 非来自创 始团队的 科研成 果转化 ,而是 从零开始 ,先选 择行业 ,然后 针对 企业需求进行课题研究。基于这种打法,公司于 2013 年为苏州公安开发 了车辆识别系统,将套牌车的识别率从不足 30%提高到 90%,在初战告捷后又推出 了人脸识 别系统 并同样 取得成 功,吸引 了公安 客户。 我们认 为, 公司的这 种基因和 业务模 式决定 了其更 加注重实 战,也 意味着 具有更 强的 行业痛点挖掘能力。
业 务聚焦 于安防 和医疗 ,积极 布局智 慧金融:公司的战略是深 耕行业 、深 挖痛点, 业务聚焦 于安防 和医疗 两个行 业:安防 领域, 公司的 主要产 品为‚蜻蜓眼 ‛系列, 包括蜻 蜓眼人 像大平 台和蜻蜓 眼车辆 大平台 ,目前 已在 全国二十 多个省份 、上百 个地市 公安系 统以及海 关总署 、中国 边检等 得以 应用;医疗领域,公司的主要产品为care.ai 系列,深入疾病预防、检查、 诊断、治疗和科研等各个环节,目前已落地全国100 多家三甲医院。除安 防和医疗外,2015 年公司通过为招商银行提供人脸识别技术切入金融领域, 相继提出 了、远程 核身、 刷脸取 款、智 能网点等 多个解 决方案 ,客户 以银 行和互联 网金融公 司为主 。此外 ,公司 还通过外 延方式 进一步 布局, 除继 续深化在医疗领域的布局外,还投资了芯片初创企业ThinkForce,展示了 进军芯片的意图。
先发优势明显,实 战指标领先:公司是最早进入智能安防领域的AI 企业之 一,2014 年起即已实现智能安防产品的规模化落地。公司实战指标处于国 内领先地位。以人脸识别的准确率为例,公司在由美国国家标准局NIST 组 织的人脸识别供应商测试FRVT(2018)最新报告中综合排名世界第一,在 相同误报率下漏报率是商汤的30%-45%。不同于由学术机构组织的人脸识 别竞赛,FRVT 更贴近安防实战,测试集来自美国国土安全局真实业务场景, 数据更加复 杂和多 样,因 此参赛者 的成绩 很大程 度上可以 代表其 实战水 平。 我们认为,公司实战指标之所以领先,是由于其人脸识别产品较早实现了 规模化落 地,因而 在使用 真实场 景数据 改善算法 方面具 有先发 优势, 这对 其技术进步起到了巨大的推动作用。
D、云从:AI 国家队,银行、机场人脸识别产品第一大供应商
公司是银行和机场人脸识别产品第一大供应商:公司成立于 2015 年,创 始人是 UIUC 博士、中科院‚百人计划‛人选周曦,当前拥有员工400余 人。公司 聚焦于计 算机视 觉技术 ,产品 以人脸识 别、文 字识别 、活体 检测 为主,应 用方向集 中在金 融、交 通、安 防三大行 业,目 前是国 内银行 和机 场人脸识别产品的第一大供应商:在银行领域,截至2018年 3 月,在 121 家已完成 招标、具 备自建 系统能 力的银 行中,公 司中标 了包括 四大行 之内 的 88 家总行平台,市场占有率高达72.7%;在机场领域,截至2018年 7 月,已有 54 家机场选择公司产品,覆盖全国75%的枢纽机场。
公 司深耕 三大行 业,布 局智慧 商业:公司的业务布局思 路为在金 融、交 通、 安防三大 行业内深 挖应用 场景, 同时通 过合作布 局商业 。例如 ,在金 融行 业,公司积极拓展非银机构,向杭州消费金融、分期 GO 等互联网金融公司提供实 名认证等 服务; 在交通 行业, 与中国民 航管理 干部学 院共同 成立 智慧民航 联合研究 中心引 领机场 智慧化 等等。在 商业领 域,公 司中标 中国 电信生物识别平台项目,将联手电信实现 全网实名制,杜绝电信诈骗。‚国 家队‛背 景有助于 公司拓 展安全 敏感行 业。公司 是孵化 于中科 院重庆 研究 院的高科 技企业, 股东名 单中有 多只国 家战略投 资基金 ,是‚ 四小龙 ‛中 唯一没有 外资入股 的企业 。此外 ,公司 还是唯一 一家参 与人脸 识别国 标、 部标、行标制定的研发企业,并且承担了发改委牵头的国家人工智能基础 平台重大 项目。我 们认为 ,上述 事实给 公司贴上 了‚国 家队‛的标签 ,在 国内核心 技术自主 可控的 大趋势 下,公 司的‚国 家队‛背景有 助于其 在安 全敏感行业的拓展。
E、云知声:云端芯战略,重点布局家居、车载及医疗三大领域
公司是优秀的智能语音专业应用提供商,多个垂直领域市场地位领先:公 司成立于 2012年,发展至今历经三个阶段:第一个阶段为以发育云端语 音识别能 力为主, 通过开 放语音 平台吸 引了近一 万家企 业客户 接入; 第二 个阶段定位做 AIoT,开始在‘端’上发力,探索技术的产品化,例如与乐 视合作推出可以进行远距离自然语言交互的乐视第三代 TV;第三个阶段场 景落地阶 段,通过 为家电 厂商美 的、汽 车厂商上 海通用 、公立 医院北 京协 和等提供智 能语音 解决方 案,落地 智能家 居、智 能车载、 智能医 疗等场 景。 公司官网显示,公司目前的合作伙伴已经超过 2 万家,覆盖用户达 2 亿, 其中开放语音云覆盖的城市超过 470 个,覆盖设备超过 9000 万台。此外, 公开资料 显示,在 智慧教 育领域 ,公司 的教育评 测平台 的高峰 调用量 达到 每天 3 亿次;在智能车载领域,已经落地 30 多个车型;在智慧医疗领域, 已与 500 多家医院达成合作,均处于同行业领先地位。
云端芯全产业 链布局 ,重点 经营家 居、车载 、医疗 三大领 域,抢占 教 育、机器人赛道:公司2014 年正式定位做AIoT服务商,确立了‚云端芯‛战略,即 将基于云 端的智 能语音 技术与 终端设备 和芯片 紧密联 合,通 过云 端提供服 务、设备 端实现 算法、 芯片提 供算力的 全栈方 式打造 生态闭 环。 公司近一年在芯片端的发力迹象比较明显,于2018 年5 月制定了UniOne 系列芯片计划,并推出了面向智能家居和 智能音箱的第一代芯片‚雨燕 ‛, 同时计划于2019 年和2020 年推出面向智能车载领域的第二代芯片‚雪豹‛和面向智慧城市的第三代芯片‚旗鱼。
公 司重点 经营家 居、车 载以医 疗三大 领域:家居领域,面向家 电厂商 推出 了UniHome 智能语音解决方案芯片;车载领域,面向车联网产品开发商以 及整车厂商推出了UniCar‚云端芯‛一体化解决方案;医疗领域,面向医 生推出了 智能语音 录入软 硬件一 体化解 决方案。 除上述 三大领 域外, 公司 还积极抢 占教育和 机器人 赛道: 教育领 域,推出 了面向 教育机 构的智 能语 音评测系 统;机器 人领域 ,推出 了软硬 件一体的 行业服 务机器 人和面 向儿 童早教的UniToy 机器人解决方案,此外还有面向客服的SaaS 模式的SAMANTHA 智能电话机器人。
人才优势 、先发优势铸就公司核 心竞争力: 根据IDC 的调研,对话式人工 智能落地 面临的两 个最大 问题是 人才及 落地案例 的缺乏 。公司 的核心 团队 来自IBM、摩根大通、中科院、剑桥等全球顶尖公司和院校,人工智能研 究院研究员中博士占比超过45%,产品和运营团队来自Nuance、阿里巴巴 等国内外 知名公司 ,人才 优势明 显;另 外,公司 较早进 入家居 、车载 、医 疗领域,在跟B 端企业合作上以及终端用户需求的理解和隐私保护等方面 都具备较多know how,后进者难以在短时间内完成追赶。我们认为,人才 优势结合 先发优势 助力公 司在场 景拓展 和深耕上 都具备 极大竞 争优势 ,看 好公司发展。
评论