Drive.ai 深度学习优先，帮商业车队打造会开车的大脑

（《麻省理工科技评论》中英文版APP现已上线，年度订阅用户每周直播科技英语讲堂，还有科技英语学习社区哦~）

走在硅谷山景城（Mountain View）的街上，有一台在车尾印着 Drive.ai 标志的自动驾驶汽车停在路上，等着过红绿灯。类似这样在车顶上搭载着摄像头、激光雷达的汽车，三不五时就可以在硅谷的路上见到。

图 | Drive.ai 自动驾驶车在山景城街道上搜集信息。（图片来源：DT 君）

自动驾驶领域已经掀起了一股掏金热，来自车厂、风投、天使投资人等大量资金涌入了这个领域。今年二月福特宣布未来五年对自动驾驶初创公司 Argo AI 投资 10 亿美元；专攻摄像头的 Nauto 在七月获得了软银、Greylock Partners、宝马、通用等参与的 1.59 亿美元 B 轮融资；几天前 Drive.ai 又完成新一轮、由东南亚打车服务龙头 Grab 领投的 1,500 万美元资金，这是 Drive.ai 继六月融资 5,000 万美元短期之内又获得资金注入。

Drive.ai 可以说是硅谷风头正盛的初创公司，9 月宣布与打车公司 Lyft 合作，初期将会有 10 辆自动驾驶车，在湾区（Bay Area）提供给公众免费的接送服务。成立两年以来，募资总额超过 7,700 万美元，并且已经从硅谷走向国际布局，选定新加坡作为海外探路的第一站，将在当地设立办公室，并与当地政府及运输系统展开合作。

Drive.ai 之所以受到瞩目，团队是主要原因，核心成员来自知名的斯坦福大学人工智能实验室（Stanford University’s Artificial Intelligence Lab）。根据 QS 世界大学 2017 年计算机科学前二十强排行榜，斯坦福大学名列第二，仅次于麻省理工学院，而且斯坦福在 1962 年就成立了人工智能实验室，而且孕育出不少科技大牛，包括人工智能领域权威吴恩达、 Google 云端人工智能兼机器学习首席科学家李飞飞都来自于此。

Drive.ai 联合创办人 Sameep Tandon、王弢就是师承这个实验室。另一位联合创办人 Carol Reiley 则是知名的机器人学者，她的设计涵盖陆海空领域，包括手术机器人、水下机器人、太空卫星系统，也活跃于创客（Maker）社群，不过，外界可能更容易把她称作吴恩达的妻子。Deive.ai 董事会成员除了曾任通用汽车（GM）副主席的 Steve Girsky，吴恩达也在近期加入。

Drive.ai 深度学习优先，帮商业车队打造会开车的大脑

图 | Drive.ai 联合创办人王弢。（图片来源：DT 君）

自动驾驶领域涵盖多个技术细项，不过以系统架构来说，目前的主流有两大门派，一是传统机器人。以 Google 为代表，优势是因相关技术较成熟，市场上已有现成的东西可以拿来使用，所以可以很快做出样车，车子初期上手速度也就比较快，但缺点是当收集的数据更多、测试更多，就会遇到准确性的瓶颈，因为是靠规则来告诉机器怎么开车，但真实的驾驶情境中，想要把每个情境都写成一条规则输入系统，长远来看是不可行。

正因此，另一个门派兴起了，那就是深度学习。透过不同场景的练习而累积驾驶经验，再从经验产生得以因应新的驾驶场景的临时反应能力。深度学习的优势在具备大量数据量的情况下，系统的运作能力、准确度会随数据的增长而变强，跟传统的机器人学有本质上的差别。

不过，深度学习约莫是在 2011 、2012 年开始活跃起来，而 Google 在 2008 年甚至更早就开始研究自动驾驶，当时的深度学习尚未兴起，软硬件的基础设施还不够，因此当时他们选择了传统机器人架构作为开发核心。反观目前的自动驾驶初创公司，多数都是选择深度学习这条路，而 Drive.ai 可以说是第一个，在深度学习成为大热门之前，他们已经在学术界里研究深度学习和自动驾驶多年。

Deep Learning First

“我们团队最初在斯坦福有两个研究重点，一个是深度学习，另一个专长是做深度学习的规模化（scale up）。”Drive.ai 联合创始人王弢说。

2012 年 Google 旗下 X Lab 的研究人员利用 YouTube 上的影片图像，训练一个大型的神经网络自主学习辨识出“猫”，当时 Google 使用了 1.6 万颗处理器打造出这个系统。不过，斯坦福实验室采用不同的做法，利用 GPU 显卡集群处理技术，只以 16 台机器集群、不到 Google 十分之一的资源，就重建了 Google 的结果。另外，还测试了一个比 Google Brain 大十倍的神经网络。

王弢回忆：要做到这点其实有很多技术挑战，象是多台机器协作训练同一个模型，以及数据量很大的话，要能保证快速把数据推送进模型里进行训练，这对于文件系统跟传输系统都要有很高的要求。

“斯坦福可以说是最早使用 GPU 进入深度学习训练的实验室之一。”过去他们在斯坦福做的项目就是使用深度学习解决自动驾驶在“认知”领域的问题，例如车辆、车道线及行人探测。开发出优秀的研究成果，加上车商、行业内的人看过后给予高度的评价，强化了这一群学者、科学家创业的决心，决定创立 Drive.ai，强调以深度学习优先（Deep Learning First）打造自动驾驶车。

自动驾驶车至少必须包含几个技术：数据传感（data sensing）、物件标记（object annotation）、深度学习算法、以及车辆方向盘、油门与煞车等对应的行车操控。

Drive.ai 联合创始人 Sameep Tandon 表示：深度学习是自动驾驶汽车最有效的技术。你可能听到很多关于自动驾驶汽车的东西：传感器、摄像头、激光雷达。“我们真正需要的是一个可以让汽车安全自主工作、了解环境的大脑。”

Carol Reiley 进一步指出：“深度学习是最接近人类大脑学习的算法”，不是以规则为基础。就像一个 16 岁的年轻人学开车。有些公司会说他们在 A 部分或 B 部分使用深度学习，但 Drive.ai 是全面地看待它。我们的核心技术在于使车辆具有如同人类驾驶一般的脑袋。

“零碎”使用深度学习最常见的目的仅仅是为了感知，例如从摄像机图像中辨识行人，任意场景中对事物进行分类，在学会识别特定模式之后，可以扩展到以前没有实际看到的对象。不过，除了感知之外，还有决策及运动规划（motion planning），深度学习的“人性化”模式识别会比基于规则的系统做出更细微的行为。

所谓的更人性化是什么？深度学习可以像人一样观察整个环境而做出决策，举例来说，当我们人类等着过马路时，不必一定得要盯着绿灯看，你也会知道绿灯了、可以走了，那是因为我们会看到其他人已经开始走了。而基于深度学习训练的机器，它们也不一定真的得看到所有的灯号，它可以看到旁边的车已经开始移动了，就会知道已经是绿灯了，这就是更像人的智能。

研究机器人超过 15 年的 Carol Reiley 认为，自动驾驶汽车是一个机器人，也将是人类第一个高度互动的机器人。未来人们与自动驾驶汽车的第一次互动不会是在车内，而是作为旁观者，是行人、骑自行车的人、摩托车骑手或其他司机。

“为了获得公众的信任，这些汽车必须与外部世界进行沟通，并能够表达其意图。”因此，Drive.ai 测试车顶上有一个 LED 标志，用来显示给行人和其他司机的信息和表情，例如告诉行人可以在他们面前穿过。

Drive.ai 深度学习优先，帮商业车队打造会开车的大脑

图 | Drive.ai 测试车顶上有一个 LED 标志（见黑色长框），上头会显示给行人和其他司机的信息和表情。例如显示一条消息，告诉行人可以在他们面前穿过。

同质＋异质传感器融合

不过，学术的研究与实作始终存有差异，把深度学习做好、放到车上，跟在实验室做研究、发论文是两码事，Drive.ai 相当清楚这一点，因此，过去两年他们积极争取上路，成为第一家拿到加州路测的“初创公司”，希望透过时间优势搜集数据，以掌握真实道路的各种可能情境。

王弢解释，在实验室做研究很多时候不必考虑数据从哪来，网路上有很多公开的数据，利用开源数据集跑一跑做出结果，就是很好的研究。但是，对业界来说，网路上很多的数据集无法商用，有些自动驾驶数据集的量级不够大、也不够专注于自动驾驶这个领域，它可以做测试和验证，但用来训练还是太小，因此 Drive.ai 有一套自己的数据收集、数据处理、数据标注的流程。

他们的车在路上跑，不论是黑夜、下雨、甚至是冰雹的气候，时刻都在收集来自不同传感器的信息，主要包括激光雷达、摄像头、毫米波雷达、汽车 CAN（Controller Area Network）总线系统。

自动驾驶最入门简单的作法是搭载一个高精度的 GPS 系统，上路跑一个固定的路线。不过，高精度 GPS 在城市道路上常发生多重路径（mulitpath）的问题，也就是讯号在树、建筑物上反射，造成讯号干扰，对定位造成很大的困扰。因此，Drive.ai 最初测试时遇到较大的挑战在于传感器的可靠性，他们透过多传感器的融合，解决这个问题。

因此，在 Drive.ai 的自动驾驶车上有 6 个激光雷达、 9 个摄像头、车子前方则有毫米波雷达，让车子能够眼观 360 度。“也就是，同质＋异质的有机结合。能增强系统的稳定。”王弢说。

同质是指同一类探测器的备援，例如激光雷达有 6 个，假设有一个坏了，性能可能受到影响，但不至于整台车失能。异质则是指不同探测器的互补，如激光雷达、摄像头、毫米波等等，各个运作模式跟原理都不同，优缺点互见，象是在大雾跟大雪天，激光雷达跟摄像头可能会有状况，但毫米波雷达跟 GPS 则不受影响。

再举另一个例子，假设只有一个摄像头，车子就很难知道跟前方车辆的精确距离是多少，除非有其他的探测器给予信息。激光雷达可以提供很好的三维空间信息，毫米波雷达对于探测金属物体或物体的速度较为精确，摄像头则是适合颜色信息，应用在让车子看红绿灯是不可或缺，同时摄像头比较类似人眼的工作原理，这在计算机视觉已有许多研究，能够辨识物体具体为何，是人、树还是车等等。

不造车，做全站式系统供应商

一旦自动驾驶的应用起飞，无疑对传统车商的商业模式造成很大的冲击，他们对此不敢小觑，不仅内部积极投入研发，也投资许多初创公司，给了小公司大好的机会。

“科技公司容易有一个通病--自视过高，觉得传统车商的技术层次比较低。但是，其实传统车商有很多技术壁垒，在制造、整合、测试有非常强大的优势。所以我们要找的是互补模式。”王弢说。

因此，Drive.ai 的定位很清楚，不会自己造车，而是以深度学习为核心，开发软硬件整合的系统，为商业车队设计自助驾驶改装套件，以及探索无人驾驶的商业模式。

传统车商在布局自动驾驶首先面临的还是人才问题，“传统车商不是软件跟人工智能方面人才会聚集的产业”。所以站在传统车商的角度来说，与科技新创公司合作，可以补强 AI 、软件人才不足的难题，二是 L4、L5 对传统车商来说宛如一种未知的冲击，双方能够一同探索 L4、L5 的商业模式，打开新市场。

另一方面，对于像 Drive.ai 这样的初创公司来说，造车有两个大问题，一是成本过高、二是技术难点很多，传统车商生产汽车的历史已经超过百年，技术积累很深，连 Google 都放弃自己造车，因此“善用兵者，不以短击长”。

Drive.ai 深度学习优先，帮商业车队打造会开车的大脑

图 | Drive.ai 锁定与商业车队合作，包括 Lyft 和 Grab。（图片来源：DT 君）

不过，自动驾驶是一个系统工程，需要多方面的人才，王弢就表示：“只会做深度学习是远远不够的，虽然我们自己不造车，但要深度了解汽车的系统。”因此，在过去的两年 Drive.ai 强化团队人才的多元化，招募来自系统、汽车行业、深度学习、机器人学等背景。

也因为自动驾驶吸引了各方业者的兴趣，对于人才的渴求程度相当大，其实在美国求职网站 indeed 敲入“自动驾驶”、“自动驾驶车”关键字，可以看到相当多企业都在招人，例如刚获得 1.59 亿美元融资的 Nauto，就大举招兵找马，一口气释出 65 个职缺，NVIDIA 甚是开出将近 100 个职缺，另外，戴姆勒、专为 IT 公司征才的 Jobspring Partners 人力公司、以及 AutoX（从普林斯顿大学教授转为创业的肖健雄所成立的公司）也在找人才。

目标更多落地

在学术圈时，Drive.ai 已经累积了相当程度的技术优势，现在他们的车队已经具备 L4 级别水准，下一步目标就是更多的落地。所以继 Lyft 之后，又迅速携手了东南亚市占率最高的打车公司 Grab。

Drive.ai 深度学习优先，帮商业车队打造会开车的大脑

图 | Drive.ai 目前有三个自动驾驶车款在路上测试。（图片来源：DT 君）

“选择落地场景很重要的原则是，能否帮助我们进一步扩张或技术演进。”王弢说得直白。

举一个极端的例子，假设选在一个工业园区于半夜进行路测，服务加班、上夜班的族群是一个应用场景，但必须思考这个场景能否有助于我们进一步扩张、有效优化技术？因为在空无一人的场景，尽管累积了数十万里的数据，对于让技术发展必须接近普通人生活的帮助可能非常有限。

因此，Drive.ai 在商业模式部分则是先锁定与车队合作，主要是车队对自动驾驶的接受心态比较开放，主要是普通消费者对于价格敏感度较高，现阶段自动驾驶车的硬件跟传感器价格还是偏高，部分人依旧喜欢自己驾车的体验。

王弢也指出，L4 等级的自动驾驶率先落地肯定会是商业市场，第一个原因是汽车的利用率比较高，商业车队旗下的车每天跑很多小时，自动驾驶能创造的价值较大，车队业者对于价格的敏感度就会降低很多。

第二的原因是驾驶员的成本很高，对于共享出行、物流业者来说，人力的成本约占到总成本的五成左右，一旦转成自动驾驶，成本效益会有很高的体现。同时 Drive.ai 除了在加州、新加坡进行路测之外，会以市场大、政策支持较强的地区作为优先。

看中美投入自动驾驶优势

在这一波的自动驾驶热潮中，硅谷是率先发声的地区，但不难发现越来越多的新创公司是由中国人所创立，像是今年获得《麻省理工科技评论》评选全球 35 岁以下的 35 位创新者（MIT TR35 Global）、曾任普林斯顿大学助理教授的肖健雄，则成立了 AutoX，中国编程天才楼教主参与创立 Pony.ai 、前百度高级副总裁王劲创立的景驰、前 Zynga 亚洲 CTO 郑皓的 Plus AI 等等。

美国与中国堪称是投入自动驾驶最为积极的两个国家，王弢分享他对于两地优势的看法，目前来说，美国的优势在于人才较为领先，主要是硅谷为全世界 AI 人才最集中的地方，而且有许多发力早的大公司如 Google，因此“人才的储备还是比较雄厚”。

不过，中国具有后发优势，首先，曾经在美国工作的人才有一定回流，第二是来自政府强大的支持，释出不少对于自动驾驶发展的利好政策，第三个原因是中国市场潜力很大，从技术上来说，中国的路况跟交通情况比较复杂，搜集数据方面可以得到各种不同的边缘场景。

这两大国家看好这个让人类从方向盘中解放出来的技术，为自动驾驶软体初创公司带来了各种新机会，这股掏金热还将持续下去。

硅谷自动驾驶汽车初创公司募资

Drive.ai 深度学习优先，帮商业车队打造会开车的大脑