• 11月26日 星期二

Drive.ai 深度学习优先,帮商业车队打造会开车的大脑

(《麻省理工科技评论》中英文版APP现已上线,年度订阅用户每周直播科技英语讲堂,还有科技英语学习社区哦~)

走在硅谷山景城(Mountain View)的街上,有一台在车尾印着 Drive.ai 标志的自动驾驶汽车停在路上,等着过红绿灯。类似这样在车顶上搭载着摄像头、激光雷达的汽车,三不五时就可以在硅谷的路上见到。

Drive.ai 深度学习优先,帮商业车队打造会开车的大脑

图 | Drive.ai 自动驾驶车在山景城街道上搜集信息。(图片来源:DT 君)

自动驾驶领域已经掀起了一股掏金热,来自车厂、风投、天使投资人等大量资金涌入了这个领域。今年二月福特宣布未来五年对自动驾驶初创公司 Argo AI 投资 10 亿美元;专攻摄像头的 Nauto 在七月获得了软银、Greylock Partners、宝马、通用等参与的 1.59 亿美元 B 轮融资;几天前 Drive.ai 又完成新一轮、由东南亚打车服务龙头 Grab 领投的 1,500 万美元资金,这是 Drive.ai 继六月融资 5,000 万美元短期之内又获得资金注入。

Drive.ai 可以说是硅谷风头正盛的初创公司,9 月宣布与打车公司 Lyft 合作,初期将会有 10 辆自动驾驶车,在湾区(Bay Area)提供给公众免费的接送服务。成立两年以来,募资总额超过 7,700 万美元,并且已经从硅谷走向国际布局,选定新加坡作为海外探路的第一站,将在当地设立办公室,并与当地政府及运输系统展开合作。

Drive.ai 之所以受到瞩目,团队是主要原因,核心成员来自知名的斯坦福大学人工智能实验室(Stanford University’s Artificial Intelligence Lab)。根据 QS 世界大学 2017 年计算机科学前二十强排行榜,斯坦福大学名列第二,仅次于麻省理工学院,而且斯坦福在 1962 年就成立了人工智能实验室,而且孕育出不少科技大牛,包括人工智能领域权威吴恩达、 Google 云端人工智能兼机器学习首席科学家李飞飞都来自于此。

Drive.ai 联合创办人 Sameep Tandon、 王弢就是师承这个实验室。另一位联合创办人 Carol Reiley 则是知名的机器人学者,她的设计涵盖陆海空领域,包括手术机器人、水下机器人、太空卫星系统,也活跃于创客(Maker)社群,不过,外界可能更容易把她称作吴恩达的妻子。Deive.ai 董事会成员除了曾任通用汽车(GM)副主席的 Steve Girsky,吴恩达也在近期加入。

Drive.ai 深度学习优先,帮商业车队打造会开车的大脑

图 | Drive.ai 联合创办人王弢。(图片来源:DT 君)

自动驾驶领域涵盖多个技术细项,不过以系统架构来说,目前的主流有两大门派,一是传统机器人。以 Google 为代表,优势是因相关技术较成熟,市场上已有现成的东西可以拿来使用,所以可以很快做出样车,车子初期上手速度也就比较快,但缺点是当收集的数据更多、测试更多,就会遇到准确性的瓶颈,因为是靠规则来告诉机器怎么开车,但真实的驾驶情境中,想要把每个情境都写成一条规则输入系统,长远来看是不可行。

正因此,另一个门派兴起了,那就是深度学习。透过不同场景的练习而累积驾驶经验,再从经验产生得以因应新的驾驶场景的临时反应能力。深度学习的优势在具备大量数据量的情况下,系统的运作能力、准确度会随数据的增长而变强,跟传统的机器人学有本质上的差别。

不过,深度学习约莫是在 2011 、2012 年开始活跃起来,而 Google 在 2008 年甚至更早就开始研究自动驾驶,当时的深度学习尚未兴起,软硬件的基础设施还不够,因此当时他们选择了传统机器人架构作为开发核心。反观目前的自动驾驶初创公司,多数都是选择深度学习这条路,而 Drive.ai 可以说是第一个,在深度学习成为大热门之前,他们已经在学术界里研究深度学习和自动驾驶多年。

Deep Learning First

我们团队最初在斯坦福有两个研究重点,一个是深度学习,另一个专长是做深度学习的规模化(scale up)。”Drive.ai 联合创始人王弢说。

2012 年 Google 旗下 X Lab 的研究人员利用 YouTube 上的影片图像,训练一个大型的神经网络自主学习辨识出“猫”,当时 Google 使用了 1.6 万颗处理器打造出这个系统。不过,斯坦福实验室采用不同的做法,利用 GPU 显卡集群处理技术,只以 16 台机器集群、不到 Google 十分之一的资源,就重建了 Google 的结果。另外,还测试了一个比 Google Brain 大十倍的神经网络。

王弢回忆:要做到这点其实有很多技术挑战,象是多台机器协作训练同一个模型,以及数据量很大的话,要能保证快速把数据推送进模型里进行训练,这对于文件系统跟传输系统都要有很高的要求。

“斯坦福可以说是最早使用 GPU 进入深度学习训练的实验室之一。”过去他们在斯坦福做的项目就是使用深度学习解决自动驾驶在“认知”领域的问题,例如车辆、车道线及行人探测。开发出优秀的研究成果,加上车商、行业内的人看过后给予高度的评价,强化了这一群学者、科学家创业的决心,决定创立 Drive.ai,强调以深度学习优先(Deep Learning First)打造自动驾驶车。

自动驾驶车至少必须包含几个技术:数据传感(data sensing)、物件标记(object annotation)、深度学习算法、以及车辆方向盘、油门与煞车等对应的行车操控。

Drive.ai 联合创始人 Sameep Tandon 表示:深度学习是自动驾驶汽车最有效的技术。你可能听到很多关于自动驾驶汽车的东西:传感器、摄像头、激光雷达。“我们真正需要的是一个可以让汽车安全自主工作、了解环境的大脑。”

Carol Reiley 进一步指出:“深度学习是最接近人类大脑学习的算法”,不是以规则为基础。就像一个 16 岁的年轻人学开车。有些公司会说他们在 A 部分或 B 部分使用深度学习,但 Drive.ai 是全面地看待它。我们的核心技术在于使车辆具有如同人类驾驶一般的脑袋。

“零碎”使用深度学习最常见的目的仅仅是为了感知,例如从摄像机图像中辨识行人,任意场景中对事物进行分类,在学会识别特定模式之后,可以扩展到以前没有实际看到的对象。不过,除了感知之外,还有决策及运动规划(motion planning),深度学习的“人性化”模式识别会比基于规则的系统做出更细微的行为。

所谓的更人性化是什么?深度学习可以像人一样观察整个环境而做出决策,举例来说,当我们人类等着过马路时,不必一定得要盯着绿灯看,你也会知道绿灯了、可以走了,那是因为我们会看到其他人已经开始走了。而基于深度学习训练的机器,它们也不一定真的得看到所有的灯号,它可以看到旁边的车已经开始移动了,就会知道已经是绿灯了,这就是更像人的智能。

研究机器人超过 15 年的 Carol Reiley 认为,自动驾驶汽车是一个机器人,也将是人类第一个高度互动的机器人。未来人们与自动驾驶汽车的第一次互动不会是在车内,而是作为旁观者,是行人、骑自行车的人、摩托车骑手或其他司机。

“为了获得公众的信任,这些汽车必须与外部世界进行沟通,并能够表达其意图。”因此,Drive.ai 测试车顶上有一个 LED 标志,用来显示给行人和其他司机的信息和表情,例如告诉行人可以在他们面前穿过。

Drive.ai 深度学习优先,帮商业车队打造会开车的大脑

图 | Drive.ai 测试车顶上有一个 LED 标志(见黑色长框),上头会显示给行人和其他司机的信息和表情。例如显示一条消息,告诉行人可以在他们面前穿过。

同质+异质传感器融合

不过,学术的研究与实作始终存有差异,把深度学习做好、放到车上,跟在实验室做研究、发论文是两码事,Drive.ai 相当清楚这一点,因此,过去两年他们积极争取上路,成为第一家拿到加州路测的“初创公司”,希望透过时间优势搜集数据,以掌握真实道路的各种可能情境。

王弢解释,在实验室做研究很多时候不必考虑数据从哪来,网路上有很多公开的数据,利用开源数据集跑一跑做出结果,就是很好的研究。但是,对业界来说,网路上很多的数据集无法商用,有些自动驾驶数据集的量级不够大、也不够专注于自动驾驶这个领域,它可以做测试和验证,但用来训练还是太小,因此 Drive.ai 有一套自己的数据收集、数据处理、数据标注的流程。

他们的车在路上跑,不论是黑夜、下雨、甚至是冰雹的气候,时刻都在收集来自不同传感器的信息,主要包括激光雷达、摄像头、毫米波雷达、汽车 CAN(Controller Area Network)总线系统。

自动驾驶最入门简单的作法是搭载一个高精度的 GPS 系统,上路跑一个固定的路线。不过,高精度 GPS 在城市道路上常发生多重路径(mulitpath)的问题,也就是讯号在树、建筑物上反射,造成讯号干扰,对定位造成很大的困扰。因此,Drive.ai 最初测试时遇到较大的挑战在于传感器的可靠性,他们透过多传感器的融合,解决这个问题。

因此,在 Drive.ai 的自动驾驶车上有 6 个激光雷达、 9 个摄像头、车子前方则有毫米波雷达,让车子能够眼观 360 度。“也就是,同质+异质的有机结合。能增强系统的稳定。”王弢说。

同质是指同一类探测器的备援,例如激光雷达有 6 个,假设有一个坏了,性能可能受到影响,但不至于整台车失能。异质则是指不同探测器的互补,如激光雷达、摄像头、毫米波等等,各个运作模式跟原理都不同,优缺点互见,象是在大雾跟大雪天,激光雷达跟摄像头可能会有状况,但毫米波雷达跟 GPS 则不受影响。

再举另一个例子,假设只有一个摄像头,车子就很难知道跟前方车辆的精确距离是多少,除非有其他的探测器给予信息。激光雷达可以提供很好的三维空间信息,毫米波雷达对于探测金属物体或物体的速度较为精确,摄像头则是适合颜色信息,应用在让车子看红绿灯是不可或缺,同时摄像头比较类似人眼的工作原理,这在计算机视觉已有许多研究,能够辨识物体具体为何,是人、树还是车等等。

不造车,做全站式系统供应商

一旦自动驾驶的应用起飞,无疑对传统车商的商业模式造成很大的冲击,他们对此不敢小觑,不仅内部积极投入研发,也投资许多初创公司,给了小公司大好的机会。

“科技公司容易有一个通病--自视过高,觉得传统车商的技术层次比较低。但是,其实传统车商有很多技术壁垒,在制造、整合、测试有非常强大的优势。所以我们要找的是互补模式。”王弢说。

因此,Drive.ai 的定位很清楚,不会自己造车,而是以深度学习为核心,开发软硬件整合的系统,为商业车队设计自助驾驶改装套件,以及探索无人驾驶的商业模式。

传统车商在布局自动驾驶首先面临的还是人才问题,“传统车商不是软件跟人工智能方面人才会聚集的产业”。所以站在传统车商的角度来说,与科技新创公司合作,可以补强 AI 、软件人才不足的难题,二是 L4、L5 对传统车商来说宛如一种未知的冲击,双方能够一同探索 L4、L5 的商业模式,打开新市场。

另一方面,对于像 Drive.ai 这样的初创公司来说,造车有两个大问题,一是成本过高、二是技术难点很多,传统车商生产汽车的历史已经超过百年,技术积累很深,连 Google 都放弃自己造车,因此“善用兵者,不以短击长”。

Drive.ai 深度学习优先,帮商业车队打造会开车的大脑

图 | Drive.ai 锁定与商业车队合作,包括 Lyft 和 Grab。(图片来源:DT 君)

不过,自动驾驶是一个系统工程,需要多方面的人才,王弢就表示:“只会做深度学习是远远不够的,虽然我们自己不造车,但要深度了解汽车的系统。”因此,在过去的两年 Drive.ai 强化团队人才的多元化,招募来自系统、汽车行业、深度学习、机器人学等背景。

也因为自动驾驶吸引了各方业者的兴趣,对于人才的渴求程度相当大,其实在美国求职网站 indeed 敲入“自动驾驶”、“自动驾驶车”关键字,可以看到相当多企业都在招人,例如刚获得 1.59 亿美元融资的 Nauto,就大举招兵找马,一口气释出 65 个职缺,NVIDIA 甚是开出将近 100 个职缺,另外,戴姆勒、专为 IT 公司征才的 Jobspring Partners 人力公司、以及 AutoX(从普林斯顿大学教授转为创业的肖健雄所成立的公司)也在找人才。

目标更多落地

在学术圈时,Drive.ai 已经累积了相当程度的技术优势,现在他们的车队已经具备 L4 级别水准,下一步目标就是更多的落地。所以继 Lyft 之后,又迅速携手了东南亚市占率最高的打车公司 Grab。

Drive.ai 深度学习优先,帮商业车队打造会开车的大脑

图 | Drive.ai 目前有三个自动驾驶车款在路上测试。(图片来源:DT 君)

“选择落地场景很重要的原则是,能否帮助我们进一步扩张或技术演进。”王弢说得直白。

举一个极端的例子,假设选在一个工业园区于半夜进行路测,服务加班、上夜班的族群是一个应用场景,但必须思考这个场景能否有助于我们进一步扩张、有效优化技术?因为在空无一人的场景,尽管累积了数十万里的数据,对于让技术发展必须接近普通人生活的帮助可能非常有限。

因此,Drive.ai 在商业模式部分则是先锁定与车队合作,主要是车队对自动驾驶的接受心态比较开放,主要是普通消费者对于价格敏感度较高,现阶段自动驾驶车的硬件跟传感器价格还是偏高,部分人依旧喜欢自己驾车的体验。

王弢也指出,L4 等级的自动驾驶率先落地肯定会是商业市场,第一个原因是汽车的利用率比较高,商业车队旗下的车每天跑很多小时,自动驾驶能创造的价值较大,车队业者对于价格的敏感度就会降低很多。

第二的原因是驾驶员的成本很高,对于共享出行、物流业者来说,人力的成本约占到总成本的五成左右,一旦转成自动驾驶,成本效益会有很高的体现。同时 Drive.ai 除了在加州、新加坡进行路测之外,会以市场大、政策支持较强的地区作为优先。

看中美投入自动驾驶优势

在这一波的自动驾驶热潮中,硅谷是率先发声的地区,但不难发现越来越多的新创公司是由中国人所创立,像是今年获得《麻省理工科技评论》评选全球 35 岁以下的 35 位创新者(MIT TR35 Global)、曾任普林斯顿大学助理教授的肖健雄,则成立了 AutoX,中国编程天才楼教主参与创立 Pony.ai 、前百度高级副总裁王劲创立的景驰、前 Zynga 亚洲 CTO 郑皓的 Plus AI 等等。

美国与中国堪称是投入自动驾驶最为积极的两个国家,王弢分享他对于两地优势的看法,目前来说,美国的优势在于人才较为领先,主要是硅谷为全世界 AI 人才最集中的地方,而且有许多发力早的大公司如 Google,因此“人才的储备还是比较雄厚”。

不过,中国具有后发优势,首先,曾经在美国工作的人才有一定回流,第二是来自政府强大的支持,释出不少对于自动驾驶发展的利好政策,第三个原因是中国市场潜力很大,从技术上来说,中国的路况跟交通情况比较复杂,搜集数据方面可以得到各种不同的边缘场景。

这两大国家看好这个让人类从方向盘中解放出来的技术,为自动驾驶软体初创公司带来了各种新机会,这股掏金热还将持续下去。

硅谷自动驾驶汽车初创公司募资

Drive.ai 深度学习优先,帮商业车队打造会开车的大脑

资料整理:深科技

上一篇新闻

CEJ论文精要 | 解读“双循环”新发展格局:内涵与构建

下一篇新闻

印尼317家属陪同签证详情介绍

评论

订阅每日新闻

订阅每日新闻以免错过最新最热门的新加坡新闻。