阿里未给过达摩院清晰定义,但达摩院或将重新定义阿里
文|庄洲
2008年,马云邀请后来的阿里云创始人王坚从微软亚洲研究院加入阿里时,抱有一个夙愿:在阿里打造一个汇集顶尖技术人才的研究院。这个研究院,不应该仅仅服务于商业,它更应该在某种程度上引领技术的浪潮。
后来的故事是,阿里研究院没做成,日后领跑中国云计算行业的阿里云诞生了。
2014年,阿里巴巴在纽交所上市,阿里云跨过生死线,“研究院”的设想被重提议程。这次,在王坚的推动下,达摩院前身、专注于数据科学的iDST(institute of Data Science & Technologies,数据科学与技术研究院)于硅谷成立。
2017年,随着阿里启动技术大中台战略,马云经深思熟虑认为阿里巴巴已经“ready”,决定成立包容更多领域的研究院,同时为其命名“达摩院”。历经近10年,跨越三次关键节点,阿里做技术研究院的执念得以实现。此时阿里已攒下一些家当,对达摩院“3年1000亿”的投入规划,比初创阿里云时“坚持10年每年投10亿”更加大手笔。
3年多过去,已在全球8个地区设立研究中心、网罗了30多位海内外高校教授及10多位IEEE Fellow级科学家的达摩院,堪称全阿里最烧钱的部门,或许也是中国最烧钱的企业研究院之一。其布局囊括AI、芯片、量子计算、自动驾驶、5G等需长期重投入的前沿领域。
2月2日,阿里发布2021财年第三季度财报,成立12年后,阿里云守得云开见月明,首次扭亏为盈。阿里巴巴上个10年最大的技术押注已见分晓,而这个10年最大的技术押注才拉开序幕。在财报分析师电话会上,阿里巴巴董事会主席兼首席执行官张勇表示“将对达摩院加大投入”。三年里,阿里对达摩院的投入一直在加码。相关信息源显示,达摩院量子计算团队正在杭州梦想小镇建设第二个硬件实验室,以增强量子芯片制备和测试能力,缩短研发周期,扩大创新空间。
从成立之初,达摩院即被阿里寄予厚望:一是支撑阿里业务发展,二是使阿里巴巴成为国际科技创新的领军力量,此外,它还要活得比阿里巴巴更久。这无疑是一个极具挑战的愿景。3年里,积聚了大量科研牛人与资金的达摩院,是否已如期望的那样燎原了阿里的技术之火?
我们梳理了达摩院三年来的成果、路线及布局,试图勾勒其何去何从。
第三条路径
基因与土壤,注定了达摩院不会复刻传统企业研究院的发展模式。
成立仪式上,马云对达摩院未来的路怎么走并无确切答案。但有一点他很肯定,研究院研而不发,纯粹地“research for fun”,不可能长久;纯粹地“research for profit”,不致力于解决社会问题,更不可能长久。
达摩院要寻找的应该是第三条路径:“Research for solving the problem with profit and fun”。
达摩院相当一部分科学家来自象牙塔般的高校。但经历长期的理论研究后,他们都向往着“硬币的另一面”:从在学术界探索“无用之美”,到在工业界创造“有用之美”。
加入阿里前,施尧耘为密歇根大学安娜堡分校终身教授,是美国计算机系里第一个以量子计算论文博士毕业,并靠此拿到终身制教职的科学家。“我做了20多年量子信息科学的理论研究,今后如果也能为量子计算的实现作出贡献,我觉得自己的研究生涯就完整了。”施尧耘如此解释他热情投身阿里巴巴的原因。他创立并领导的达摩院量子实验室,以实现量子计算的潜能为目标。
在大规模的招兵买马后,达摩院创造了什么?通过公开资料,我们整理了3年来达摩院发布的重大成果:
如果拆解达摩院大部分领域技术研发的路线,会发现一个规律:技术往往从难处入手,而落地则从下沉场景入手。
自动驾驶是一个典型领域。成立3周年之际,达摩院自动驾驶实验室对外发布的重磅成果,不是酷炫的demo版无人驾驶乘用车,而是即将大规模商用的末端物流车“小蛮驴”。
与名字一样朴实,小蛮驴的主要功能是给消费者送货。背后易被忽略的事实是:小蛮驴实际集成了最前沿的人工智能和L4级别自动驾驶技术,能在0.01秒内同时预判上百行人与车辆的意图进行避障,其行驶的人机混合场景,复杂度已超越高速公路等结构化道路。
小蛮驴成本的降低源于技术上的创新突破:一是改进了包含激光雷达等昂贵传感器在内的感知体系,比如,达摩院自研的感知算法,实现了对低线束激光雷达的高线束模拟;二是自研嵌入式计算平台,定制了高性能、低成本和低功耗的计算单元;三是深度定制了包括运动底盘在内的硬件设备,实现了软硬件高度一体化。
自动驾驶实验室负责人王刚,放弃新加坡南洋理工大学终身教职加入阿里后,曾带着团队在阿里园区中长时间训练无人驾驶乘用车,但最终选择先从末端物流场景切入。因为这一场景能较快落地,适合在真实环境中快速迭代技术,同时其有相当广泛的应用前景,不仅对阿里电商业务有支撑作用,还有望应对服务行业劳动力不足的社会问题。
达摩院机器智能实验室负责人金榕,曾列举团队最令他振奋的三大底层技术突破:
一是自然语言处理领域,翻译团队打造出AliTranX国际化多语言基础设施,自研模型用一套框架实现了214种语言之间多领域的任意转译,过去按传统技术需为每个领域研发214*213种模型;
二是语音领域,达摩院研发出大小不到40MB的SAN-M-SCAMA语音识别系统,可离线部署在移动端,识别效果媲美超过100GB的云端系统;
三是数学规划求解器领域,这是一项典型的“卡脖子”技术,国外头部公司已有近三十年技术积累,达摩院自主研发的求解器MindOpt,连续两年在国际权威测评榜单中获得单纯形法测试第一,今年其对线性规划问题的求解速度达到每题40秒,刷新了去年84.3秒的成绩。
达摩院在语言、语音、求解器等几大AI基础技术领域的路径选择,同样符合技术高打、场景下沉的务实路线。据了解,翻译技术首先应用于被称为国际版淘宝的速卖通平台(ALiExpress),帮助连接上亿海内外卖家、买家,数月前速卖通实现了全球首场翻译直播,同时,技术已向众多跨境电商、教育企业开放,日均调用量超13亿次;端上语音系统,首先应用于高德,方便上亿用户在隧道等离线环境中持续使用语音导航,技术同步通过阿里云向社会开放;求解器技术最早用于解决阿里云计算资源调度难题,此后被应用于新零售、新制造、智能物流等多个场景,不久前MindOpt成为国内首个免费开放的商用求解器。
硬币的另一面,产出结果看起来没那么浪漫,产出过程又充满艰苦、繁琐的工程工作。但置身其中的金榕还是发掘出了强烈的技术美感:从214*213种模型,到万模归一;从100GB的系统,到40MB的系统;从84.3秒的求解速度,到40秒……每一个数字产生微小变化,都意味着技术一步步被淬炼至极致。
一位达摩院人士表示,达摩院与普通研发部门最大的不同是,在这里,技术是为了场景,但场景又是为了实现技术的极简与优美。业务价值是途径,而不是目的地。
这似乎是平衡技术理想与业务探索的一条可行路径。
战略、布局与周期
尽管达摩院的技术目标是为了“有用之美”,但如仔细观察,会发现其实验室设置涵盖了将在长、中、短期内拥有应用前景的技术。这一布局,显然为了让达摩院既能抢占技术高地,又能穿越技术周期。
近几年,阿里对量子计算、芯片等长周期领域不断加大投入,但在一个商业上极其成功的公司,从事可能长期看不到落地可能的研究工作,仍颇具压力。量子实验室负责人施尧耘常被人问起,“如何说服行癫(阿里云智能总裁、达摩院院长张建锋)做量子计算?”看起来,阿里巴巴的主营电商业务,与仍被巨大不确定性萦绕的量子研究,相去甚远。
(达摩院量子实验室,研究人员正在调试量子计算设备)
“不是我说服行癫,是他把我招过来的,是他要做量子计算的。” 施尧耘说,“战略决断是我最佩服行癫的地方。”
在一次内部业务会上,张建锋曾同下属们讨论技术战略,他说,“什么是战略?战略就是让你有恐惧感的问题,比如量子计算。”让他有恐惧感的一个场景是,“有一天,阿里巴巴买再多的服务器、芯片,都算不过一台量子计算机。”
尽管得到张建锋的大力支持,施尧耘还是经常受到内外的质疑,特别是“为什么阿里巴巴要做量子计算?”他一开始尝试以很严密的逻辑来论证,比如从“算力是阿里的核心竞争力”,推导出阿里必须做量子计算。后来,随着对“真实世界”体感的加深,他不再坚持这样“义正严辞”的论证。“我现在觉得阿里巴巴也不是说必须要做量子计算,因为做有做的活法,不做有不做的活法。就像我们每天面临的很多事情一样,这是一个选择的问题。But our choices decide who we are(选择决定了我们成为什么人。)”
在施尧耘看来,这个选择就像“一面镜子”,照出公司管理层是否真有决心做长期的科研投入。在更长的周期内,这个选择将“决定阿里巴巴会成为什么”。达摩院成立前,张建锋已想好要开创阿里自己的量子研究,“yes or no”的问题解决了,但“how”的问题被移棒给了施尧耘。
经历了一段时间的摸索,施尧耘的思路逐渐清晰。目前,整个项目以研究超导硬件为核心,其路线的选择不盲目跟风,与主流形成差异化:在最基本的元件即量子比特上采取和领先团队不同的比特类型,并且优先提升小系统的质量(“高精度”),再逐步扩大系统的规模(“多比特”)。
这一抉择将继续考验阿里巴巴高层和量子团队的“定力”。3年前,施尧耘曾表示,量子计算机离商业化还需十年;此后几年中,他仍说还需十年。对此他解释,十年是一个“虚数”,有两层意思:“It’s not immediate, but it’s not impossible, either(不是马上,但也不是不可能)。”
发现新材料可能是量子计算最早的商业应用之一。施尧耘曾制定一个以经典计算进军计算材料科学,并逐渐过渡到使用量子计算的规划。向张建锋汇报的时候,他觉得这个计划虽不能一开始就“养活”自己,至少是一条清晰的商业化道路,他特意强调,“也许很快就可以有收入”。张建锋明确答复,“你别想挣钱的事,要聚焦,集中精力做好研究。”此后,施尧耘愉快地将商业宏图束之高阁,两方达成聚焦基础研究的默契。
施尧耘视量子实验室的事业为“长征”,基于长期基础研究项目来打造团队文化和内部制度。他给团队自由的学术氛围,大家像在学校里一样脑暴、做实验、发论文、组织和参加各类学术会议和讲座;但同时施尧耘又致力打造一支“学术铁军”:各个时间点的目标要十分明确,执行方案要充分论证和对焦,方法强调系统性,而业绩的评定要做到严谨公正,奖罚分明。
做芯片是达摩院探索前沿技术的另一场长征。2018年,达摩院成立一年之际,阿里将同年收购的中天微系统有限公司与达摩院自研芯片业务整合,成立平头哥半导体公司。时隔一年,平头哥再次出现在公众视野之中,接连发布了业界性能最强的RISC-V处理器玄铁910、阿里巴巴第一颗自研芯片含光800。此后,平头哥两年少有对外发声。据了解,平头哥团队除研发芯片产品外,在芯片底层技术研究上也已走在行业前列。其团队研发的新型存算一体架构正在攻克性能墙、内存墙、摩尔定律趋缓等历史遗留难题,有望大幅提升芯片性能。
(2019年9月25日,在杭州云栖大会上,张建锋宣布阿里巴巴发布第一颗芯片)
对达摩院的倾力投入至今,已给阿里巴巴技术体系带来哪些变量?
3年时间不足以下结论,但至少有几条线索可以管中窥豹:
一是,在计算领域储备了包含芯片、量子计算等具备颠覆性算力的下一代技术,同时对芯片、量子超导硬件的研发,带领阿里进入此前极少涉足的高精尖硬件领域。
二是,在人工智能领域搭建了包含语言、语音、视觉、决策智能等技术在内的完整布局,焕新了阿里巴巴内部业务,同时这些技术以阿里云为底座对外输出,拓展了阿里的业务范畴。
三是,融汇打通了阿里巴巴的前沿技术,为创造技术新物种提供了可能性,比如孵化集大成的自动驾驶、机器人产品。
施尧耘跟张勇交流时,有一点让他印象深刻,张勇说,“你不要问我阿里巴巴想做什么,你就是阿里巴巴。”
达摩院成立之初,阿里巴巴未给它清晰定义,但在达摩院不断演变的过程中,它或将重新定义阿里巴巴。
活得比阿里巴巴更久
一个企业研究院,要想活得比母体更久,唯一的办法是:离开母体的庇荫,对更广阔的社会直接创造价值。
在初步自证野心与能力后,达摩院向外生长的速度正不断加快。
3年多时间里,达摩院发布了超过1000篇国际学术论文,取得了60多项国际学术竞赛第一。而完成理论-论文-专利的传统研究阶段后,达摩院的技术团队往往会迅速寻找应用场景,许多业务场景阿里巴巴过去未曾涉足。
疫情期间,达摩院AI技术在医疗领域展现出极强爆发力:1月底,达摩院利用其自然语言处理、语音AI能力,连夜研发出智能疫情机器人,免费为全国57 座城市拨打1600 万通防控摸排电话;2月1日,达摩院与浙江省疾控中心合作,利用AI 算法,将疑似病例基因分析时间缩至半小时;2月15日,达摩院研发的新冠 CT 影像AI诊断系统,在郑州小汤山医院上线,20 秒即可判读疑似患者影像,准确率高达 99%。
(医护人员使用达摩院AI识别新冠肺炎病例CT)
在城市大脑、工业、农业、遥感等领域,达摩院也成功深入行业。最新报道显示,达摩院城市大脑相关技术已落地全球数十个城市;工业AI团队研发了废钢AI定级系统,对废钢的定级准确率达95%,扣重准确率达90%;去年汛情期间,达摩院遥感AI团队开发出防汛水体识别算法,协助水利部完成了262个临河房屋识别任务、149个水体识别任务。
搭建开源、开放的研究合作生态,是达摩院向外自我延展的另一种方式。
即便在最前沿的技术领域,达摩院也并不吝于第一时间向学术界及工业界分享研究成果。据了解,在芯片领域,平头哥已开源包含玄铁处理器、基础接口、开发环境等在内的MCU平台;在量子领域,量子实验室开源了自研量子计算模拟器“太章2.0”及一系列量子应用案例;在认知智能领域,智能计算实验室开源了超大规模分布式图计算平台GraphScope。
平头哥副总裁孟建熠认为,开源一方面回馈了全球技术社区,一方面给了阿里与其他技术伙伴快速协同的机会。基于玄铁处理器和AI算法,平头哥和国内蓝牙芯片厂商中科蓝讯共同设计了新一代智能语音芯片,降低了芯片研发周期及成本投入。
在过去3年中,达摩院还构建起了庞大的学术合作网络。自2018年起,达摩院发起了“青橙奖”,该奖项每年评选10位中国青年学者,为其提供人均100万元奖金及全方位学术支持,此后还发起了阿里巴巴三大学术合作项目(AIR、ARF、ATP),资助前沿性的研究、为学者提供阿里访学机会,并与高校联合培养博士生等人才。
数据显示,通过以上项目,达摩院已与20多个国家的140多所高校及科研院所建立起合作,其合作项目超800个,合作学者超过450人,联合培养博士生及博士后达到120多人。该速度不亚于国内外一流学术机构。
但在达摩院机器智能实验室负责人金榕看来,达摩院前3年最重要的成就,不是研究成果,也不是应用落地,而是找到了“把技术变成生产力”的方法。
“以前,科学家在企业里,就像一个参谋,介绍一些前沿技术,然后企业可以对这个技术有所投入。但要把技术变成生产力,中间有非常多的鸿沟和大坑,这其中需要理论突破,也需要应用创新,将已相对成熟的技术和场景结合起来,不断迭代优化。”金榕认为,“达摩院非常幸运,过去几年,我们花了很多力气,找到了这种方法。”
在一场内部分享会上,金榕对台下的同事们总结,“对一个研究机构来说,3年很短,我们还没有创造了不起的事情,但为将来创造‘了不起’的事情建立了基础。”
同时,他也认为,今天到了一个新的时间点。“每个人都有这样的愿望,多年以后问自己,我究竟留下了什么代表作?接下来就是每个人挑战自己的技术极限,做出真正炫酷的技术。”