X

左林右狸 | AI孔雀何以东南飞

2017年10月11日,杭州云栖大会上“达摩院”成立

文 | 林军 陈伊莉

谁是中国第一 AI 人才天团,这个答案放在五年前是百度还是阿里,并木有定论,放在今天,就是阿里。

达摩院刚刚度过两周年生日,组织架构已经分外明晰,下设机器智能、数据计算、机器人、金融科技和 X 等研究实验室。达摩院内超过半数科学家具有名校博士学位,相当部分是美国、欧洲学成回国,办公室分布在四个国家、八个主要城市。

如今达摩院可以说得上群星璀璨,达摩院机器智能实验室主任金榕负责的机器智能团队是达摩院里最大的一个团队,拥有 20 多位知名大学教授,近 10 位 IEEE Fellow。比如美国普渡大学计算机系终身教授司罗是达摩院语言技术实验室负责人;亚马逊最高级别华人科学家任小枫现在担任高德地图首席科学家、达摩院视觉智能实验室负责人;IEEE senior member 鄢志杰分管语音团队。

另外,还有美国普渡大学计算机系和统计系终身教授漆远,他不仅是蚂蚁金服首席科学家,同时也领导达摩院金融科技实验室;犹他大学计算机系终身教授李飞飞是达摩院数据库与存储实验室负责人;伊利诺伊大学香槟分校博士、新加坡南洋理工大学终身教授王刚负责达摩院智能交通实验室;南加州大学计算机科学博士、现 IEEE senior member 张辉统领达摩院区块链实验室等人;前微软研发合伙人、IEEE Fellow 周靖人就任达摩院智能计算实验室负责人。

最新的一位 AI 大牛是深度学习框架 Caffe 作者、原 Facebook 人工智能科学家贾扬清,他在今年3月履新阿里巴巴集团副总裁、阿里云智能计算平台事业部总裁。

同时,还有不少优秀的年轻人加入阿里。据统计,2017-2019 年间,96% 的阿里星都有 AI 研究的背景,发表过多篇 IJCAI、ICCV、IEEE 等论文。阿里星是阿里针对应届毕业生的人才储备计划,起源于 2011 年,每年都会选出 10 位技术新星重点培养。

那么,这么多 AI 人才为何都聚集到了阿里?有邻里会说,这不就是砸钱的事情,有钱咱也行。此言差矣,AI 人才不是萝卜白菜,不是你想买就能买的。工业界和学术界各有各的好,学术界有一个学术休假的制度,金榕等科学家也都是通过学术休假这个制度才被阿里争取进入的。

有邻里会说,只要搞定一两个大牛,让他们把他们的师兄师弟都搞来,不就齐活了。此言同样差矣,谷歌请李飞飞,百度请吴恩达,都是这个套路,最后吴恩达甩一甩衣袖离开,百度 AI 美研不得不再起炉灶。李飞飞离开后,李佳也闪电离开,谷歌云中国中心也热闹不在。

众所周知的是,漆远向王坚提交的几千台服务器申请建立超大规模机器学习平台的方案在讨论之后,因为 GPU 过于昂贵被公司否决。而“建立超大规模机器学习平台”这一重大项目最初是王坚在吸引漆远加盟 iDST 的重要条件。对应的一个段子是,当年吴恩达之所以愿意从 Google 转会百度,是因为李彦宏答应了为吴恩达买足够多 GPU。这说明一点,阿里不光靠提供更好的研发环境来吸引科学家。

阿里 AI 不仅人才辈出,还有一点让看客感慨不已的是,留失率奇低,这些年流失的也仅仅闵万里初敏等两三人,低于绝大多数公司的离职率。而且即使离职,也是好聚好散,甚少芥蒂,更不会闹出风波

在大叔看来,阿里 AI 之所以如此繁荣昌盛,形成 AI 孔雀东南飞的盛况,原因有三:

一、头雀指引

左起:王坚、胡晓明、张建锋

阿里 AI 的第一个头雀是王坚博士,这位阿里云的缔造者之前在微软亚研担任常务副院长,转会阿里后也带来了微软亚研一票人等,比如最开始的林晨曦和初敏。初敏 2015 年又带来了其微软亚研的实习生,也是语音泰斗王仁华关门弟子之一的鄢志杰,如今达摩院语音实验室的主力担当。

华先胜和张春晖也都是王坚在微软亚研的旧部。这两个人,性格迥异,华先胜热情似火,张春晖则是一个慢条斯理的人,前者继续在视觉智能领域深耕,目前是王坚博士城市大脑项目的重要鼓手和践行者,后者则是控制大牛,最新的头衔是菜鸟的首席科学家,之前在阿里帮助博士推动阿里云 OS 这样同样领先至少行业五年的前沿产品。

还有一人也属于微软系——周靖人博士,他于 2016 年 7 月加入阿里云,当时负责阿里云大数据平台和被并入阿里云的 iDST 残部。如今担任达摩院智能计算实验室、大数据智能计算和搜索推荐平台负责人。

王坚指引的不仅仅是微软系,金榕和漆远这两位达摩院最有势能的资深长老当初也是受到王坚的力邀。

左起:任小枫、金榕、华先胜

金榕 1996 年去美国就读 CMU,2003 年 PHD 毕业,同年进入密歇根州立大学任教,一直待到 2014 年加入阿里。如前所言,美国高校有种制度叫做学术休假,每一个教授每六年有机会去工业界或其他学校做 12 个月的兼职。金榕最初接触阿里,就是应朋友邀请作为阿里妈妈的学术顾问。

在此期间,他为阿里妈妈的广告推送机制作出了巨大贡献,将从等用户来时才计算广告推送改为提前进行广告推送的计算,优化了推荐矩阵,计算效率提升了 30%。而这刚好应用到了金榕前一年提出的一个理论,他不禁兴奋于自己所产生的价值。因为过去理论世界在左,学者常常自嗨得不行,实际世界在右,两界有道鸿沟,而这一次案例,让金榕的理论知识能够在实际世界真正发挥作用。此外,阿里所提倡的,让计算成为像水、电一样普惠资源的口号也让他暗自钦佩。

学术休假的顾问期还没结束,求贤若渴的王坚发现了金榕,就把他转正了。有意思的是,两人进行了一次可能是阿里史上最短的面试,不超过五分钟。简单地寒暄后,王坚就问了一个问题:你进来后准备怎么做?金榕回答说,他发现商业和技术结合有一个很大的问题:通常都是业务方提出问题,技术去抽象地解答,但是业务很有可能因为比较短视,提出了一个错误问题,所以一个好的技术不仅是知道怎么解决问题,更关键的是能找到正确的问题。

聊完,金榕一脸懵懂地就走了,如今想来,他还是有点奇怪王坚为什么会要他。就像他奇怪,为什么会点他做管理者之一,他过去完全没有这方面的经验。但是下属对于金榕确有不小的感激,一位研究员提到,金榕老师的指导往往非常细致,细致到会同他们一起推演公式。

2014 年 7 月 18 日,金榕在杭州直接正式入职,漂泊不定的兼职顾问,终于有了一个固定工位。他 base 在西雅图,不过每年大约一半的时间都在国内,加入 iDST 的第一年几乎更是整年在杭州。

王坚连同井贤栋、程立抢在百度前截住漆远的故事广为人知,与金榕不同的是,漆远当时已经明确回国,这也是为何漆远和金榕当时在 iDST 双峰并立的原因,一个带海外团队,一个带本土团队。

蚂蚁金服首席科学家 漆远

漆远很快请来司罗,司罗 2006 年毕业于卡内基梅隆大学博士毕业后进入普渡大学计算机系任教,2012 年成为普渡大学计算机系终身教授,算漆远的同事。司罗的研究方向是信息检索、机器学习、自然语言处理等领域,短短几年就发表了 100 余篇论文。

司罗被阿里吸引的原因与金榕差不多,他在普渡大学时就有很多和工业界的合作,对技术产品化和商业化产生了兴趣;再加上阿里有大环境、大数据、良好的同事,他就决定加入其中。2014 年 11 月,司罗正式加入iDST。

就这样,随着几位关键科研主力的就位,iDST 正式掀开了阿里 AI 进程的序章。

二、价值观牵领

由于有王坚阿里云成功案例在前,iDST 在被要求通过前瞻性研究来确立阿里巴巴集团在未来数十年的领先地位的同时,也被寄予了成为第二个阿里云的厚望。关于 iDST,阿里的口号是“顶天立地”,用最顶尖的科学家,研究最前沿的问题,去解决最落地的产品。但初起步的 iDST 却又不知不觉重蹈了许多大公司前沿科技机构的通病:只停留在研究问题层面,没有产品化、商业化的能力,显然与这一初衷不符。

于是 2015 年 7 月,iDST 暂时解散,人马大调动,科学家被调入业务部门:漆远被调到蚂蚁金服;金榕率领司罗等人进入淘宝天猫搜索部门;鄢志杰领导的语音部门并入阿里云,继续沿用 iDST 的名称。

金榕将这次经历形容成“上山下乡”,到一线去亲自看看粮食是怎么种出来的。出人意料的是,下放的科学家们适应良好。经过了第一阶段的“鸡同鸭讲”,聪明的科学家们开始不断理解业务,懂得如何配合、支持业务,甚至还能帮助业务方改善流程,迈入了科研落地的新阶段。

金榕在这一时期做的比较成功的一件事就是改善拍立淘识别质量。原本搜索部门没有怎么认真对待用户的反馈,只是用 ImageNet 数据去训练模型,但实际上用户每天都上传成千上万的图像数据,还相当于帮你标注了图片是否相似。因为利用好了这些数据,2015 年下半年到 2016 年,拍立淘的识别能力有了显著的提升。

后来他们为了推动拍立淘更进一步,通过选择性地收集数据来训练模型。大部分用户只有耐心在头几页点击是否相似,而这些图片的相似度往往特别高,放到训练集里也几乎没有什么用,所以他们就放些相似度低的图片,如果有人点击,会收集到更多的信息,更好地改善模型效果。

因此,2015 年金榕团队拿到了集团 CEO 大奖,团队从 30 人扩展到了 120 人。第二年,他们拿着拍立淘参加了当年的 CVPR 会议,Google 等机构都凑过来看热闹:咦,识别效果好像真的还不错。

调入蚂蚁金服的漆远以智能客服作为第一个项目。客服是一个非常悲催的项目。有多悲催?蚂蚁做客服差不多有两三年,但因为一直不满意,客服老大都换了两三轮。客服系统是一个非常错综复杂的系统,对于漆远团队来说也是一个很大的挑战,半年后,他们交出了一个产品。

2015 年底的双 11 是智能客服第一次大规模亮相。包括漆远在内的高管特别飞到了成都客服中心,准备陪着一起接电话,结果大部分机器自己解决了,语音自助率从 60% 提升到了 94%,剩下的客服人员足够应对,高管们面面相觑,尴尬又开心地撤离了。

到了 2016 年,双 11 当天自助服务率更是达到了 99%,为公司节省了一个多亿。另外漆远还在蚂蚁金服实践了自己的初心,搭建了一个大规模机器学习平台,他给取了个名叫“PAI”。凭此,他们团队包揽了 2015 年底 6 项阿里巴巴集团算法大奖(共 16 项)。

现达摩语音实验室负责人 鄢志杰

鄢志杰领导的团队做过语音识别分析客服服务质量的案例。当时淘宝、天猫和支付宝每天都有上百万个客服电话,数字还不断增长,他们就把语音能力引入到电话客服呼叫中心,先把语音转换文字,然后对服务质量进行质检,同时还引入一些自动化的规则和模型进去。目的与漆远团队也是殊途同归,提高客服服务质量。

前阿里云人工智能首席科学家 闵万里

另外,语音团队还曾经联手一支由闵万里领导的队伍做出了小 Ai 机器人。在 Google 担任研究员的闵万里因为在 2013 年 5 月听了马云一席演讲,毅然决然回国入职阿里云,担任阿里云人工智能首席科学家,负责孵化各类人工智能应用。

2016 年 3 月阿尔法狗横空出世之后,AI 迎来第三次浪潮,于是阿里云小 Ai 机器人站到了 C 位。小 Ai 在 2016 年 3 月份击败全球速记亚军,后来又成功预测了《我是歌手》总冠军李玟,一时名声大噪。打响名声之后,2016 年 8 月,小 Ai 正式更名为 ET,逐渐发展成现在的 ET 机器人和面向企业的 ET 大脑。

达摩院语言技术实验室负责人 司罗

司罗到了一线先做了一段时间搜索,2016 年 10 月,他们团队被委派了一个搭建 NLP 技术中台的任务,需具备基础分词,实体识别、语法分析、句法分析等功能。而且中台不仅要能支持阿里集团体系各业务线,还可以通过阿里云服务外部公司。司罗表示,中台任务的最大挑战在于 NLP 不怎么被重视,当时有许多人不看好这个方向,因为在 AI 细分领域中,自然语言处理 NLP 的研究程度是落后于视觉和语音识别的,它的前置环节是语音识别,要在语音变成文字的基础上,再开展搜索、推荐、问答、机器翻译等工作。

而司罗他们幸不辱命。2017 年,他们团队获得了 IJCNLP(国际联合 NLP 大会)语法纠错评测第一名。司罗团队目前约有 110 人,凭借 NLP 中台,他们就能够支持阿里系 600 余个业务方,每天调用量达到了 5000 亿句。

到了这时,AI 热潮已经足够澎湃汹涌,不同 BU 也在加紧安排 AI 人手。渐渐的,阿里高层又注意到一个问题,AI 团队像是割据的藩王,散落在各 BU,来往互动都没那么频繁。如此不仅影响效率,许多通用型技术也是重复研发,资源浪费且不说,也无法形成技术的产业化和规模化优势。

时任集团 CTO 的张建锋站了出来,以做阿里智能音箱为引子,推动了阿里体系 AI 力量的整合。第一步重组 iDST。在收编阿里云 iDST 后,他又把此前拆分到各个业务线的原 iDST 人员重新拼凑起来,调回金榕当 iDST 院长;第二步,张建锋拉上马云成立达摩院。如今达摩院坐镇朝中,大部分科学家都在达摩院旗下实验室,少部分主要负责业务线工作的人也在这里挂单。

从这点来看,如果说王坚是阿里 AI 的开创者,那么张建锋就是继往开来者,书写了阿里 AI 进程的新篇章。

三、群居效应

阿里 AI 天团的一个特征是顶会的主席多,比如有漆远、金榕、司罗、王刚、任小枫等。

漆远担任过深度学习顶会 ICML 的 2014 和 2015 两届的主席。金榕担任过 NIPS、SIGIR 等顶级国际会议领域主席以及 KDD、AAAI、IJCAI 等顶级会议程序委员会委员。司罗则先后担任过ACM 信息系统( TOIS ),ACM 交互信息系统( TIIS )和信息处理与管理( IPM )编辑委员会的副主编,2016 ACM CIKM 技术主席等 。

就任亚马逊资深主任科学家期间,任小枫做过计算机视觉顶级会议 CVPR、ICCV 的领域主席。王刚担任过人工智能领域最顶尖杂志 IEEE TPAMI 的编委(Associate Editor),CCV 2017 和 CVPR 2018 领域主席。

另外,达摩院以色列实验室负责人是曾任以色列理工学院电气工程系的副教授 Lihi Zelnik-Manor,她曾多次担任 CVPR、ECCV 的区域主席,是 ACCV 2018、CVPR 2019 的奖项委员会成员,并且她还将成为 2021 年 CVPR 和 2022 年 ECCV 的主席。

达摩院以色列实验室负责人 Lihi Zelnik-Manor

大叔在 CCF GAIR 2019 组织过顶会主席论坛,接触下来一圈顶会主席后,了解到这群人有几个共同特征,除业务有专长(不然别人也不会选你)外,沟通能力和组织能力都是必不可少的,这其实是学术社群持续壮大最需要的人。对一家技术公司来说,这样兼顾专业能力、沟通能力和组织能力越多的优秀人才越多,组织的向心力和活力就会更强,更容易形成群居效应。

因为人才总是相互吸引的,如今 AI 圈子的顶级科学家都是相识数年、十数年甚至几十年的志同道合好友、同门或同事。在达摩院诞生后,被分配了招人 KPI 的科学家们有一个挖一个;高管层也给予不遗余力的支持。彭蕾曾对漆远说,你看准了什么人,尽管去满足他的需求,钱都不是事,HR 部门会竭力配合。阿里在这两年也迎来了人才引入的新高峰。

达摩院智能交通实验室负责人 王刚

2017 年 3 月,深度学习大牛王刚加入阿里 AI Labs,他 2005 年本科毕业于哈工大,算是大叔的直系学弟。他这两年最大的成就是做出了现象级的天猫精灵,这也是王刚会加入阿里的源头。天猫精灵 X1 用到了王刚的多项研究成果,对于王刚来说,是将其耕耘多年的深度学习算法技术真正落地的好载体。后来王刚转到达摩院,目前是阿里研究自动驾驶的一号人物。

同年 6 月,Amazon Go CV 算法的主导者任小枫顶着 iDST 副院长的 title 也来了。任小枫是杭州人,研究的 CV 在阿里各业务又大有可为,在金榕约聊他多次后,任小枫想了想就入职了。

左起:胡晓明 施尧耘

又过了三月,漆远拉回来了现在达摩院量子实验室负责人的施尧耘。施尧耘 1997 年本科毕业于北京大学,后在普林斯顿大学取得计算机科学博士学位,师从图灵奖得主姚期智院士,是密西根大学安娜堡分校终身教授。

施尧耘刚加入阿里是作为担任阿里云量子技术首席科学家,第一个任务是组建阿里云量子计算实验室,实验室在西雅图宣告成立。2018 年初,实验室引入罗格斯大学计算机科学系教授、两次理论计算机最高奖哥德尔奖得主的马里奥·塞格德。同年施尧耘率领团队研制出当前世界最强的量子电路模拟器——“太章”,美国《连线》杂志称这一发现有望打破谷歌的提出“量子霸权”。

至于为何在自己学术生涯的高峰加入阿里,施尧耘的解释一是因为量子计算机“吹牛”了二十年,一直是在纸上谈兵,为量子计算落地做出贡献是这一领域研究者的最大心愿;二是对阿里价值观的认同,阿里服务小微企业的愿景,让他觉得自己在为人类的进步、社会的平等、技术的普惠做出一份自己的贡献。

2018 年 3 月,原 Facebook 机器翻译组负责人黄非被金榕、司罗联手挖到了达摩院语言技术实验室,负责机器翻译和创新翻译团队,涉及包括钉钉翻译,图像、视频等多媒介翻译工作,继续助攻阿里国际化。

今年3月履新 阿里巴巴集团副总裁 贾扬清

今年也来了两位重量级人物。3 月底,AI 大神贾扬清在知乎上被传离职 Facebook,很快达摩院官方账号就盖了章。从 Facebook 到阿里,贾扬清说是因为他个人很喜欢赋能,想让各行各业都能很好地使用 AI 能力,而这一点上,他认为阿里比 Facebook 更有优势和机遇。

最近加入的一位科学家是原 UCLA 数学系教授印卧涛,获得过晨星数学金奖。印卧涛在运筹优化、经济学领域都有很深的积淀,他受到金榕招揽前来达摩院做访问学者,对于他的全职加入,金榕很是意外和惊喜。印卧涛是一个纯粹的理论派,大多数这样的人并不愿意进入真实的业务中去。但也有越来越多的学者开始想要真正作用于现实世界,最好的方式莫过于找到一个平台,通过平台放大自己的技术影响力。

金榕所在的机器智能团队是达摩院第一大实验室。在经历第一阶段理解业务、第二阶段用算法支持业务,达摩院成立后,他们更多地开始思考如何利用算法开创新赛道。在金榕看来,如今工作要求是越来越高,毕竟在过去 iDST 或者搜索部门时期,还是有具体、已存在的业务场景,相当于有了题目,需要金榕他们帮着解题,而现在需要达摩院自己发现问题,然后阐述给行癫或者逍遥子听,我们应该做什么,为什么要做,对于阿里有什么作用。

回首阿里 AI 进程,早期诚然也有过摇摆,但总体战略向来清晰,数据驱动,场景牵引,提升商业效率是一贯作风;主业茁壮,且不断向其他领域扩张去,形成如今的生态圈,丰富的业务场景也构成了一个难以穷尽的科研母题。这使得阿里的前沿研究不仅仅停留在研究上;与百度相比,还能后发而先至。

不断地请科学家进场,不断地推动科学家与业务融合,不断地升级组织,融合后再升级吸引更多的科学家进来,阿里逐步形成 AI 孔雀东南飞的盛况。

科学家是鱼,前沿研究是水,前沿研究得到落地才能汇集大江大河。如今的阿里不仅形成了一个让科学家们如鱼得水的外部环境,更给了这些科学家们翻江倒海、成就功名的机遇。

“左林右狸读者群” 等你加入