X

3万字详细版 介绍阿里巴巴达摩院15个实验室研究领域和科研成果

文/超脑智能

2017年10月11日的杭州云栖大会上,马云宣布阿里巴巴集团成立面向未来的科学技术研究机构——达摩院,并在未来3年投入1000亿人民币进行科学技术研究。

达摩院致力于探索科技未知,以人类愿景为驱动力,开展基础科学和创新性技术研究。

阿里巴巴未来二十年的目标是打造世界第五大经济体,为世界解决1亿就业机会,服务跨国界的20亿人口,为1000万家企业创造盈利的平台。要达到这个目标并服务世界经济,其中有无数的问题需要解决,这正是成立达摩院的初衷,并将遵循 “Research for solving problems with profit and fun” 的宗旨。

阿里巴巴创始人马云对达摩院的发展提出三个要求:“活得要比阿里巴巴长”、“服务全世界至少20亿人口”、“必须面向未来、用科技解决未来的问题”。

为方便读者通过一篇文章了解阿里巴巴达摩院全部信息,我们特别做了编辑整理,主要来自达摩院官网和阿里官方报道。

达摩院全球工作地点

目前阿里巴巴达摩院在全球共有7个办公地点,分别是:北京、杭州、新加坡、美国西雅图、美国·森尼韦尔、以色列·特拉维夫、美国·纽约。

阿里巴巴达摩院全球工作地

达摩院学术委员会

学术委员会成员包括全球不同领域的科学家,分别是:

高文

高文

北京大学数字媒体研究所所长、系统芯片研究所所长、北京大学博雅讲席教授、信息与工程科学部主任,中国工程院院士,IEEE Fellow,ACM Fellow,国家自然科学基金委员会副主任,中国计算机学会理事长。

梅宏

梅宏

北京理工大学教授、副校长,中国科学院院士,发展中国家科学院院士,IEEE Fellow。

吴朝晖

吴朝晖

浙江大学校长,中国科学院院士,之江实验室副理事长

黄如

黄如

北京大学信息科学技术学院教授、院长,中国科学院院士,IEEE Fellow

Michael I. Jordan

Michael I. Jordan

加州大学伯克利分校教授,美国工程院院士, 美国科学院院士, 美国人文与科学院士,AAAI Fellow,IEEE Fellow

周以真

周以真

哥伦比亚大学教授、数据科学研究所主任,IEEE Fellow, ACM Fellow,定义了计算思维

Henry M. Levy

Henry M. Levy

华盛顿大学教授、计算机科学与工程学院院长,美国工程院院士,IEEE Fellow,ACM Fellow

George M. Church

George M. Church

哈佛大学&麻省理工学院教授,美国工程院院士, 美国科学院院士,“人类基因组计划”领军人物

Avi Wigderson

Avi Wigderson

普林斯顿大学高等研究院教授, 美国科学院院士, 美国人文与科学院士

达摩院15个实验室介绍

达摩院下设5大技术领域,共15个实验室,5大技术领域分别是:机器智能、数据计算、机器人、金融科技、X实验室。

15个实验室分别归属5大研究领域,其中机器智能领域实验室最多。

机器智能研究领域实验室:语音实验室、视觉实验室、语言技术实验室、决策智能实验室、城市大脑实验室。

机器智能领域介绍

阿里巴巴达摩院机器智能研究领域主要围绕机器学习等前沿技术开展理论与应用研究,帮助零售、医疗、司法、交通等行业提升效率,推动经济、空间技术、自动控制、计算机设计和制造等领域的变革。

机器智能研究领域下设语音、视觉智能、语言技术、决策智能、城市大脑五个实验室。


金榕 达摩院机器智能研究领域负责人

金榕

卡耐基梅隆大学计算机博士。曾任密歇根州立大学终身教授,NIPS、SIGIR会议主席及KDD等委员会委员,美国国家科学基金会Career Award。长期致力于统计机器学习,重点关注大数据分析及其在信息检索、电子商务等领域中的应用。

机器智能 语音实验室

致力于语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等下一代人机语音交互基础理论、关键技术和应用系统的研究工作。形成了覆盖电商、新零售、司法、交通、制造等多个行业的产品和解决方案,为消费者、企业和政府提供高质量的语音交互服务。

研究方向

  • 语音识别及语音唤醒

面向家居、车载、​​办公室、公共空间、强噪声、近远场等复杂场景,研究多语言、多模态、端云一体的语音识别及唤醒技术,通过平台方式提供丰富的开发者定制模型自学习能力,让业务具备语音模型的自定制能力。

  • 语音合成

研究高音质、高表现力的语音合成技术及个性化语音合成,说话人转换技术,主要应用于语音交互、信息播报和篇章朗读等场景。

  • 声学及信号处理

研究声学器件、结构和硬件方案设计,基于物理建模和机器学习的声源定位、语音增强和分离技术、以及多模态和分布式信号处理等。

  • 声纹识别与音频事件检测

研究文本相关/无关声纹识别、动态密码、近场/远场环境声纹识别、性别年龄画像、大规模声纹检索、语种方言识别、音频指纹检索、音频事件分析等。

  • 口语理解及对话系统

基于自然语言理解技术,构建语音交互场景下的口语理解和对话系统,提供给开发者自纠错能力及对话定制能力。

  • 端云一体语音交互平台

综合应用声学、信号、唤醒、识别、理解、对话、合成等原子能力,构建全链路、跨平台、低成本、高可复制性、端云一体的分布式语音交互平台,帮助第三方具备可扩展定制化的场景能力。

  • 多模态人机交互

业内首创在公众场所强噪音的环境下实现免唤醒远场语音交互,并结合流式多轮多意图口语理解,业务知识图谱自适应等技术,面向公共空间真实复杂的场景提供自然语音交互体验。

产品及应用

  • 多模态人机交互致力于用最自然的人机语音交流方式,打造公共空间真实场景下的智能服务机器。主打业内首创的强噪声环境下的免唤醒语音交互、语音识别、流式多轮多意图口语识别等技术,已应用于交通行业和新零售行业。1)地铁语音售票机:全球首台地铁语音售票机,用户能够用该机器进行语音站点查询、语音模糊地点查询并完成路径规划;用户购票时间由30秒下降至10秒。2)快餐店语音点餐机:用户可以用人机交流式的语音交互方式,完成客制化点餐需求的快速下单。
  • 智能语音客服应用于智能语音导航(电话客服机器人、快递咨询等)、智能外呼(催收、回访、发货前确认等)、金牌话术、智能质检、App服务直达等多种场景。目前已落地于支付宝95188热线、菜鸟电话机器人、中国平安培训助手、中国移动智能客服等。
  • 端云一体语音交互提供全链路语音交互的能力,跨平台接入各类设备,具备有交互系统的场景化、定制化能力和主动交互能力。1)车载语音智能助手:已与上汽荣威、福特等汽车品牌合作。2)远场语音电视:阿里-海尔五代人工智能电视,用户与电视机进行远场语音交互。
  • 司法政务语音助手将语音识别技术、防串音处理技术、自然语言理解、大数据分析等技术综合运用,用于庭审语音识别与记录、案件分析等场景。目前已应用于浙江高院、福建高院等客户,覆盖全国28个省市,超过1万个法庭。
  • 开源DFSMN声学模型开源新一代语音识别声学模型DFSMN,将公开英文数据库上的语音识别准确率提高至96.04%,是近年来语音识别领域极具代表性的成果之一。

研究团队

鄢志杰

鄢志杰 达摩院语音实验室负责人

中国科学技术大学博士,IEEE高级会员。长期担任语音领域顶级学术会议及期刊专家评审。研究领域包括语音识别、语音合成、声纹、语音交互等。曾任微软亚洲研究院语音团队主管研究员。

付强

付强 达摩院语音实验室研究员

西安电子科技大学博士,曾在美国OGI从事博士后研究。在IEEE Trans等学术刊物及会议上发表论文近百篇。曾获中国科学院杰出科技成就奖(2014年)、中国语音产业联盟先进个人(2016年)。

马斌

马斌 达摩院语音实验室研究员

香港大学博士。加入阿里前,他是新加坡资讯通信研究院 (I2R)的语言技术部门负责人和资深研究员。曾任 IEEE/ACM 音频、语音及语言处理期刊和Elsevier语音通信期刊的编委。是INTERSPEECH 2014年技术委员会联合主席,曾获新加坡总统科技奖。

冯津伟

冯津伟 达摩院语音实验室研究员

弗吉尼亚理工大学博士。师从音频声学泰斗沙家正先生,并与导师一起研制出了全球第一台扬声器纸盆共振频率的自动测试系统。曾主持开发基于麦克风阵列的视频跟踪系统。

李威

李威 达摩院语音实验室资深算法专家

香港大学计算机系博士。曾任百度语音技术部资深工程师,负责百度语音识别声学模型、语音合成核心算法及训练流程的研究和开发工作。现负责大规模声学模型、语言模型研究及产品化工作。

高杰

高杰 达摩院语音实验室资深算法专家

中科院博士。曾任微软STC语音科学家,负责基于分布式计算平台的超大规模语音识别模型训练系统的研究和开发工作。现负责语音识别大规模解码器核心引擎等工作。

雷赟

雷赟 达摩院语音实验室资深算法专家

德州大学达拉斯分校博士。拥有50篇会议和期刊论文。研究领域包括声纹识别、语种识别、音频检测、语音识别、机器翻译、自然语言理解、推荐系统等。曾任Facebook和SRI的研究科学家。

王雯

王雯 达摩院语音实验室资深技术专家

普渡大学计算工程博士。在IEEE/ACL会议和期刊上发表了100篇以上的论文。研究领域包括自然语言理解、自然语言处理、机器翻译、深度学习、语言模型、语音识别等。曾任SRI资深研究科学家。

机器智能 视觉实验室

致力于研发与运用图像和视频的分析和理解、三维视觉等技术,构建以图像视频为媒介的产品和应用,提升商业效率或创造商业新机会,广泛应用于新零售、新媒体、新制造等领域。

研究方向

  • 图像理解与分析

研发图像分类、目标检测、特征表示学习、关键点提取、大规模向量搜索引擎等基础技术,解决商品图像,通用图像,人脸人体,文本图像的识别、搜索、分析等问题。

  • 视频理解与挖掘

研发视觉跟踪、视频标签、视频生成等基础技术,解决在海量视频中进行高效和稳定的视频审核、搜索和编辑等问题。

  • 图文理解

研发图文互搜、图文共搜、价格预估等跨媒体内容理解的核心技术,解决跨媒体内容理解与分析等问题。

  • 三维视觉

研发硬件扫描、点云处理、纹理映射、三维分类/检测/特征表达等基础技术,解决小物体、人体及人部件在特定场景的三维模型生成、识别、搜索等问题。

  • 线下智能

研发摄像头网络、传感器融合、行人跟踪与重识别、人体姿态估计、物体检测与识别等基础技术,解决人的身份识别、人的全域追踪、动作序列分析、商品定位和识别、人货绑定等问题。

产品及应用

  • 拍立淘和图像搜索云产品研发了业界领先的图像搜索与识别技术,并应用于多种场景。每天有超过1700万人通过淘宝和天猫使用拍立淘的以图搜图功能。基于阿里云平台,研发了图像搜索云产品,为具有海量图像搜索需求的客户(如电商、相册、图库类网站)提供完整的以图搜图解决方案。目前已经有若干海外和国内用户,比如澳洲和新西兰领先的时尚和运动零售商THE ICONIC。了解更多
  • 三维智能制造通过三维视觉技术,提供行业个性化定制方案,打通消费者、品牌商和工厂的链路通道。目前在鞋履产业,通过高效精确的三维扫描和搜索匹配算法,实现精准鞋款推荐、精准营销;并通过制造端楦体自动生成、智能推理等技术降低个性化定制的成本,实现精准制造。了解更多
  • 媒体AI解决方案通过多媒体数据的审核、标签、内容生成、版权保护等多维度的媒体AI技术,提升传统媒体行业能效并节省成本。已与中央电视台、东方卫视、央视网、新华社等国内传媒巨头建立合作。
  • 新零售场景人货场数字化使用摄像头等传感器和视觉技术改造原有门店或者构建全新无人店,实现店铺内对人的追踪和空间定位、货架商品SKU识别及货架陈列合规的检查、人货关联等功能,从而推动商场、超市、酒店等的人货场数字化,并在此基础上做进一步的商业分析。该方案已经被用于盒马门店。

研究团队

任小枫

任小枫 达摩院视觉智能实验室负责人

华盛顿大学计算机科学与工程系客座教授,拥有加州大学伯克利分校博士学位。加入阿里巴巴之前,曾担任亚马逊资深主任科学家,负责Amazon Go计算机视觉算法的研发。相关论文被引用10,000次以上,是CVPR和ICCV会议的领域主席。

ZELNIK, Lihi

ZELNIK, Lihi 达摩院以色列实验室负责人

曾任以色列理工学院电气工程系的副教授,纽约康奈尔大学的客座教授。拥有魏茨曼科学研究所计算机科学博士。一直致力于计算机视觉的研究。 曾任CVPR'16的项目主席,TPAMI的副主编,多次担任CVPR,ECCV的区域主席,并担任ACCV'18和CVPR'19的奖项委员会成员。在2021/22年,她将担任CVPR'21和ECCV'22的主席。

潘攀

潘攀 达摩院视觉智能实验室研究员

拥有伊利诺伊大学芝加哥分校博士学位。拍立淘以图搜图的创始人之一,研究领域包括深度学习、视觉搜索与识别和三维视觉等。曾先后在三菱美国研究院和富士通北京研发中心从事视觉技术工作。已发表20余篇论文,拥有多项授权专利。

刘铸

刘铸 资深技术专家

纽约大学博士,研究领域包括视频内容理解和分析,三维视觉,机器学习。曾任AT&T科研实验室主任科学家,哥伦比亚大学和纽约大学的客座教授。拥有140多项美国专利,发表70余篇论文。曾获AT&T科技奖章。IEEE高级会员,IEEE TMM和SPL副主编。

Itamar Friedman

Itamar Friedman 资深技术专家

拥有以色列理工学院电子工程学院的计算机视觉和机器学习硕士学位。研究领域是基于深度学习的视频和图像分析。他曾是Visualead的首席技术官,在机器人和网络开发领域曾连续创业。曾是Microsoft Accelerator TLV的导师,指导以色列领先的医疗和无人机领域的AI创业公司,拥有多项专利。

机器智能 语言技术实验室

致力于实现人与机器之间用自然语言进行有效沟通的各种理论和方法。包含自然语言处理核心技术,如分词、词性、句法、语义等多语言基础模块,以及情感分析、信息提取、机器翻译和机器阅读理解等技术的研究,已经在客服、资讯、司法、医疗等场景有广泛的应用。

研究方向

  • 基础技术

研究词法、句法、多语言、知识表示和推理等基础技术,全面支持阿里经济体自然语言技术和应用需求,每日调用达到8000多亿次。

  • 语义计算

研究自然语言理解和语义分析等技术,应用于智能问答、文本摘要、文本复述/推理等问题。

  • 应用技术

研究情感分析、文本分类、(基于语意的)信息检索、推荐算法、文本生成、事件提取等技术,应用于电商,通讯,司法,资讯等场景。

  • 机器翻译

研究文本机器翻译技术和多模态机器翻译(语音翻译,图像翻译)等技术。支持中、英、俄、西班牙、泰、印尼等20余种语言,45余种语言方向,日均调用量超7亿次。

产品及应用

  • AliReader针对用户问题,依靠算法分析相关非结构化文本(文档、描述、网页等),并从文本中获取答案,在客服、资讯、培训等场景有着广泛的应用。分别上线阿里小蜜、店小蜜、云小蜜等产品,快速高效建立问答能力,减少人工预处理工作。
  • AliTranx通过机器翻译、跨语言检索、小语种词法分析等技术能力,解决买卖家之间的语言障碍。阿里翻译技术在多项国际比赛中夺冠,目前已广泛应用于阿里巴巴国际B2B、速卖通、Lazada跨境电商平台等场景,每日调用量达7亿多次,未来还将通过阿里云赋能合作伙伴。
  • AliNLP自然语言技术平台。包括全方位的NLP基础技术,如文本数据收集与处理技术,多语言的词汇、句法、语义、篇章级分析技术,文本分布式表示技术,以及情感分析、文本反垃圾、问答等垂直技术,每日服务调用6000余亿次。
  • 司法大脑结合达摩院在文本生成、知识图谱、信息提取、深度神经网络、信息检索等方向上的技术能力,全面梳理法律知识、总结证据标准、提炼审判规则、解构案件和法规,形成司法知识图谱,助力法官实时预判,提供参考裁判文书。已联合浙江省高院和浙江大学,三方协作共同打造“司法大脑”。
  • 病历质检系统利用NLP技术及医疗知识图谱对病历质量进行深度把关,促进病历的电子化和书写规范化,提高医疗效果、降低医疗风险,释放医务人员的人力,让他们能够专注于管理、教育与医学培训。病历质检系统可以进一步辅助推进国家健康人口数据平台的建立,协助提升我国人民的健康指数。

研究团队

司罗

司罗 达摩院语言技术实验室负责人

卡内基梅隆大学博士。曾任普渡大学计算机系终身教授。曾获美国国家科学基金会成就奖、雅虎、谷歌研究奖等,发表过150余篇学术论文。先后担任ACM信息系统,ACM 交互信息系统和信息处理与管理编委会副主编。

黄非

黄非 达摩院语言技术实验室研究员

卡内基梅隆大学博士。在顶级会议和期刊发表文章近30篇,曾担任ACL、NLPCC等领域主席、IJCAI资深程序委员。曾在Facebook、IBM Watson等从事NLP相关工作。现负责组建国际化翻译创新团队。

葛妮瑜

葛妮瑜 达摩院语言技术实验室研究员

布朗大学计算语言学博士。研究领域包括句法、语义和语用的数学模型;在机器翻译方面,从事阿拉伯、汉、英、法、西、德、意、葡、俄等语种工作。曾任职IBM研究院,从事自然语言处理和机器翻译工作。

陈博兴

陈博兴 达摩院语言技术实验室资深算法专家

中国科学院博士。曾是新加坡信息与通信研究所、加拿大国家研究委员会研究员。发表50多篇会议和期刊论文,曾获MT Summit 2013最佳论文奖。研究领域包括机器翻译、自然语言处理和机器学习等。

骆卫华

骆卫华 达摩院语言技术实验室资深算法专家

曾任中科院计算所高级工程师,承担国家重大专项或自然科学基金课题十余项。现为自然语言处理-翻译平台负责人,组建并带领团队搭建阿里巴巴国际化翻译技术基础设施。

张琼

张琼 达摩院语言技术实验室资深算法专家

浙江大学博士,曾在威斯康星大学麦迪逊分校做博士后研究。拥有多项专利,研究成果发表在SIGIR、AAAI、NAACL等国际会议上。曾在雅虎工作。现负责自然语言处理-信息抽取和知识发现方向。

机器智能决策智能实验室

致力于通过研发与运用机器学习和运筹优化技术构建智能决策系统,提升业务运营效率、降低运营成本和增加运营收益。与合作伙伴在计算资源优化、新零售、智慧物流等行业构建多个创新系统,在各类公共事业的场景中提升人效、能效、物效。

研究方向

  • 机器学习

研发大规模数据分析,深度学习模型构建及大规模模型训练技术,解决数据驱动的智能化问题。

  • 运筹优化

研发优化复杂系统的技术,解决现实中的复杂决策问题,如优化库存、计算、流量等资源的配置问题等。

产品及应用

  • “达灵”计算资源优化达灵系统是针对计算基础设施的智能化解决方案,通过与计算资源管理系统的有效结合,使用机器学习和运筹优化技术实现更为优化的计算资源使用方案,从而提升计算基础设施的稳定性和利用率。达灵解决方案包括以下功能模块:1)智能运维,如异常检测预警和预测维保;2)应用画像,如使用量预测和干扰检测等;3)调度控制,如资源最优编排、在线调度、批量调度、重调度、负载均衡、弹性伸缩方案等;4)资源规划,如资源容量规划、基础设施规划及推演。 2017年双11,存储调度将资源使用降低25%,资源峰值水位降低30%;集群调度将CPU分配率从70% 拉升至并维持在90%。

微灵

  • “微灵” 模型压缩与端上智能微灵系统通过改进深度网络的计算与结构来提升深度学习模型的储存空间与计算速度。它将现有的深度学习模型压缩了40-100倍,在手机端计算速度提升2-4倍,从而可以在手机上直接运行深度学习复杂网络。结合FPGA的体系结构来调整深度学习的模型结果,相对GPU速度提升170倍。微灵系统产生的模型已用于各类手机的应用、遥感图像识别、农作物生长周期预测、轮胎缺陷检测等项目。
  • “龙灵” 零售个性化流量优化龙灵系统是通过分析行为构建行为表征,利用在线决策的流量进行个性化、以及流量确定性的优化处理,形成智能化的流量技术。其广泛应用于各类泛零售业务,例如天猫、优酷、盒马和闲鱼等业务;其中线上运营决策系统在天猫双11发挥重要作用,调用量超过6亿次/日。
  • 遥感 国土资源监管 联手阿里云设计开发国土资源监管系统。通过分析高分辨率遥感图像,应用于河流湖泊污染监察、森林盗伐事件监管、基本农田侵占监督、灾害状态监控等诸多领域。通过深度学习算法,可快速精准地发现存在污染、盗伐、侵占和灾害的可疑地区,为国土、环保、水利等部门提供决策支持。已与山东省淄博市国土局合作,帮助该局进行违章建筑物排查,节省了95%的人力,审查周期从年度变为月度。了解更多
  • 水务防汛预测 联手阿里云设计开发水务防汛预测。根据河流路线、水库分布情况,结合以往汛期水位、历史天气、台风路径等信息分析各条河流、水库水位的相互关系。同时,还能根据实时水位数据、借鉴未来天气情况,预测河流、水库的防汛基本情况。未来,防汛系统不仅能预测水位变化、汛情发展,还能评估每个预案的受灾人群、经济损失及各个预案采取后的救灾资源、疏散方案的自动调度。已与浙江省金华市防汛防旱指挥部办公室合作。
  • 智慧农业 联手阿里云设计开发各种农业智能系统,防止农作物病虫害。基于深度学习技术,在虫害或疾病早期实时、精准地发现被感染作物,帮助农场打造“实时的防虫墙”。该技术还可以作为“AI农业专家”,进行农作物生长周期识别、种植面积统计等,有效指导农事活动、植保等工作。已与上海市崇明区农业委员会合作,探索新农业。了解更多
  • 智能床位调度 联手阿里云设计开发的智能床位调度系统,解决“看病难,看病贵”中的医疗资源紧张问题。该系统通过挖掘历史数据,结合医患双方数据参数,提供床位分配的最优方案,提高医疗资源的合理分配与使用效率,提升患者的就诊体验。未来,将深入打通入院排床、术前体检、手术室排班、术后恢复等一系列环节,以数据驱动实现医疗资源的合理分配及充分利用,提升医院管理水平,为病人提供全新就诊体验,助力国民健康新生活。已与浙江大学医学院附属妇产科医院合作。

研究团队

姚韬

姚韬 达摩院决策智能实验室研究员

拥有斯坦福大学管理工程与科学系博士学位,美国宾州州立大学工业工程系终身教授。研究领域包括优化、机器学习、随机模型、商业分析、统计、博弈论、人工智能、运筹学、数据科学、供应链和交通等。

许欢

许欢 达摩院决策智能实验室资深算法专家

加拿大麦吉尔大学电子工程系博士。曾任新加坡国立大学副教授,佐治亚理工大学助理教授。研究领域为机器学习、运筹学、马可夫决策过程与强化学习、优化、高维统计等。发表顶级会议论文近百篇,引用近三千次,曾任NIPS领域主席。

谭剑

谭剑 达摩院决策智能实验室资深算法专家

哥伦比亚大学电子与计算机系博士,俄亥俄州立大学电子与计算机系助理教授,IBM沃森实验室研究员。研究领域为随机过程,统计算法,分布式计算系统。多次获得国际会议最佳论文奖;行业顶级会议sigmetrics 2019年出版主席;获得美国自然科学基金支持,发表50多篇论文。

张京桥

张京桥 达摩院决策智能实验室资深算法专家

拥有伦斯勒理工学院博士学位,曾任亚马逊Device部门应用科研资深经理,负责Echo产品个性化推荐,此前从事电商供应链优化及精准营销等领域的算法研究和应用工作。博士研究方向为遗传优化和模式识别,期间发表一篇学术专著及十余篇论文,被引用一千多次。

杨程

杨程 达摩院决策智能实验室资深算法专家

10余年机器学习、数据挖掘等经验,曾负责搜索推荐、智能营销、供应链优化等商业化算法,多次参与双11等极端环境下的大规模实时机器学习项目,目前关注新零售场景中的在线学习、动态优化等智能决策研究。

机器智能 城市大脑实验室

致力于通过互联网和人工智能,打通城市数据管道,发掘数据价值,构建城市新的基础设施。已在杭州、苏州、上海、衢州、澳门、马来西亚等落地,覆盖交通、平安、市政建设、城市规划等领域。 是首批国家人工智能开放创新平台之一,是目前全球最大规模的人工智能公共系统之一。

研究方向

  • 多模态大数据感知

通过多视角学习方式融合多源异构数据,实现对城市参与者的全面多维感知。

  • 城市交通预测与干预

基于大规模路网结构,针对交通拥堵治理问题,进行分析预测和智能干预。

  • 城市大规模并行异构计算

通过并行异构计算来加速在海量实时异构数据网络上的计算和处理过程。

  • 城市复杂环境感知与理解

对城市环境进行有效的感知建模,并设计对于环境鲁棒的自适应计算机视觉算法。

  • 城市视觉搜索引擎

利用视频的动态特征信息进行行人与行为的特征建模,进一步完成搜索识别。

  • 城市市政规划和公共资源分析

基于大数据智能分析,结合城市发展规律,对城市的基础设施布局和公共资源分配进行智能分析和决策。

产品及应用

  • 城市视觉智能引擎依托于阿里云分布式计算和存储平台,利用先进的视频图像、图形学处理技术和深度学习算法,建立城市级人工智能模型,实现对整个城市视觉数据的接入、计算、分析、索引和挖掘,并赋能公共安全、交通、市政综治、商业、司法、园区、电力能源、医疗教育等各个行业场景。
  • 天擎城市大脑的大规模视觉计算平台。包含视频接入系统、实时/离线计算系统与视觉搜索系统三大组件,对外提供完备的大规模视觉计算解决方案。“天擎”已实现云端快速弹性部署,是面向安防的创新产物,为客户按需提供智能分析能力,有效提升智能分析效率。“天擎”可实现视频分析千倍加速,处理16小时视频仅用1分钟。
  • 天曜全时全域交通自动巡逻报警系统。能够对城市里面的交通事件、事故进行全方位的实时感知,自动发现人、车、物、事件全要素的异常,自动识别交通事故、违章行为并在20秒内推送给指挥中心,准确率达95%以上。能够实现对城市交通进行7*24小时不间断巡检,减少交警路面巡逻工作量,降低交警安全风险,并将交警从查看监控的任务中解放出来,提高执法效率。
  • 天机车流人流预测系统。通过区域内的历史和实时视频数据,实时准确地预测全区域未来的车流、人流情况,为道路疏导、管控决策提供参考,规避拥堵和踩踏等安全隐患问题。目前,在预测未来1小时内车流、人流方面,准确率达90%以上。
  • 天鹰渐进式视频搜索引擎。基于对全局视频资源的实时搜索,快速定位特定对象,如查找失踪人口、追踪肇事逃逸车辆等,只需1-2秒的处理时间,且行人识别准确率达到96%以上。
  • 天镜市政建设与管理系统。为城管、安监、消防、住建、公安等政府各职能部门提供市政事件的视频自动巡逻告警服务,辅助人工巡查,消除市政建设的隐患点,提高市政管理的智能化水平。
  • 城市解决方案• 杭州: 视频巡检识别准确率92%以上,互联网信号灯全自动调控车辆,通行速度提升15%,特种车辆(救护车、消防车等)优先通行效率提升50%。• 苏州:对公交进行数据优化,两个试点公交线客流量分别增加17%和10%,提升公交分担率。• 上海:将交通、能源、供水、建筑等基础设施数字化处理和分析,为安防、公共交通、公共服务提供智能决策。• 雄安新区:携手新区打造以云计算为基础设施、物联网为城市神经网络、城市大脑为人工智能中枢的未来智能城市。• 衢州、嘉兴:“渐进式视频搜索引擎”上线一月后破获侵财案件15起、走失案4起、不文明现象曝光近万次,专注于城市市政建设与管理,为城管、安监、消防、住建、公安等政府各职能部门提供市政事件的视频自动巡逻告警服务,代替人工巡查,提高了市政管理的智能化水平。

研究团队

华先胜

华先胜 达摩院城市大脑实验室负责人

北京大学应用数学博士,IEEE Fellow,ACM杰出科学家。曾任ACM Multimedia、IEEE ICME等国际会议程序委员会主席,全球MIT TR35获得者。研究领域包括视觉识别、搜索等。

张磊

张磊 达摩院城市大脑实验室高级研究员

西北工业大学自动化学院博士,IEEE Fellow。曾在香港理工大学电子计算学系任研究助理和副研究员,加拿大麦克马斯特大学博士后。香港理工大学电子计算学系讲座教授。研究兴趣包括计算机视觉、图像处理、模式识别等。论文200多篇,引用超3万5千余次,H-index为91,连续4年被评为 Clarivate Analytics Highly Cited Researcher(2015-2018年)。现任或曾任IEEE Trans. on Image Processing、SIAM Journal of Imaging Sciences、IEEE Trans. on CSVT、Image and Vision Computing及SPIE Journal of Electronic Imaging等期刊的编委或高级编委。

数据计算领域介绍

阿里巴巴达摩院数据计算研究领域旨在重构融合、开放、安全、敏捷、生态化的信息基础设施,解决计算性能、计算效率、计算能耗等问题,满足人、机、物即时互联、信息共享和智能应用的需求,形成全球化的智慧计算生态。

数据计算研究领域下设计算技术、智能计算、数据库与存储三个实验室。

数据计算 计算技术实验室

致力于计算、存储、互联方向的前沿性研究,探索从系统软硬件架构到芯片设计技术的全栈实现。采用自上而下基于应用驱动和自下而上基于新技术的研究方法,利用系统架构、计算机体系结构、芯片设计优化等领域的技术积累,在计算资源优化、新计算体系方向等构建创新系统,提升计算能力。

研究方向

  • 系统架构方向

系统软硬件综合设计,针对新型计算技术的指令集、体系结构、编程语言和编译技术。

  • 计算技术方向

针对新计算技术的应用、体系结构、电路设计、设计自动化等, 例如三维集成电路、近似计算、超低功耗芯片设计等。

  • 存储技术方向

新型存储器件在计算体系中的应用,包括三维存储、非易失性存储、存内计算技术等。

  • 互联技术方向

芯片内和片间互联架构,包括片上网络(NoC)、光互联技术、无线互联技术等。

  • 芯片工程

致力于研究到工程实现的转化,针对特定应用的加速芯片实现高性能、低功耗的计算芯片架构及系统。

产品及应用

  • AliNPU

聚焦于人工智能领域的计算需求,设计针对AI应用的NPU,提升阿里巴巴集团内部各种人工智能业务的计算能力。

研究团队

谢源

谢源 达摩院计算技术实验室负责人

IEEE Fellow,普林斯顿大学博士。研究领域主要包括计算机体系结构、集成电路设计、电子设计自动化、和嵌入式系统设计。发表过近300篇期刊和会议论文。

骄旸

骄旸 达摩院计算技术实验室研究员

负责组建芯片开发工程团队,目前的开发重点是人工智能芯片。曾在华为创建并领导美国和上海的技术团队进行全新GPU开发;在三星作为GPU团队的核心成员,参与项目的规划和创建团队。

何建德

何建德 达摩院计算技术实验室资深技术专家

曾在硅谷从事计算机绘图芯片设计工作,又先后在S3、TSMC、Broadcom、Qualcomm负责所有算法,微架构操作数设计与Shader core 布局设计。为Qualcomm设计的Shader core协助Adreno graphics Core稳占其竞争优势。

李伟良

李伟良 达摩院计算技术实验室资深技术专家

负责组建AliNPU上海ASIC团队。曾在S3 Graphics从事图形芯片的设计,后供职于AMD,负责上海研发中心的GPU IP设计部门,参与开发当前主流的图形芯片,致力于优化芯片的PPA。在ASIC前后端的各个环节拥有丰富经验。

尹莉

尹莉 达摩院计算技术实验室资深技术专家

负责芯片技术部软件部门,精于体系结构、编译器以及系统性能优化。曾在S3 graphics图形芯片架构部门,负责图形芯片可编程流水线以及后端编译器优化;后在Intel MLT部门从事二进制翻译、虚拟机以及spark性能优化。

张涛

数据计算 智能计算实验室

致力于下一代海量、异构数据的分布式存储、管理、查询、分析和机器学习系统与算法的研究和应用。通过并行与分布式数据处理和云上系统资源管理,多场景、多模态、异构计算引擎融合统一系统智能与自治化,数据安全隐私计算等关键技术,为各行业、各场景提供高效的算法支持和安全、可靠、强有力的计算引擎。

研究方向

  • 下一代多场景多模态异构计算引擎

融合与统一批处理、交互式处理和流处理等多种计算模态,研究近似查询、渐进式执行等新技术,支持传统数据分析、图计算、机器学习等各种应用场景和计算需求下一代计算引擎。同时在计算引擎中研究利用GPU、FPGA、ASIC等异构硬件高效率和低延迟的计算性能,将异构硬件的计算能力与传统通用计算整合,更好地满足人工智能、高性能数据分析等计算密集型领域的计算需求。

  • 大规模多样性数据挖掘和机器学习算法及应用

研究在大规模多样性数据(如结构化数据、图数据、信息网络等)上的高效数据挖掘算法和机器学习算法,探索和融合大规模图表征学习、知识图谱等新技术,应用于在线反作弊、推荐系统、和提高搜索效能等场景,服务普惠到社会生活中。

  • 智能与自治化系统

将系统技术与人工智能技术相结合,利用人工智能技术在数据仓库管理、资源调度、引擎优化等各个方面的优势加强与改进系统;同时使用系统技术辅助人工智能中的模型选择、元参数搜索等工作,进行自动的元学习,从而帮助系统变得更加智能,更加安全可靠。

  • 数据安全和隐私保护

研究如何在数据采集、数据共享和数据呈现等多个可能泄露个人敏感信息的数据处理阶段有效保障数据安全和用户隐私,同时降低数据损耗并提供高效的数据分析能力。

  • 超大规模图计算

研究以深度学习和图计算结合的大规模图表征学习为代表的机器学习算法和基于图的知识图谱技术,研发新型架构的超大规模图计算引擎和超大规模知识图谱推理系统。在信息检索、分布式计算、大规模系统设计、机器学习、人工智能、自然语言处理等相关领域做出突破贡献。

产品及应用

  • 超大规模图推理引擎图形推理与深度学习相结合,在阿里巴巴的许多业务场景中取得了成功的分阶段结果。例如,个性化推荐系统是信息过滤的重要手段,可以根据习惯和爱好推荐合适的产品或服务。传统的推荐系统存在稀疏性、冷启动和信息可重复性的问题,而大规模图表示可以有效地利用自然人的全球信息。我们正在开发新一代图形学习平台,可以有效地对数十亿个节点和数万亿个边缘进行推理分析。
  • 电子商务反作弊解决方案反作弊大致分成渠道设备反作弊和流量反作弊。渠道设备反作弊的主要任务是识别可疑的模拟器、设备牧场等。我们从各种日志提取设备的各类稀疏和稠密特征,并对Google的Wide&Deep模型基于相关业务场景进行了有效的改造,每日可识别千万级高可信的作弊设备。流量的反作弊更多的是和业务场景强相关。通过进行全局的考虑和建模,聚合可疑流量,在同一个cluster内进行信息的增强和互借,进而提高模型的可信度。我们基于业务的需求和定义提出一系列图模型,每日可在全量流量日志中抓取数百万高可信的作弊cookie。此项成果也被《中国计算机学会通讯》和人工智能顶会IJCAI收录报道。

研究团队

周靖人

周靖人 达摩院智能计算实验室负责人

哥伦比亚大学计算机博士,IEEE Fellow。拥有几十篇顶级会议和期刊论文,并持有多项专利发明。研究领域包括基于大规模分布式系统的数据计算处理方法和机器学习算法平台。曾任微软研究院研究员、微软研发合伙人。

丁博麟

丁博麟 达摩院智能计算实验室资深技术专家

伊利诺伊大学香槟分校博士。研究成果发表于SIGMOD等多个领域的顶尖国际会议,常年担任重要国际会议评审委员会评委。研究领域包括大规模数据的管理和分析等。曾担任美国微软研究院研究员。

钱正平

钱正平 达摩院智能计算实验室资深技术专家

华南理工大学博士。在系统及相关领域顶级会议发表多篇论文,并曾获EuroSys’12最佳论文奖。研究领域是分布式系统与数据并行计算。曾任微软亚洲研究院主管研究员。

杨红霞

杨红霞 达摩院智能计算实验室资深算法专家

杜克大学博士。拥有顶级论文30余篇。曾任IBM Watson研究员、Yahoo!主任数据科学家等职。目前致力于研发新一代结合超大规模知识图谱和图计算的推理系统。

曾凯

曾凯 达摩院智能计算实验室高级技术专家

加州大学洛杉矶分校博士,曾在美国加州大学伯克利分校AMP Lab从事博士后研究。拥有顶级论文20余篇,获SIGMOD 2012年最佳论文奖等。研究领域包括大规模分布式系统和数据库系统。曾任微软资深科学家。

于文渊

于文渊 达摩院智能计算实验室资深技术专家

爱丁堡大学博士。研究成果发表于SIGMOD等多个领域的顶尖国际会议,曾获SIGMOD2017和VLDB2010最佳论文奖,VLDB2017最佳演示奖。研究领域包括数据质量管理、图数据管理与计算等。曾担任七桥科技CEO、美国Facebook 研究科学家等。

数据计算 数据库与存储实验室

致力于新硬件加速、智能与自治化数据库、云上数据管理和系统资源调配、多态数据引擎、非结构化数据管理、数据库核心算法、数据存储、并行与分布式数据处理、数据安全等关键技术研究,实现数据库系统和底层存储系统高并发、高可靠性、分布式处理、数据一致性以及高响应和深度的数据分析能力。

研究方向

  • OLTP(线上事务处理)与HTAP(线上混合事务与分析)引擎

在单节点架构下,通过共享存储和状态的技术手段,将数据存储到多个节点上以实现拓容和事务处理的单机向上拓展能力。在多节点集群架构上,通过分片的技术手段构建分布式数据库以实现事务处理的集群向外拓展能力,同时通过GTM来进行事务并发的调节和数据读写一致性的控制HTAP引擎则实现了在一份数据上同时进行事务处理和分析处理的能力。

  • 多模/多态,OLAP(实时在线分析)的NoSQL / NewSQL数据库系统

面对结构复杂而内容丰富的多模/多态数据,数据库系统需要对这类结构化,半结构化和非结构化数据进行融合分析,整合与清洗;实现结构化的特征提取和处理,需要不断提升的NoSQL / NewSQL以及实时在线分析系统的适用性,性能和效率。

  • 数据安全与数据库系统安全

在传统的访问控制,防止SQL注入等基础上,一个核心挑战是如何在不牺牲数据库系统性能的前提下提高系统的安全和数据安全保护能力。数据库系统需要不断提高加密数据查询与更新(利用同态加密等相关技术),不经意随机存取,差分隐私等一系列关键技术在安全性和系统效率之间的平衡能力。安全硬件的快速发展也为发展安全数据库系统带来了新的机遇,例如如何利用英特尔SGX这样的安全硬件来构建新型加密数据库系统。

  • 自治化与智能数据库

通过分析系统运行环境状态和日志数据信息,利用机器学习手段建模,来实现动态系统参数调整和系统优化,减少系统DBA的运维成本。在数据库系统查询与分析优化器的关键模块上运用这些技术可以实现从规则优化器和初级的性能优化器向高级的机器学习模型为主的高纬度查询优化器的演变。机器学习技术也可以帮助系统建立更加准确高效的在线预警与实时监测系统,来实现智能的DBA运维管控和资源调配。海量结构化,半结构化与非结构化数据的分析建模则提出了如何建立深度数据分析的智能数据库系统的科研问题。

  • 新硬件加速与数据存储

数据库系统需要研发CPU / GPU / FPGA异构计算体系的计算流程,在优化多核高并行的数据查询与分析任务时,必须要考虑系统硬件的体系结构(例如NUMA架构),来减少数据移动并实现数据为中心的查询和分析模式。例如NVM和RDMA课题。

  • 数据库核心算法

数据库系统设计中的各个方向和各个层面都会涉及到一些核心的算法挑战,例如并发控制,数据处理,系统调度,近似计算,非结构化数据分析和特征提取等。有效的解决这些问题需要将算法设计思想与数据库系统的系统运行状态和特征有机的结合考虑,这要求数据库系统的核心算法构建不断地接受新挑战和迭代变化的要求。

产品及应用

  • 国家气象大数据解决方案 中国气象的气象大数据分析平台采用OLAP引擎的高吞吐实时入库和高并发读写支持并发复杂查询能力,基于聚集列实现单气象站历史数据毫秒级查询分析,存储从1957年建站以来6万气象站的分钟级数据,实现入库到应用展示分钟内业务目标。
  • 邮政/地产等行业解决方案 万科和中国邮政通过使用分布式数据库水平扩展等核心能力,线性提升了整体数据库存储及计算容量处理能力,通过分布式事务处理引擎提供的数据库拆分能力,快速地支持二者核心业务系统迭代,大幅节省客户针对数据库层面的运维成本。
  • 国家重大项目技术支持 支持公有云和专有云国家重大项目,例如上海城市大脑、国税等。

研究团队

李飞飞

李飞飞 达摩院数据库与存储实验室负责人

犹他大学计算机系终身教授。曾获ACM、IEEE、Visa、Google、HP、华为等多个奖项,获IEEE ICDE 2014 10年最有影响力论文奖、ACM SIGMOD 2016最佳论文奖、ACM SIGMOD 2015最佳系统演示奖、IEEE ICDE 2004最佳论文奖、美国NSF Career Award、中国基金委海外重点研发奖,2018年ACM杰出科学家等。担任多个国际一流学术期刊和学术会议的编委、主席。

曹伟

曹伟 达摩院数据库与存储实验室资深技术专家

阿里云数据库团队负责人,计算机协会数据库专委会委员。在SIGMOD、VLDB、TSC等国际学术会议与期刊上发表多篇文章。研究领域包括分布式数据库与存储系统、大规模实时计算等。

吴结生

吴结生 达摩院数据库与存储实验室研究员

俄亥俄州立大学计算机博士学位。2014年加入阿里云西雅图,任职存储基础平台和云存储的负责人。曾就职于微软 Azure 存储团队 (2008-2014年), Ask.com 基础设施团队(2004-2008年)和中国科学院计算技术研究所(国家智能计算机研究开发中心,1996-1999年)。研究兴趣包括大规模分布式系统和大数据处理和分析系统等。

占超群

占超群 达摩院数据库与存储实验室研究员

集团数据库事业部 OLAP Platform负责人,从无到有打造大规模在线云分析产品AnalyticDB、Data Lake Analytics,有多年海量数据分析平台的研发经验,先后担任多个阿里巴巴以及专有云大数据商业项目总架构师。

汪晟

汪晟 达摩院数据库与存储实验室Research Scientist

新加坡国立大学计算机博士。曾留校从事博士后研究。研究成果发表于VLDB等多个数据库及相关领域顶级会议。研究方向主要涉及大规模数据管理系统的设计与优化,包括分布式数据库,数据分析平台及区块链系统等。

张铁赢

张铁赢 达摩院数据库与存储实验室Research Scientist

张铁赢,曾就职于中科院计算所和卡耐基梅隆大学,CCF数据库专委委员,CCF大数据专委委员,研究方向为智能数据库与分布式系统,研究成果发表于SIGMOD, VLDB, ICDE, TPDS等顶会与期刊超过30余篇。

机器人领域介绍

阿里巴巴达摩院机器人研究领域主要围绕环境感知、高精定位、决策规划、智能控制等前沿技术方向,基于机器人技术进行无人驾驶、无人物流等方面的研发与应用,推动汽车、物流、服务等传统行业的价值重塑。

机器人研究领域目前下设自动驾驶实验室。

机器人 自动驾驶实验室

致力于机器学习、自动驾驶、物联网通讯、云端调控等技术研究,满足传统物流配送行业在人力成本、货物安全、交付速度、节能环保等方面的诉求,打造“车-路-云”一体化的智能物流网络,实现智能、精准、快速、高效、安全、环保的货物流转和投递。

研究方向

  • 环境感知

研究多传感器协同感知及融合技术,实现自动驾驶汽车对周围环境的关键信息收集和知识提取,其中包括可行驶区域、车道线、交通标志、交通灯、车辆、行人及所有障碍物的检测识别,车辆,行人等障碍物的位姿,运动状态等的预测;通过合理的多传感器布局配置方案来确保车周围360度覆盖和关键区域的增强覆盖;通过安全冗余设计的软件系统方案来保障车辆周围环境信息的准确感知,进而确保自动驾驶汽车的安全稳定运行。

  • 高精定位

探索基于高精度地图的高精智能定位技术,构建物理世界和数字世界的准确映射,为自动驾驶汽车提供精准的交通元素,POI等场景信息。研究云端的多源融合定位技术,搭建融合与处理的云平台,将车与人,车与车连接起来,形成一个动态的位置网络。这个网络在为自动驾驶提供位置服务的同时,也支持基于精确位置的数据收集和回传,对高精度地图进行在线更新,全面提升定位系统的准确性,可靠性和智能性。

  • 决策规划

决策规划分为驾驶决策系统和运动规划系统。驾驶决策系统通过大量实测的高精度交通流数据分析,探寻人类驾驶行为的本质机理,挖掘出最优的行为模型和参数,保证在线驾驶行为的最优化。运动规划系统在有限的计算资源下,搜索成千上万可能的运行轨迹,并根据周边环境信息挑选最优轨迹,实现自动驾驶的平稳行驶。

  • 智能控制

主要包含横向控制和纵向控制两个方面。横向控制主要研究自动驾驶汽车的路径跟踪能力,即如何控制车辆沿规划的路径行驶,并保证车辆的行驶安全性,平稳性。纵向控制主要是控制车辆速度跟踪能力,控制车辆按照预定的速度巡航。

  • 自动驾驶仿真平台

由交通智能体系统,场景编辑生成系统,虚拟世界渲染系统,大规模服务器部署系统组成。交通智能体系统通过大量的交通数据抽取逼真的行为模型,仿真车辆,行人等物体行为;场景编辑生成系统支持各种极端场景的编辑和类似场景的生成,实现对自动驾驶算法的压力测试;虚拟世界渲染系统将仿真场景进行可视化渲染,提高分析问题的直观感觉;大规模服务器部署系统提高仿真的规模和效率,实现每年上亿公里的仿真测试;仿真平台为自动驾驶的测试节省大量时间和费用,极大降低了测试风险,随机模拟各种极端复杂场景,实现全面的测试覆盖。

  • 数据平台

生产数据平台,数据生产流程化以及监控。为感知采集丰富的数据,以提高自动驾驶整车鲁棒性。研究如何建立高效的标注系统,减小标注的成本,提高效率和标注结果的准确率;研究如何更有效的监控车辆运行的状态和问题,以及把数据更加合理可视化;探索实际数据和仿真数据结合的过程提供结构化,半结构化,非结构化多种类型的数据整合,集成与索引。

  • 车路协同

通过车与路之间的协同合作,构建“车 - 路 - 云”三位一体的全新模式研究开发路侧端的多传感器感知,多模态数据融合与处理,低功耗边缘计算,中短距直连通信等技术,打造全新的路侧智能设备,为交通工具提供实时数据服务,并为云端提供全面的交通信息基础数据。

产品及应用

  • 智能物流车 深度参与国家智能物流骨干网络的建设,通过部署智能物流车队、智能感知基站以及铺设云端服务,构建起连接城际间物流仓储以及城市内配送中转站点的庞大网络,最大化利用不同时段下的道路资源,实现智能、精准、快速、安全、环保的货物流转与投递。

研究团队

王刚

王刚 达摩院自动驾驶实验室负责人

伊利诺伊大学香槟分校博士,曾任新加坡南洋理工大学终身教授。全球MIT TR35获奖者,人工智能顶尖期刊IEEE TPAMI编委,ICCV 2017和CVPR 2018领域主席。研究领域包括深度学习及其在计算机视觉、自动驾驶上的应用。

金融科技领域介绍

阿里巴巴达摩院金融科技研究领域致力于提升金融领域的连接、信任、安全和便捷,提升金融预测和决策能力,重塑可持续的普惠金融服务,用创新技术解决未来问题,为全世界带来更多平等的机会。

金融科技研究领域下设金融智能、区块链、生物识别三个实验室。拥有资深金融行业专家和顶级科学家,在杭州、北京、西雅图、硅谷、纽约等设有办公地点。

领域负责人

蒋国飞

蒋国飞 达摩院金融科技研究领域负责人 / 生物识别实验室负责人

蚂蚁金服副总裁。拥有160多篇顶级论文,曾获SIGKDD等会议最佳论文奖。研究领域有物联网、大数据、人工智能、云计算、计算机安全和软件定义网络等。曾任NEC集团副总裁,领导NEC全球研发。

金融科技 金融智能实验室

致力于满足金融领域对AI技术的安全性、可靠性、实时性、对抗性的更高要求,在图像识别、智能问答、知识图谱等方面有着业界领先的研究成果和成熟的商业产品,通过与商业伙伴的合作,提升其智能化的能力,推动金融业的智能进步。金融智能作为蚂蚁金服核心技术引擎之一,被广泛应用于智能客服、交易风控、支付营销、保险智能理赔、贷款准入、反欺诈反套现、财经资讯、基金推荐等商业场景。

研究方向

  • 大规模图模型及图嵌入模型

基于企业知识图谱,运营数据,工作流的企业智能分析和决策支持引擎以及金融知识图谱的金融智能推理和决策支持引擎,来研究图模型及深度学习在金融场景下的网络和图上的大规模算法和创新应用,包括万亿级资金交易网络的推荐,营销和风控问题。

  • 机器学习的数据安全和隐私保护

通过对隐私保护,信息安全和机器学习的结合以及多方金融数据源在互不共享数据情况下的分布式建模和分析的研究,不断提升其在金融多方数据利用能力。

产品及应用

  • 金融大脑 基于蚂蚁金服强大的技术积累,运用AI领域技术来形成金融领域的核心人工智能能力,赋能蚂蚁金服内部智能营销、智能安全、智能金融信息服务等能力,并通过平台化的产品,与生态伙伴和金融机构达成战略合作。企业图谱(风报):一款基于NLP处理技术的企业金融智能信息服务系统,涵盖工商、诉讼、税务、行政处罚、投融资、高管变动、新闻事件等26大类企业情报信息。“风报”包含全国近4,200万家工商登记主体信息,汇聚全网超过4万个数据来源的近10亿条行政公示、审判流程、企业信息披露和新闻媒体报道,并通过人工智能技术将非结构化的文本进行清洗、分析、关联,形成结构化的企业情报信息。自2016年上线以来,其已经在企业尽职调查、风险控制、合规审计、司法调查、行业研究和商机及投资机会筛选等场景上进行了广泛的应用,涵盖商业银行、保险、融资租赁、供应链金融、私募股权投资等典型客户。
  • 智能客服(零号云客服) 零号云客服由蚂蚁金融云和阿里云平台联合推出,目前已服务包括证券、保险、银行在内的3000余家金融机构。它是人工智能+公有云+云客服的综合解决方案(或私有云产品的部署),有效解决传统客服中心成本高、效率低等问题。目前,在不同行业应用中提供的自助服务占比高达85%,并实现对用户来电、文字问答的24小时实时响应。
  • 智能助理(小钻风) “小钻风”是通过语音、自然语言、图像与视觉、情感识别、人机对话等技术,结合相应的场景去理解用户信息、问题、意图与情感,以实现自然的人机交互及用户需求与服务的准确连接,进而提供一站式金融生活助理服务,并以平台的形式开放给行业合作伙伴。

研究团队

漆远

漆远 达摩院金融智能实验室负责人

蚂蚁金服副总裁,麻省理工学院博士,曾任普渡大学计算机科学系和统计系终身副教授。

宋乐

宋乐 达摩院金融智能实验室研究员

悉尼大学博士,世界知名机器学习专家,曾任佐治亚理工学院终身副教授。

金融科技 区块链实验室

致力于区块链中共识协议、密码学安全、跨链协议等技术的研究和应用,以商业与金融等应用场景为突破口,率先实现有自主权的工业级/金融级区块链系统。

研究方向

  • 共识协议

针对混合共识方案、新型共识协议的工程实践、共识协议的性能提升等。混合共识方案主要基于学术界的最新成果提出创新与改进。新型共识协议的工程实践包括基于随机化算法的共识协议和基于DAG模式的共识协议。共识协议的性能提升,是指通过并行化处理传统共识协议,在维持协议正确性与活性的同时,高效利用多核机器的性能,进而使得传统BFT协议的性能获得提升,并适用于其他共识协议。

  • 密码学安全与隐私保护

研究主要围绕账户模型下的隐私保护、无setup零知识证明、全同态加密算法的设计与应用。账户模型下的隐私保护需要同时满足:相关方和有权限的成员可看到信息的明文;不相关方从账本上只能看到无意义的加密信息;共识节点能够在加密信息上直接对交易合法性做判断,并对账户做相应操作。无setup零知识证明是对现有的zk-SNARK方案需要setup情形的改进。全同态加密是指在不解密前提下对密文进行任何原本在明文可行的运算,是同态加密算法的改进。

  • 区块链技术结合可信执行环境

研究基于可信硬件的新型区块链架构。其基本思路是基于可信硬件,为解决机密保护和计算复杂性问题等提供通用的高性能解决方案。

  • 跨链协议

包括跨链数据检索和跨链资产交换。跨链数据检索可以为监管方在多链的条件下提供更强大的监管能力;跨链资产交换是去中心信任的原子交换。

  • 智能合约语言与整体安全性分析

对现有智能合约体系的安全性分析扫描,并具体实践于自主实现区块链平台。目标实现对智能合约语言做形式化验证与安全性分析,从根本上解决智能合约安全性问题,也包括对区块链整体协议做形式化分析,提高区块链技术的安全性。

  • 区块链技术与IoT结合

二者结合能够解决区块链资产在物理世界和数字世界的锚定问题。利用IoT技术,可以将区块链技术在数字世界中定义的资产形态与物理实体打通。

  • 区块链技术与安全多方计算结合

研究在缺乏可信第三方的情形下安全计算约定函数的方法,在需要秘密共享和隐私保护的场景具有重要意义。目标是打造基于个人隐私数据的计算及交易平台,赋能未来数字服务。目前已经研发出保护隐私的安全数据统计和安全模型训练及预测。

产品及应用

  • 商品溯源 区块链溯源应用把溯源链路上多方记录统一归集到分布式账本上,并通过区块结构锁定记录形成不可篡改账本。统一的溯源体系还包括区块链技术平台标准、链路参与方对接接口标准、产品溯源码号段分配和转接方案等。
  • 互助保险 该项目是对无中心机构的新保险模式的尝试。利用区块链技术公示所有保险资金的流向,增强了松散群体间的信任,进而更好地发展这种保险模式。互助团体的互信,也能发挥个体的主动性,推动互助保险的发展,降低社会风险。
  • 慈善公益 慈善公益是区块链技术应用于实际场景的首次尝试。利用区块链技术公示捐赠资金的流向,可提高捐赠人信心、加强具象捐赠感受、提高公益机构及受捐人的公信力,使公益慈善事业朝着良性循环的方向发展。2016年下半年,蚂蚁金服联合中国红十字基金会等公益机构上线区块链试验项目,使捐款人可以追踪善款的完整流转情况。 2017年3月,支付宝上的所有爱心捐赠项目采用蚂蚁区块链技术,实现平台捐赠数据透明。未来,区块链会进一步探索医疗救助、帮扶等项目,实现善款走向全流程公开、透明和可追溯。
  • 房屋租赁 房屋租赁场景是体现区块链技术与经济社会城市治理相结合较为理想的切入点之一。基于区块链技术的房屋租赁平台有助于提升公开、公平、公正的政府形象,增强社会对新技术的感知,也为更广泛的治理范围提供了经验和范本。目前与雄安新区政府共同打造的基于区块链技术的新区房屋租赁积分系统已完成项目一期建设,后续工作也在开展中。

研究团队

张辉

张辉 达摩院区块链实验室负责人

南加州大学计算机科学博士。现IEEE Senior Member,发表40多篇顶级学术论文。曾担任NEC Labs America部门主管,专注于高性能分布式系统与网络的研究以及产品开发,特别是P2P网络算法。

俞本权

俞本权 达摩院区块链实验室研究员

曾任谷歌主任工程师,并完成了YouTube E-Commerce 平台建设、youtube.com/movies的创建、承担Google Analytics的数据和后台系统架构设计,并主导下一代谷歌分析后台的研发。

闫莺

闫莺 达摩院区块链实验室资深技术专家

复旦大学计算机系博士,现任中国软件协会区块链创业学院及区块链专委会专家、中国电子学会区块链专家委员。研究领域包括区块链技术、大数据分析、数据库以及云计算的研究。曾任微软亚洲研究院主管研究员、区块链负责人。

金融科技 生物识别实验室

致力于各种模态生物识别核心技术的研发及其在金融和民生场景的应用,目前已经具备了人脸、眼纹、虹膜、声纹、掌纹、行为特征等多模态的生物识别核心算法研发能力,并且研发了全球独有眼纹技术专利和领先的活体检测,累积服务超过3亿用户。

研究方向

  • 大规模人脸精准检索(1:BigN)技术

用户规模的不断扩大(如一个省级(亿级)或国家级(十亿级)人脸库),对算法识别性能的要求会成指数级增加;现有的人脸检索技术主要用于安防场景,偏重于召回率并且依赖于人工确认。该技术旨在满足金融场景对准确率,召回率以及检索速度的要求,解决大规模人脸精准检索难题。

  • 多模态无感知生物特征识别技术

不同模态的生物特征具备不同的特性和分辨能力,每融合一个新模态的生物特征都能使得系统的识别能力和安全能力上一个等级。如何以用户无感知的方式实现多模态生物特征的采集和融合,需要在算法,硬件,系统等多方面展开研究。

  • 生物特征ID相关技术

生物特征具备“唯一性”和“终身不变性”等优点,但同时也存在“不可撤销性”的特性。研发生物秘钥生成技术和加密空间共享学习技术,在满足生物特征识别能力的同时,满足生物特征模板单向变换和可撤销等要求,实现对用户的隐私保护和分布式数据的安全使用。

  • 基于物联网的用户感知与行为分析技术

利用不同空间和时间以及不同传感器的数据,为用户提供更加安全,便捷,个性化的金融服务,探索基于生物特征强因子与行为数据弱因子的多变量建模技术及用户感知和行为分析技术。

  • 边缘计算XNN

移动端深度学习由于其在体验实时性,隐私性和计算成本等方面有着广阔的应用前景,边缘计算XNN技术对支付宝APP在性能功耗,SDK增量,模型尺寸等方面提供支持。

  • 新型传感器与专业的相机和图像处理器技术

结合IoT线下扫脸支付等创新业务的发展,高清眼纹识别,多模态生物特征识别等独特新技术对相机,相机阵列,对应图像处理器ISP等成像相关的技术有更高的要求,该研发工作有助于形成蚂蚁金服独有的技术断裂点,支撑无感知生物识别技术的落地和线下无感知支付业务的发展。

产品及应用

  • 刷脸金融蚂蚁金服在为印度、印尼等国家的移动支付金融服务提供便捷远程开户及刷脸登录、在线身份验证等解决方案,降低金融服务的使用门槛。
  • 刷脸政务目前已经跟40个国内城市合作开通“刷脸政务”,人们只需打开支付宝刷脸,就可以认证养老金领取资格、领取电子社保卡和电子驾照等。
  • 刷脸付2017年9月,支付宝联合全球快餐连锁巨头肯德基在杭州推出了基于生物识别技术的线下点餐支付产品“刷脸付”,成为全球首个将生物识别技术应用于商业支付领域的成功案例。

研究团队

蒋国飞

蒋国飞 达摩院金融科技研究领域负责人 / 生物识别实验室负责人

蚂蚁金服副总裁。拥有160多篇顶级论文,曾获SIGKDD等会议最佳论文奖。研究领域有物联网、大数据、人工智能、云计算、计算机安全和软件定义网络等。曾任NEC集团副总裁,领导NEC全球研发。

李亮

李亮 达摩院生物识别实验室资深算法专家

中国科学院自动化所博士,中国科学院大学博士后。曾就职于索尼中国研究院。目前负责蚂蚁金服生物识别算法与模型的研发以及基于生物识别的身份认证体系建设,在国际期刊和会议发表论文十余篇。

宋杨

宋杨 达摩院生物识别实验室资深算法专家

早稻田大学工学博士,2016年加入蚂蚁金服,目前从事多媒体和机器视觉系统的研发工作。曾在华为和富士通研究所(东京)工作,发表40篇论文。

陈继东

陈继东 达摩院生物识别实验室资深数据技术专家

中国人民大学计算机应用博士,复旦大学计算机学院博士后。现任蚂蚁金服全球可信身份平台ZOLOZ亚洲区总经理,负责生物识别技术研发与全球化商业应用。带领团队将人脸识别技术在网商银行和支付宝等场景成功应用,实现刷脸支付全球首次在肯德基的商业落地。曾任EMC中国研究院大数据实验室主任,现为中国计算机学会大数据专家委员会常委委员。

X实验室领域介绍

阿里巴巴达摩院X Lab致力于探索科技领域最神秘的未知,努力提供最先进的解决方案,更着眼未来,裂变科技价值。

X Lab目前下设量子实验室、人工智能实验室。

X实验室 量子实验室

量子实验室的目标是实现量子计算的潜力。

研究方向

  • 量子处理器和量子计算系统

设计和实现量子处理器,量子存储,和量子计算系统。

  • 量子算法

快速的量子以及量子-经典混合算法。

  • 量子物理模拟

量子物理的经典和量子算法模拟。

产品及应用

  • 阿里云量子开发平台阿里云量子开发平台(AC-QDP)的目的是利用阿里巴巴的海量计算资源来支持针对量子计算机的应用以及量子计算机本身的研发。目前,AC-QDP的计算引擎是量子电路的经典模拟器太章。太章的算法与性能展示请参考arXiv:1805.01450和arXiv:1907.11217. 在arXiv:1909.025559中,我们也介绍了AC-QDP在量子算法设计与测试方面的工作。进一步的展示与改进会随后不断推出。
  • 太章太章是一个量子计算的经典模拟器,或者是一张量收缩的计算系统。太章借助阿里巴巴强大的分布式计算平台,成功模拟了一些作为基准的中间规模的量子电路。太章正在成为阿里巴巴基于张量的量子激发经典计算系统里的计算引擎。它将是研发量子计算物理实现和应用的核心工具之一。

研究团队

施尧耘

施尧耘 达摩院量子实验室负责人

北大计算机本科、普林斯顿计算机博士。在加州理工学院的量子信息中心做博士后研究后,他加入密歇根大学安娜堡分校,历任电子工程和计算机科学助理教授、副教授和正教授。研究涉猎量子信息科学的多个领域,包括量子计算复杂度、量子计算经典模拟和量子密码学。他在阿里巴巴致力于建设一个跨学科的国际团队,以实现量子计算颠覆性的潜力。

马里奥·塞格德

马里奥·塞格德 达摩院量子实验室科学家

马里奥为芝加哥大学博士。在贝尔实验室和普林斯顿的高级研究所工作后,任职罗格斯大学计算机科学系教授。他的研究领域包括计算复杂性理论与量子计算。马里奥于2001年和2005年两获哥德尔奖,分别基于他在Probilistic Checkable Proofs和流计算的空间复杂度上的贡献。

X实验室 人工智能实验室

致力于研究前沿科技并与商业结合,将人工智能技术赋能机器,服务20亿消费者。当前孵化出天猫精灵个人助手等产品。实验室的使命是让机器拥有智能,让人性充满光辉,将基于阿里巴巴强大消费者沟通渠道和完善的服务生态,立志成为下一代人机交互入口。

研究方向

  • 语音助手

1)语音交互:致力于端上信号增强、语音唤醒、语音识别、TTS等语音交互领域的研究和创新。2)自然语言理解:致力于意图识别、槽填充、对话管理和智能聊天等自然语言理解领域的研究和创新。3)数据挖掘和知识图谱:致力于知识抽取、知识图谱融合、知识众包、知识问答等数据挖掘领域的研究和创新。4)用户画像和个性化推荐:致力于用户画像和个性化推荐在个人语音助手领域的研究和创新。

  • 工业设计

致力于人工智能硬件产品、机器人的创新工业设计,通过人机交互、产品形态、材料工艺等领域的研究,探索未来智能硬件、机器人的新方式。

  • 智能制造

基于人工智能技术的新一代硬件研发与制造,如硬件芯片和模组研究,并提供边缘计算和云端结合的解决方案。

  • 机器人技术

从事智能机器人相关的技术研究,包括:实时定位、环境建模、传感器融合、目标检测、场景分割、路径规划、运动控制、故障检测、多机器人系统等方向。

产品及应用

  • 天猫精灵人工智能实验室推出的智能家庭语音助手/智能语音终端设备,是目前全球唯一通过语音识别技术实现声纹购物功能的人工智能产品,同时应用了自然语言处理和对话管理系统等行业领先技术,它可听懂语音指令,开启人机交互体验新方式。现拥有百科知识库、音乐知识库、影视知识库、商品知识库、LBS知识库等各种专题知识库,包含实体数1亿,关系数10亿以上,掌握百亿级对话库,能覆盖主流人群的对话情况。
  • AliGenie 硬件开放平台致力于将人工智能实验室在人工智能方面的研究成果转化为行业生产力,帮助行业合作伙伴升级产品体验,打造具备下一代智能交互能力的产品。通过内置AliGenie系统,合作伙伴的产品将在听觉、触觉、视觉以及智能交互等能力得到大幅提升,具备更强的市场竞争力,获得更好客户体验。
  • 行动机器人致力于将人工智能技术融入机器人产品,使其具备多模态人-机-环境交互能力,场景感知及场景理解能力,以及自主移动和任务执行能力,深化机器人在商业场景中的服务能力,改善B端客户的服务效率,提高C端客户的消费体验。其中天猫精灵太空蛋、太空梭是阿里巴巴首次推出的具备上述能力的智能行动机器人产品,能够在酒店、医院等环境中承担重复性强且精度要求高的毛细物流任务,辅助工作人员高效地完成工作,降低重复劳动,提升生活服务品质。

研究团队

陈丽娟

陈丽娟 达摩院人工智能实验室负责人

淘宝网第一代产品经理,淘宝网产品团队总负责人;阿里旗下购物比价网站一淘网总经理;阿里巴巴智能生活总经理、阿里巴巴IoT创建人。2016年发起成立阿里巴巴人工智能实验室。2017年7月,浅雪以实验室负责人身份发布了首款AI消费级产品天猫精灵X1,目前天猫精灵X1是全球销量最大的中文智能音箱产品。

聂再清

聂再清 达摩院人工智能实验室研究员

美国亚利桑那州立大学博士学位(师从美国人工智能学会主席Subbarao Kambhampati教授),现任阿里巴巴达摩院人工智能实验室北京研发中心负责人,语音助手首席科学家,教育部人工智能专家组咨询组专家。曾就职于微软亚洲研究院,任首席研究员,负责微软自然语言理解、实体挖掘的研发工作。他是微软学术搜索,人立方,以及企业智能助理EDI的发起人和负责人,也是微软自然语言理解平台LUIS的技术负责人。

李剑叶

李剑叶 达摩院人工智能实验室研究员

拥有清华大学美术学院文学硕士学位,德国iF学生设计奖评委,中国红星设计奖评委,清华美院工业设计系客座讲师,研究方向为智能硬件、机器人工业设计。有16年工业设计经验,曾任锤子科技设计副总裁,飞利浦香港设计中心资深顾问,作品获得过德国iF设计金奖、意大利A设计金奖、美国SPARK设计银奖、芝加哥GOOD DESIGN奖、日本GOOD DESIGN奖、香港DFA设计奖以及中国智造大奖等近50项国际国内设计奖。

陈颖

陈颖 达摩院人工智能实验室研究员

芬兰坦佩雷理工大学博士,北京大学学士与硕士。现任阿里巴巴人工智能实验室人工智能与边缘计算首席科学家,边缘计算实验室负责人,负责IOT产品。加入阿里巴巴之前在美国高通公司担任首席工程师。在图像,视频和视觉领域发表60篇学术论文,400余篇国际标准技术提案,和超过250项的已授权美国发明专利,并因此获得高通知识产权成就奖。所发表的著作获得约8000次引用。曾担任MPEG国际视频编码标准(H.264/AVC,H.265/HEVC系列)联席主编,获得过国际标准组织及国际电气工程委员会ISO/IEC杰出贡献奖。

X实验室 XG实验室

XG实验室致力于推动下一代网络通信技术的研究,聚焦5G技术和应用的协同研发,为超高清视频、在线办公、AR/VR、工业互联网、智能物流、自动驾驶等场景研究符合5G时代的视频编解码技术、网络传输协议等,并制定相关标准。

研究团队

张铭

张铭 达摩院XG实验室负责人

张铭的研究领域包括数据中心网络、边缘网络和4G/5G移动网络等,在高性能网络、意图驱动网络等前沿领域曾取得重大突破,是网络领域的资深专家。

叶琰 阿里达摩院研究员

IEEE高级会员,她曾参与3代视频编解码标准开发及浸入式视频和流媒体的标准开发。

由于XG实验室刚成立不就,所以更多信息还没有公开,不过我们还是能够了解到阿里巴巴对未来网络通信技术的研究,当然这个实验室刚成立时,还有很多人猜测阿里进入5G领域会不会和华为产生竞争,为此,我们单独写过一篇分析文章,感兴趣的读者可以看 3点分析证明阿里达摩院成立XG实验室不会与华为竞争 但会替代华为

达摩院重点项目

达摩院重点项目目前由“青橙奖”及“阿里巴巴全球数学竞赛”组成。“青春本涩,热望成橙”,关注青年学者成长,助力青年学者勇攀科学技术之巅。“发现数学之美,用科技刻画未来”,旨在全球范围内引领关注数学、理解数学、欣赏数学、助力数学的科技风尚。

阿里巴巴达摩院青橙奖

达摩院青橙奖

“达摩院青橙奖”(DAMO Academy Young Fellow) 是阿里巴巴达摩院主办,面向全球范围对科技进步有关键推动作用的中国青年学者的年度奖项,旨在发掘和支持从事基础科学、应用技术研究的优秀青年工作者。阿里巴巴达摩院为每位获奖人发放100万人民币奖金,并提供开放的数据资源和应用场景等全方位支持,助力其勇攀科学技术之巅。

评奖规则

对象

➤ 面向大中华地区

➤ 面向当年度35周岁及以下,已经获得博士学位的中国籍青年学者

➤ 面向从事基础科学、应用技术研究的学术及科研机构的研究人员

原则

➤ 科技创新的视角:在关键性三大科技领域取得创新性的成就和超出预期的贡献,对所在研究领域的科技未来有重要作用

➤ 产学研融合的视角:不单纯以科学价值作为研究目标,兼顾技术和产业实际的推动作用

➤ 人文的视角:鼓励坚守的纯粹和严谨的科学精神

领域

➤ 信息技术:基础软件、云计算、大数据、机器智能、物联网、量子计算

➤ 半导体材料与器件:芯片、显示技术、智能传感器

➤ 智能制造:机器人、高档数控机床、智能检测与装配、智能物流与仓储、自动驾驶

奖励设置

➤ 获奖人每人奖金100万人民币,每年获奖总人数不超过10人

➤ 获奖人将会冠名“达摩院青橙学者”称号,并与达摩院实验室建立互访联系

➤ 提供算力、技术、产品与工程师团队支持,助推科技转化

阿里巴巴全球数学竞赛

阿里巴巴全球数学竞赛

“阿里巴巴全球数学竞赛”( Alibaba Global Mathematics Competition)由中国科学技术协会、阿里巴巴公益基金会、阿里巴巴达摩院共同举办,面向全球的数学爱好者,集竞赛、培训、交流于一体,旨在全球范围内引领开启关注数学、理解数学、欣赏数学、助力数学的科技风尚。

阿里巴巴达摩院秉承家国情怀与社会担当,推动全社会关注数学等基础科学的价值。通过数学竞赛这一全球盛事,让青年一代爱上数学,让投身数学成为青年一代的志向和抱负。

阿里巴巴愿意为数学拥有更广泛的社会基础,为数学的原创性研究与突破性进展,为数学人才的不断涌现,贡献自己的力量。

愿景 以数学演进算法,用科技刻画未来

使命 发现数学之美、助力数学研究、激发数学学习热忱

写到这里,关于阿里巴巴达摩院5大研究领域、15个实验室、达摩院重点项目的详细信息就都整理完了,超脑智能将持续关注人工智能、机器智能、人机自然交互领域的企业新闻、技术和趋势解读。

关键词:阿里巴巴、达摩院、人工智能、机器学习、NLP、量子计算、区块链、自动驾驶、无人驾驶、天猫精灵、芯片、数据库、存储、网络、生物识别