Interspeech大会听说过没?这是语音通讯领域最顶级的国际盛会。一年一召开,每年选择当年两三个重要的国际评测进行专场讨论,入选的评测都反映了当前学术界和工业界最受学者们关注的热点和难点。
这个会到底多权威呢?这么说吧,大概就是苹果、谷歌、微软、亚马逊年年参与,腾讯、百度、阿里三家公司每次有论文入选都要广发新闻稿庆祝的级别。
近日,联想研究院人工智能实验室语音团队(LeVoice)在Interspeech VOiCES国际远场语音识别比赛固定系统项目中,喜获第二名的好成绩,系统性能处于国际第一梯队。
本次LeVoice团队参加的是远场语音识别评测的固定数据集任务,主办方提供80小时的干净语音训练数据,测试数据是VOiCES的带噪远场语音数据。团队要依靠前端信号处理技术、训练数据扩展技术、基于DNN的声学模型技术、基于RNN的语言模型技术和多模型融合技术,来提升复杂场景远场语音识别性能。
这项比赛中,除了联想,参赛团队还包括STC(俄罗斯语音技术中心),JHU(美国约翰霍普金斯大学),I2R(新加坡信息通信研究所)、TalTech(爱沙尼亚塔林理工大学)等老牌强队。可谓人才济济,强者如云。最终联想以仅次于STC的成绩位居第二。
这个成绩意味着什么?远场语音识别是目前语音识别的难点,突破这一问题可以促进智能语音技术在更多的产品中落地,解决用户在复杂场景下语音交互体验不佳的痛点,让智能设备更容易在嘈杂的环境中与人沟通。
换句话说,在未来的智能家居时代,联想在复杂环境下的语音交互层面已经实现了巨大的突破。
介绍下联想研究院人工智能实验室,这一实验室成立于2017年初,有200名专业人才加盟,主要专注于计算机视觉,语音识别,自然语言解析,机器人等前沿技术领域。
2018年,在CCF国际自然语言处理与中文计算会议上荣获最佳论文奖,在全国知识图谱与语义计算大会获得了开放领域的中文问答任务评测第二名,其开发的E-Health智能医疗图像辅助诊断系统荣获中国计算机学会“科学技术奖科技进步优秀奖”,集成其开发的分布式训练Letrain的联想LiCO产品在全球超算大会上获得了最佳AI产品/技术奖。2017年,在全球LiTS(Liver Tumor Segmentation Challenge,肝脏肿瘤病灶区CT图像分割挑战)大赛上,E-Health解决方案以世界领先的肝脏肿瘤CT图像分割准确率指标夺得大赛冠军。
注意,人工智能实验室只是联想研究院下面诸多实验室之一,除了人工智能实验室,联想研究院还有专注智能设备的设备+实验室,企业云服务实验室,5G实验室,智能生活方式创新与孵化中心等机构,还与中科院、浙大、杜克及斯坦福大学、东南大学、华南理工、麻省理工等高校建有联合实验室。
除了面向未来的联想研究院,联想每条业务线也都有更为面向市场化的研发部门。此外,联想创投集团也投资了大量的创新企业,包括寒武纪、蔚来、Face++等诸多国产科技独角兽都是联想创投的投资对象。
创新,本来就是联想的一部分。