西安发布讯 通过产学研合作项目和腾讯犀牛鸟精英人才培养计划,西北工业大学计算机学院智能语音方向谢磊教授团队与腾讯合作的基于QBE的语音关键词检出技术近日成功上线腾讯信息服务。这也是继去年该团队语音识别后处理技术成功落地腾讯之后,西工大与腾讯又一在人工智能校企合作上的硕果。
语音关键词检出是智能语音处理领域的一项关键技术,是指从语音流中检测出设定目标内容的一类技术。智能手机和智能音箱中语音助手的语音唤醒功能就是语音关键词检出技术的代表。同时,语音关键词检出在网络语音信息搜索和大数据信息挖掘中有着举足轻重的作用。
此次西工大与腾讯合作研发的技术围绕实际应用场景中说话人多样性、重口音、场景复杂、噪声干扰类型繁多等挑战问题,利用基于大规模深度学习的QBE模板匹配技术进行鲁棒性建模,和传统深度关键词检出 (deep kws) 算法和基于网格(lattice)检索算法相比,该技术不依赖传统的复杂声学模型建模,而从海量关键词样例出发,学习更为有效的特征表征。通过对多风格、口音、不同声学环境下相同关键词语音信号本身进行大规模深度学习建模,可以有效提升关键词检测性能,检出率大幅提升10%以上,精准率提升3.5%。该技术在黄赌毒信息检测上发挥了重要的作用,并已成功应用在腾讯安全天御的内容风控服务中,经过多方评测,关键词检出效果远超竞品。
据统计,该技术日调用量超过亿次,例如在《王者荣耀》S16赛季后上线的文明语音对战系统,可以对困扰用户的谩骂语音进行自动检测,创造和谐文明的游戏环境。同时在网络直播这种复杂异构的声学场景中,基于QBE的关键词检出技术同样对违规现象的发现发挥了重要作用。
据介绍,该技术的成功应用离不开校企合作的大力支持。腾讯犀牛鸟精英人才培养计划是腾讯围绕高校拔尖研究生的校企人才培养计划,每年仅支持少数顶尖学者。通过该计划可以让学生接触产业真实问题、拓展科研思路、验证学术理论、联合发表论文、实现学术突破。
2018年10月,刚刚从新加坡国立大学联合培养归来的博士生袁有根同学,凭着出色的研究背景和丰硕的前期成果,从众多申请人中脱颖而出,成功入选该计划。在腾讯联合培养期间,结合西工大智能语音方向的雄厚技术积累和腾讯的真实场景,在双方导师的联合指导下,面对复杂声学建模的难题,发挥出出色的创造力,提出了基于深度学习的QBE关键词二次验证方案,有效的提升了复杂场景下的语音关键检出性能。同时该研究成果总结的相关论文发表在语音研究旗舰会议语音识别与理解国际会议(ASRU2019)上,在新加坡进行了论文宣读,受到了同行的广泛关注。袁有根同学另外一篇瞄准提升性能并同时提升搜索效率的论文也于近期发表在语音研究相关顶级刊物上。
(西安报业全媒体记者 任娜 通讯员 袁有根)