近日,中国电信数字智能科技分公司(大数据和AI中心)AI自研团队(以下简称中国电信团队)接连夺得三项世界人工智能顶级赛事大奖。
(1)在2022年全球人工智能顶级会议CVPR举办的EPIC-KITCHENS-100系列赛中,获得Action Detection赛道季军的优异成绩。
(2)在深度伪造博弈比赛(DFGC2022)(IJCB2022国际生物识别联合会)中,获得生成攻击赛道亚军。
(3)在深度伪造博弈比赛(DFGC2022)(IJCB2022国际生物识别联合会)中,获得检测赛道季军。
连续斩获世界顶级赛事大奖,这意味着中国电信随着中国电信云改数转战略实施,人工智能研发能力正在稳步提升,跻身一流行列。
EPIC-KITCHENS-100系列赛
EPIC-KITCHENS-100系列赛由IEEE国际计算机视觉与模式识别会议(简称CVPR)主办,CVPR是全球人工智能计算机视觉领域三大顶级会议之一,是业界衡量企业、高校和科研机构科研水准的标杆。该会议旨在研究、探讨全球最前沿的人工智能科学技术,并举办知名国际赛事吸引全球著名人工智能领域团队竞相角逐。
此系列赛采用第一人称视角的视频数据集作为赛用数据集。该数据集规模大、场景真、标签全。数据集采集自分散在4个城市的45个家庭中的厨房,以全方位、无脚本、视听结合为原则进行视频数据集录制工作,采用全高清的像素捕捉多天内厨房中的所有日常活动,并使用全新的方法制作了包含97个动词类、300个名词类的标签供比赛使用。
今年的EPIC-KITCHENS-100系列赛相较于往年,任务难度更大,竞争压力更大。组委会设置了Action Recognition、 Action Detection、 Action Anticipation、 Domain Adaptation for Action Recognition和Multi-Instance Retrieval五条赛道。五条赛道以不同的子领域为出发点,考验参赛团队在AI视频理解领域中的创新与研发能力。精心设计的挑战和详实的数据吸引了来自全球的上百只队伍竞相角逐,其中不乏谷歌、阿里巴巴等国际著名公司,牛津大学、新加坡国立大学、布里斯托大学等国际知名高校等。
中国电信团队尽管首次参加该系列赛事,但在所参加Action Detection赛道中取得了季军的优异成绩,冠亚军分别由阿里巴巴和第四范式-威斯康星大学麦迪逊分校-南京大学联队获得。
Action Detection又被称为行为检测,该赛道不仅预测给定视频中包含的所有行为类别,还要预测行为的起止时序区间。经过近年来的发展,预测行为类别的算法逐渐成熟,而预测行为的起止时序区间依然是一大难点。在Action Detection赛道中,面对众多经验丰富、实力强劲的国际团队,中国电信团队沉着冷静,务实求新,提出了一种新的名为Neigborhood-Window-Attention Transformer的有效神经网络架构。该模型架构预先定义了一系列与固定持续时间相对应的滑动窗口,围绕时间轴中心和每个滑动窗口对应时间序列的边界逐一预测特定的行为类别。不仅可以建模不同窗口之间的关系,还可以更加充分地建模每个窗口内的关系,提升了每个预测行为的开始和结束时间均被覆盖的可能性。经过中国电信团队持续优化完善,最终取得了季军的好成绩。
深度伪造博弈比赛(DFGC2022)
深度伪造博弈比赛(DFGC2022)是IJCB2022国际生物识别联合会议认定的AI国际性赛事。
本次赛事使用了深度伪造博弈比赛以来最丰富的数据集、最真实的对抗场景、以及更合理的评价方法。中国电信团队首次参加该比赛,并同时参与视频DeepFake(深度伪造)生成和检测两个赛道。通过本次比赛,较好地检验了当前视频深度伪造中的最强之矛与最坚之盾,为活体&伪造检测模型在开放对抗环境中的实际应用提供了重要参考依据。
人脸生成赛道对指定的80段素材视频进行篡改操作,在真实感、嘴型一致性、视频质量、表情准确性、ID准确性、抗检测能力共6个方面进行评分。中国电信团队提出了基于3D信息的换脸技术方案,基于3DMM的形状参数损失提升五官及脸型的相似性。最终该方案获得了总分24.071分,仅以0.8分之差惜败于科大讯飞,取得了亚军的好成绩,力压在组织机构发展、产品研发和生活质量这三个领域具有最强实力的瑞典知名学府哈姆斯塔德大学。
人脸鉴伪检测赛道即判断人脸图片是否由算法生成,或面部信息是否被篡改。在本次竞赛中,中国电信团队首次提出了全局空间特征与时序特征相结合的技术方案,提取人脸区域与背景区域在深度特征层下的不一致性,可准确检测出照片中毫米级的伪造痕迹。经过中国电信团队持续优化完善,该模型在公开测试集和私有测试集上分别实现了94.83%和86.7%的准确率,最终取得了季军的好成绩。
中国电信数字智能科技分公司(大数据和AI中心)致力于打造攻防一体的活体&鉴伪检测技术。可以准确鉴别出AI换脸技术和各种黑客工具生成的人脸图像,广泛应用于身份验证、肖像维权、新闻鉴真等场景,切实保障大众的个人信息安全及互联网内容安全。
近年来,中国电信在行业内率先提出“云网融合”概念,积极响应国家数字化转型战略,推进“云改数转”战略实施,力求以创新谋发展,以改革促成效。连续在世界顶尖的人工智能竞赛中取得优异成绩,标志着中国电信在AI计算机视觉领域的科研实力经稳步发展,逐步走向行业第一梯队研发能力。