近日,人工智能领域顶级会议国际计算机视觉大会(IEEE International Conference on Computer Vision, ICCV2021)正式召开,今年ICCV的竞赛成绩正式公布。江南大学人工智能与计算机学院教授吴小俊和英国萨里大学电子工程系教授Josef Kittler带领的模式识别与计算智能国际联合实验室(IJLPRCI)与清华大学自动化系鲁继文教授合作,荣获了多模态视频推理分析比赛(Multi-Modal Video Reasoning and Analyzing Competition, MMVRAC)中2项冠军和第二届反无人机Anti-UAV跟踪竞赛季军。
MMVRAC由新加坡科技设计大学、墨尔本大学、兰卡斯特大学、阿里巴巴达摩院、山东大学等机构联合组织,是多模态视频推理分析领域的一项重要竞赛。由于数据来源的复杂性,其竞赛的难度远远超过常规数据集。该竞赛吸引了包括牛津大学、帝国理工学院、法国国家信息与自动化研究所、卡内基梅隆大学等众多国际顶级机构和科研院所,江南大学团队最终获得基于骨骼的行为识别(Track-2 Skeleton-based Action Recognition)和基于鱼眼视频的行为识别(Track-3 Fisheye Video-based Action Recognition)双料冠军。其中,两个赛道的第一完成人分别为吴聪和李荣昌两位博士生,参赛成员还包括沈忠伟、徐天阳、吴小俊、Josef Kittler、鲁继文。
第二届反无人机竞赛的要求是针对体型较小且雷达难以准确探测的无人机,利用计算机视觉算法在复杂环境中能够高精度感知检测并跟踪快速移动的目标无人机。江南大学获得该赛事的第三名,参赛成员有朱学峰、汤张泳、李辉、徐天阳、吴小俊、Josef Kittler。
在基于骨骼的行为识别中,团队针对视觉角度变化大、部分样本类别相似度高以及数据规模有限等难点,团队充分利用特征间、尺度间以及不同建模方式间的差异进行优势互补,通过分类特征的融合加强,提升模型分类性能。在基于鱼眼视频的行为识别中,团队采用多种数据处理手段来减少镜头畸变,聚焦运动主体,并减弱无人机镜头抖动,光照场景复杂等影响。在模型设计上,使用多尺度采样方式并采用对应的建模。在测试阶段,团队使用了多视角测试增强,多种类采样模型决策级融合等来提高最终的分类精度。在反无人机跟踪问题中,团队针对目标移动速度快、采样设备移动迅速、目标反复消失与重现等难点,提出了一种长时跟踪的解决方案,并集成了基于Transformer和基于孪生网络的跟踪算法。另外,针对目标消失与重现的问题,使用了全局搜索的目标重检测方法。
近年来,吴小俊教授团队在国际人工智能领域的竞赛中屡获佳绩,本次参与的竞赛得到了国家自然基金联合基金重点项目、国际合作重点项目和科技部项目的资助。
Track-2 Skeleton-based Action Recognition冠军证书
Track-3 Fisheye Video-based Action Recognition冠军证书
The 2nd Anti-UAV Challenge季军证书
来源:江南大学新闻网 本期编辑:罗欣欣