论文部分内容阅读
目标检测是计算机视觉领域的经典任务,在自动驾驶、视频监控、人机交互和人脸检测等领域有重要应用价值,但复杂多样的场景使得任务本身极具挑战性。近年来以深度学习技术为基础的目标检测算法取得重大进展,但其性能的提升依赖于大规模的标注数据。在现实世界中,标注资源往往是有限的,同时存在海量的无标注数据未被利用。主动学习通过筛选数据的方式,只对富有信息量的数据进行标注,从而提升标注效率;半监督学习则侧重无标注数据的挖掘。现实场景下融合两者的优势,深度主动半监督学习的目标检测算法近年来引起了研究者们的关注。其问题的核心是,如何衡量评估目标检测任务中图像样本的信息量,此外,还需考虑如何有效联合主动学习和半监督学习两部分。首先,本文探索主动学习部分图像样本信息量的定义方式,将不确定度采样策略引入目标检测任务,用于定义候选目标的不确定度,再从候选目标不确定度聚合得到图像样本的不确定度。其次,在此基础上本文进一步针对目标检测任务特性,提出了一种基于目标实例提取的主动学习目标检测方法,在候选目标和图像之间引入目标实例的概念,以此更准确表示图像样本信息量。该方法先通过聚类方式提取图像中的目标实例,对每个目标实例利用其链接的候选目标集合构建委员会,通过委员会投票采样的方式衡量目标实例分类和定位的不确定性、并利用批采样多样化的策略解决无目标实例提取的样本。最后,本文联合主动学习和半监督学习,进一步提出了一种基于目标实例提取的主动半监督学习目标检测方法,利用上文提到的主动学习方法对高不确定度样本进行手工标注,同时针对低不确定度样本,采用自训练的思想提取伪真值,联合进行主动半监督学习。本文在两个公开数据集上进行了对比试验。实验结果表明,基于不确定度采样的方法性能优于被动学习随机采样的方法,初步证明主动学习在目标检测任务中的有效性。更进一步,本文提出的基于目标实例提取的方法在前者基础上得到了大幅度性能的提升,并使于现有其他的算法。