论文部分内容阅读
人体动作识别和物体显著性检测均是近年来计算机视觉领域的热点研究内容。其中,人体动作识别是视频检索、视频监控以及智能人机交互等应用的关键技术,具有广阔的应用前景。但由于人体的个体差异以及动作的多样性等问题存在,人体动作识别任务依然极具挑战性。物体显著性检测是指对图像中具有视觉显著性的物体区域进行检测,对于物体检测、图像压缩以及基于内容的图像检索都能起到很好的帮助,具有广泛的应用前景和重要的研究意义。本文重点研究了多示例学习及其优化算法,并将其用于视频中的人体动作识别和图像中的物体显著性检测,提出了基于关键子段挖掘的人体动作识别方法和基于混合监督学习的物体显著性检测方法。本文首先提出了一种基于关键子段挖掘的人体动作识别方法。通过结合多示例学习算法,该方法可以自动地为每一个视频样本挖掘出最具判别性子段的位置和长度。另外,基于Kinect输出的人体骨架关节点的三维坐标,本文提出了一种先进的骨架关节点特征表示,它能够有效地捕获视频段中人体骨架的形状和位移信息,为人体动作识别提供一个紧凑且具有判别性的表示。实验结果表明,本文提出的识别方法和特征表示方法有效地提升了人体动作识别的准确率。在UCF-Kinect数据集上,本文方法取得了目前最好的结果。在MSRAction3D数据集上,本文方法的识别准确率高于文献中所用同样只使用关节点坐标提取特征表示的识别方法。本文还提出了一种基于混合监督学习的物体显著性检测方法。结合监督学习与弱监督学习,该方法只需要对训练集中部分图像进行精确标注,而对其他图像只需给出物体边界框即可。相比于监督学习,本文方法减少了训练样本标注代价;相对于弱监督学习,本文方法具有更高的显著性检测精度。实验结果表明,本文提出的混合监督物体显著性检测方法可以有效地权衡显著性检测精确度与目标物体精确标注的代价。通过增加仅标注物体边界框的训练图像,可以提升物体显著性检测的精确度,为将显著性检测问题推广到大规模应用提供了实现的可能。