论文部分内容阅读
人体特征点对于描述和分析人体行为至关重要,人体特征点检测也是诸多计算机视觉任务的基础。通常来讲,人体特征点检测需要检测出人脸以及骨骼等关键部位的特征点,分别对应着人脸特征点检测以及人体姿态估计两个基本子任务。人脸特征点检测的目标是检测出眼睛、鼻子、嘴巴、脸颊等代表性面部语义特征点的位置,是人脸识别、人脸年龄估计等自动化人脸分析任务的必要条件。人体姿态估计的目标是检测出手臂、躯干、臀部、脚踝、膝盖等代表性身体部位的位置,在行为识别、步态识别等相关领域起到了重要的作用。因此,对人体特征点检测的研究具有很大的应用价值,本文从算法鲁棒性角度对人体特征点检测进行两方面的研究:在人脸特征点检测任务中,数据集中的标注特征点往往离真实特征点存在一定的偏离,然而现有人脸特征点检测算法均将手动标注特征点视作是精准的硬标记,并没有考虑到训练集中不准确标注点的影响,对标注中出现的噪声缺乏鲁棒性。本文提出基于标记分布学习的人脸特征点检测算法,该算法通过为每个特征点分配二元标记分布,涵盖了原始手动标注特征点周围的邻居像素点,缓解了不准确标注点的问题。实验结果表明,该算法的性能优于目前最先进的算法。此外,与其它算法相比,该算法对于标注噪声具有更强的鲁棒性。在人体姿态估计任务中,虽然现有基于深度学习的算法通过融合多尺度特征获得了显著性的进展,但它们仍未充分增强出对姿态估计任务更加有效的特征信息,对不可见、遮挡、以及大姿态等复杂场景下的特征点检测仍存在问题,缺乏鲁棒性。本文提出了基于增强通道和空间信息的人体姿态估计算法,该算法首先通过通道交流模块来增强金字塔特征之间的跨通道信息交流,其次通过基于空间和通道注意力机制的残差模块在空间和通道两个维度自适应地增强融合后的特征。大量实验表明,该算法获得了最先进的结果,并对复杂场景下的特征点检测具有更强的鲁棒性。本文共分为五章。第一章介绍人体特征点检测的研究现状以及待解决的问题。第二章给出两种人体特征点检测子任务(即人脸特征点检测与人体姿态估计)的具体定义与相关算法介绍。第三章介绍基于标记分布学习的人脸特征点检测算法,并给出详尽实验结果和鲁棒性分析。第四章介绍基于增强通道和空间信息的人体姿态估计算法,以及相应的实验结果和鲁棒性分析。第五章对全文做出总结并做进一步展望。