论文部分内容阅读
人体检测是近年来计算机视觉和模式识别领域的研究热点,它在智能视频监控人机交互车辆辅助驾驶等方面有着广泛的应用前景目前基于人体检测的种种算法相继被提出,但由于场景的复杂多变性人体的非刚性人体之间的的相互遮挡人体检测速度与检测率等问题,所以还没有形成一个完善通用的人体检测算法人体检测从架构上来说主要分为特征提取训练样本人体检测三部分本文数据集选择目前获得一致认可的INRIA行人数据库,该数据库中的人衣着姿势各异,拍摄场景不同,分辨率高,也是难度比较高的人体数据库通常采用基于滑动窗的方法对静态图像中的人体进行检测滑动窗的方法是将图片进行多次一定比例的缩放,然后用固定大小的滑动窗在多个尺度的样本上按方向和固定的步长遍历遍历窗口的同时提取特征,并用分类器预测二分类结果,将所有预测为行人目标的窗口的坐标和尺度统一保存,最后将检测结果融合本文针对基于梯度方向直方图和支持向量机的人体检测特征维数多训练速度慢的缺点进行了改进在特征提取方面,研究了金字塔梯度方向直方图ξPyramid Histogram of Oriented Gradient,PHOG局部二值模式ξLocal BinaryPatterns,LBP特征,它们均能有效的表达行人信息,但是单一的特征都有它们的不足PHOG特征是一种基于HOG特征的描述,它通过图像分层处理将空间信息和形状信息集中表达,在每层内的特征是梯度方向直方图PHOG特征对噪声敏感,对于背景复杂的图片,容易产生漏检LBP特征算子是一种灰度范围内的纹理描述算子,可以对灰度图像中局部邻近区域的纹理信息进行度量和提取LBP算子等价模式能够有效去除噪声干扰,这是因为非等价模式中多是一些噪声区域,LBP特征能够有效弥补PHOG特征对于噪声的抗干扰性在此基础上,本文提出使用一种表征肤色信息的颜色特征方法,并将此方法与PHOG LBP结合形成一种新的特征,用来突出肤色信息,增强行人的识别能力分类器方面,本文提出将极限学习机用于人体检测极限学习机不同于传统神经网络和SVM,它不需要调整网络的输入权值以及隐元的偏置,并且产生唯一的最优解,具有学习速度快泛化能力好稳定性强的的特点实验表明,本文算法不仅准确度高,而且在特征提取和分类上速度快