基于静态图像的人体检测

来源 :天津大学 | 被引量 : 0次 | 上传用户:xf6088
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体检测是近年来计算机视觉和模式识别领域的研究热点,它在智能视频监控人机交互车辆辅助驾驶等方面有着广泛的应用前景目前基于人体检测的种种算法相继被提出,但由于场景的复杂多变性人体的非刚性人体之间的的相互遮挡人体检测速度与检测率等问题,所以还没有形成一个完善通用的人体检测算法人体检测从架构上来说主要分为特征提取训练样本人体检测三部分本文数据集选择目前获得一致认可的INRIA行人数据库,该数据库中的人衣着姿势各异,拍摄场景不同,分辨率高,也是难度比较高的人体数据库通常采用基于滑动窗的方法对静态图像中的人体进行检测滑动窗的方法是将图片进行多次一定比例的缩放,然后用固定大小的滑动窗在多个尺度的样本上按方向和固定的步长遍历遍历窗口的同时提取特征,并用分类器预测二分类结果,将所有预测为行人目标的窗口的坐标和尺度统一保存,最后将检测结果融合本文针对基于梯度方向直方图和支持向量机的人体检测特征维数多训练速度慢的缺点进行了改进在特征提取方面,研究了金字塔梯度方向直方图ξPyramid Histogram of Oriented Gradient,PHOG局部二值模式ξLocal BinaryPatterns,LBP特征,它们均能有效的表达行人信息,但是单一的特征都有它们的不足PHOG特征是一种基于HOG特征的描述,它通过图像分层处理将空间信息和形状信息集中表达,在每层内的特征是梯度方向直方图PHOG特征对噪声敏感,对于背景复杂的图片,容易产生漏检LBP特征算子是一种灰度范围内的纹理描述算子,可以对灰度图像中局部邻近区域的纹理信息进行度量和提取LBP算子等价模式能够有效去除噪声干扰,这是因为非等价模式中多是一些噪声区域,LBP特征能够有效弥补PHOG特征对于噪声的抗干扰性在此基础上,本文提出使用一种表征肤色信息的颜色特征方法,并将此方法与PHOG LBP结合形成一种新的特征,用来突出肤色信息,增强行人的识别能力分类器方面,本文提出将极限学习机用于人体检测极限学习机不同于传统神经网络和SVM,它不需要调整网络的输入权值以及隐元的偏置,并且产生唯一的最优解,具有学习速度快泛化能力好稳定性强的的特点实验表明,本文算法不仅准确度高,而且在特征提取和分类上速度快
其他文献
随着计算机的发展,计算机视觉技术成为近年来的研究热点,计算机视觉就是利用摄影机等成像设备代替人眼采集信息,然后由计算机代替人脑完成对运动目标的检测、跟踪、识别等过程。
无线传感器网络是由部署区域内大量的廉价的微型传感器节点通过自组织方式连接而形成的,可以实时地感知、收集和处理各种环境信息,然后提交给感兴趣的观察者,且具有广阔的应用前
燃气轮机作为目前大型设备动力装置之一,在航空航天、工业领域得到广泛的应用。由于燃气轮机的结构复杂,工作环境恶劣,其部件易发生各种故障,如气路部件的故障、旋转部件的磨损及
天线是无线通讯系统的关键一环,能量通过天线以电磁能量形式辐射出去,天线辐射性能的好坏直接影响通信质量。微带天线具备共面性好,结构简单,易集成等优点,在各类无线电子设
随着无线通信技术的发展,未来移动通信的一个重要发展趋势就是宽带多媒体通信,限制它发展的主要原因是频谱资源的紧张以及频谱分配方式的缺乏灵活性。目前绝大多数适合无线电
跳频通信具备良好的抗干扰、抗衰落以及多址等性能,不管是在军事通信领域还是民用通信领域都被广泛地运用。在组网通信时,跳频图案是作为跳频系统中控制跳频频率跳变的关键技
近几年,非接触的射频识别技术(Radio Frequency Identification,RFID)已成为人们生活中不可或缺的一部分,凭借着自身体积小、远距离通信、无线识别、具有一定存储能力且无需
利用深度学习方法辅助医学图像信息处理是属于人工智能技术在医学领域的应用与研究。基于体素的脑肿瘤图像分割任务最重要的工作是对脑肿瘤组织区域像素实现高精度的分类。但
随着微机电系统的快速发展和传感器技术的日益成熟,无线传感器网络逐渐成为人们研究的热点,并在军事、医疗、环境监测等许多领域都显示出了巨大的应用前景和实用价值。无线传感
本文以GPS接收机为例,主要研究了全球导航卫星系统(Global NavigationSatellite System)软件接收机基带关键技术捕获与跟踪,其目的是使接收机产生的本地载波频率与扩频码的码相位