基于CUDA的行人检测算法的研究与实现

来源 :东北大学 | 被引量 : 0次 | 上传用户:jy8578
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着国民经济的不断发展,人民生活水平的日益提高,汽车已经成为人们出行的重要交通工具;我国个人汽车的持有量在不断增加,大大提高了人们出行的便捷性,但随之而来的是交通事故的逐年增加。行人检测作为驾驶辅助系统的重要的组成部分,对保证驾驶员的安全性、保证行人的生命财产安全具有重要意义。而精度足够的行人检测系统需要大量的计算,非常耗时,难以达到实时的效果。GPU的出现与推广,为我们研究算法的并行加速提供了新的途径,计算统一设备架构(CUDA,Compute Unified Device Architecture)开启 了使用 GPU 强大计算能力做通用计算的大门,使得开发者能够在友好的开发环境中充分挖掘GPU的计算能力。而美国NVIDIA公司新推出的Jetson Pro汽车开发平台拥有强劲的性能,它可以提供一个全功能的NVIDIA CUDA平台,可以让开发者能够轻松打造和测试各种汽车与计算机视觉应用。本文主要研究的内容就是针对行人检测算法精确性和实时性的矛盾,如何将行人检测算法进行并行化改造,利用GPU进行加速来解决这一矛盾,并在Jetson Pro上进行并行算法的实验。本文通过分析研究行人检测算法的研究现状,选择Haar-like特征作为行人描述特征,采用AdaBoost级联分类器进行分类,并通过光流计算,在检测出结果的基础之上,对未来行人位置进行预测,提高行人检测算法鲁棒性。详细介绍了 CUDA的编程模型和其软硬件架构以及NVIDIA Jetson Pro汽车开发平台的性能和特点,在此蕋础上实现算法的并行化。本文通过对行人检测算法进行深刻研究,对串行算法进行耗时分析和特性分析,根据计算复杂度、数据依赖程度等方面因素,选择对算法中积分图计算、AdaBoost级联分类器、基于金字塔光流计算部分进行并行实现。并且结合CUDA的特点,提出一些优化策略,使算法更好的适用于CUDA架构,达到更好的执行效率。本文在NVIDIA Jetson Pro汽车开发平台上进行实验,对串行算法与并行算法进行耗时对比。实验结果表明,本文并行行人检测算法对比串行行人检测算法加速明显,提高了实时性。
其他文献
异构数据库集成是自80年代中期以来数据库界的研究热点。许多方法被提出,如数据库网关、ODBC等,以期解决集成系统所面临的异构性等问题。但是由于没有统一标准和构件化思想,使得
随着信息产业化的快速发展,数据的产生与收集能力迅速提高。存储数据的爆炸性增长业已激起对新技术和自动化工具的需求,以便帮助我们将海量数据转变成信息和知识。数据挖掘正是