论文部分内容阅读
随着目前计算机视觉技术的不断发展,目标检测作为计算机领域中最重要的一部分,同时也在智能交通、图像检索、信息采集多个领域有着重要的地位。然而很多传统的目标检测算法都是基于手工设计的特征和小训练样本的,往往受到光照、遮挡、环境变化因素等众多因素的影响,进而影响了目标检测算法的性能。而近几年发展越来越火热的深度学习作为一个有力的工具能帮助人们实现更好地在目标检测领域进行研究和探索。深度学习在目标检测领域以极大的优势超越了传统视觉算法,通过在大数据下自主学习得到的特征,不仅在数量上更是在性能上远远超出了人手工设计的算法特征。虽然深度学习有着传统视觉算法不能比拟的性能优势,但是深度学习的缺点也是显而易见。深度学习中越深层的模型包含了越多的参数,带来了计算量的大幅提升,导致无法实时运行。这对于将深度学习技术应用于人们的日常生活带来了诸多困难。庞大的计算量需求导致了深度学习不能实时的运行在嵌入式或是手持设备中。为了解决这个问题本文提出了基于模型中卷积核滤波器筛选策略的模型精简以及端到端的目标检测方法,具体工作内容如下:(1)针对目前深度学习模型中参数繁多、运算耗时久、占用体积大的问题,本文提出了一种基于平均响应值Average Response Energy(ARE)的卷积核滤波器筛选策略,主要是将深度模型中贡献度低的卷积核滤波器从原模型中移除,可以大量的减少原模型的权重参数,进而减少模型的占用体积与计算量。在本文的三个公共数据集上,实验结果也是表明了基于平均响应值的卷积核滤波器筛选策略对于降低模型体积和计算量是有效的,在不牺牲精度的情况下,能够大幅提升深度学习模型的实时性。(2)对于当前结合分割定位算法和深度学习分离式框架,本文通过在深度模型的最后一层卷积层后添加多尺度卷积特征提取层,训练了一个端到端的基于深度学习的目标检测框架。在PASCAL VOC 2007数据集上,实验结果也是表明了该端到端的深度学习目标检测算法可以有效降低模型的运算时间。