论文部分内容阅读
目标检测是计算机视觉领域中的核心课题之一,也是其它很多视觉任务的基础。得益于深度学习技术以及现代GPU计算能力的进步和发展,基于深度学习的目标检测技术已经在部分领域取得了一些成果,例如智能安防、无人车驾驶、医学图像处理等领域。目标检测的主要任务是从图像信息中检测并定位特定的目标,融合了图像处理、模式识别、特征提取、深度学习等许多领域的前沿技术,是一项具有挑战性的课题。因此本文对基于深度学习技术的SSD目标检测算法做了进一步研究,并使用了通道剪枝算法对SSD算法的骨干网络进行剪枝,使得SSD目标检测算法能够更加高效。本文的具体工作内容为:(1)提出了一种基于空洞卷积和特征图融合的SSD目标检测算法。该算法对原始SSD算法进行了一系列的改进,提高了原始SSD算法的检测的能力。原始SSD算法需在六层不同尺度的特征图上选取候选框进行预测,而这六层特征图提供的特征信息是有限的。针对这一问题,本文使用了特征表达能力更强的Res Net50替代原始SSD算法中的VGG16网络。同时设计了两个模块:特征融合模块,将感受野大、语义信息丰富的深层特征图与感受野小、细节信息丰富的浅层特征图进行融合,提升特征图对图像的整体表达能力;以及空洞卷积模块,进一步扩大浅层特征图的感受野,增强语义信息。实验结果表明,该设计有效的改善了SSD算法检测目标的能力。(2)提出了一种基于通道注意力机制的通道剪枝算法对改进后的SSD模型中的主干网络Res Net50进行了压缩,减少了改进后的SSD算法所需的存储空间和计算资源,使其可以高效地运行在计算和存储受限的设备上。以往在使用的通道剪枝算法中,为了更好地获得最小的重构误差,即使实际上与卷积神经网络的特征判别能力完全无关的输入通道,也极有可能会被错误地保留下来。针对这个的问题,本文通过引入通道注意力机制来更准确地判别其输入通道中特征的重要性。设计了一个通道注意力单元,针对输入的特征图,学习其不同通道的重要性,即为不同的通道分配权重。因此通过通道注意力单元可计算特征图中每一层通道的重要性C(为1×N的向量),将向量C中前6)7)(6)7)表示第7)层剪枝后需要保留的通道数)个较大值对应的通道保存下来,便能达到剪枝的目的。实验结果表明,提出的方法有效减少了网络中存在的参数冗余,实现了模型压缩。