论文部分内容阅读
目标检测分割的主要目的是识别以及定位图像或视频中的目标。它已被广泛应用于无人驾驶、军事分析以及智能监控等诸多领域,是计算机视觉领域的核心任务之一。目前,世界各地的学者在目标检测与分割的算法研究上已经取得了突破性进展,然而在实际应用中,复杂背景下的目标检测分割技术仍然面临许多挑战:1)小目标是指占据图像像素几十甚至几个的目标。它往往具有诸如分辨率低、特征不明显以及对背景干扰敏感等问题,从而导致小目标的检测效果不尽人意;2)复杂背景中的多个目标通常具有相似以及遮挡等情况,从而增加了检测错误概率,例如多个目标的漏检和误检。因此,对复杂背景下的目标检测分割技术进行深入的分析是一项十分困难且有意义的研究。针对上述问题,本文从实际应用出发,结合深度学习中的R-CNN算法来研究复杂背景下的目标检测分割技术,主要研究工作和创新点如下:首先,本文详细总结了目前比较经典的目标检测分割算法,主要包括传统的基于手工设计特征和基于深度学习的目标检测分割算法以及相关技术,为本文的研究内容提供详尽的理论支撑。然后,为了解决现有的目标检测分割算法对复杂背景中的小目标检测精度低的问题,本文对Faster R-CNN算法进行研究,并在此基础上提出了一种适用于小目标的检测算法。该算法首先针对图像中小目标特征难以提取的问题,设计一种多层特征融合方法,通过特征图相加的方式融合目标的低层细节信息和高层语义信息,以更准确地提取小目标的特征。其次,设计了一种全新的候选区域生成网络结构—多尺度RPN,用来生成位置更加准确的小目标初始候选区域;同时为了解决RPN训练过程中正负样本不平衡和小目标边界框难以回归的问题,设计一个着重于挖掘训练数据中正样本的正样本感知损失函数以及一个基于GIoU的边界回归损失函数。最后在公共数据集VOC2007和自行构建的接触网数据集上进行实验验证。实验结果表明,本文提出的改进算法对复杂背景下的小目标检测具有更高的准确性以及鲁棒性,为小目标的检测提供了可行的方向。最后,针对复杂背景中多个目标之间存在相似以及遮挡的问题,本文提出了一种基于改进Mask R-CNN的多目标分割算法。该算法首先在主干特征提取网络中增加一个通道注意力模块,该模块能够通过自我学习的方式为图像中不同目标的特征分配不同的权重,从而获取更加有效的目标特征;同时使用混合空洞卷积替换特征提取网络中的部分池化操作,混合空洞卷积能够在不改变特征图分辨率大小的同时增加感受野,从而减少池化再卷积过程中引起的信息损失,保证全局特征的完整性。然后,采用一种更加准确的感兴趣区域池化操作Precise RoI Pooling来解决RoI Align模块中需要人为设置插值点数量、无法自适应特征图大小做出调整的问题。此外,针对Mask R-CNN对目标边缘分割效果不佳的问题,设计一个目标边缘检测网络,完善对目标边缘分割的细节处理。最后在公共数据集Cityscapes上进行一系列实验对比分析,实验结果表明,该算法能够有效地实现复杂背景下多个目标的检测分割。综上所述,本文重点研究复杂场景下的小目标检测和多目标分割问题,并针对问题提出相对应的改进。通过一系列的对比实验表明,本文方法提高了复杂场景下小目标检测和多目标分割的精度以及效率,具有一定的参考应用价值。