基于深度学习的目标检测方法研究

来源 :北京邮电大学 | 被引量 : 3次 | 上传用户:tang355402
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉领域基础且具有挑战性的课题,其主要目的是识别图片中所有目标的类别并定位。本课题在大量国内外研究基础上,探讨当前基于深度学习的目标检测技术面临的困难和挑战。针对这些困难和挑战,本课题从卷积神经网络的平移变化性、卷积滤波器感受野、特征图分辨率及融合三个角度出发,提出解决方案。本课题提出了一种对位置敏感的网格卷积神经网络。当前最优的目标检测方法通常依赖于针对图像分类任务设计、并在大型图像分类数据集上预训练的卷积神经网络(Convolutional Neural Network,CNN),然后在目标检测数据集上对预训练的CNN进行调整。图像分类任务需要CNN的平移不变性越强越好——当目标在图片中移动时,期望对目标做出相同的、无差别的判决;目标检测任务需要CNN有一定的位置表示平移可变性——当目标在边界框中移动时,期望做出具有区别性的判决,以区分好的定位和差的定位。位置敏感的网格卷积神经网络包括网格卷积层和网格池化层。网格卷积层包含一组并行的卷积层,分别输出对目标不同位置敏感的特征图,网格池化层的输出单元交替地来自于不同的特征图。网格卷积神经网络可以通过网格种类控制对目标平移的敏感性,从而解决为图像分类任务设计的CNN平移不变性太强的问题。实验结果表明,网格卷积神经网络可以改善目标检测性能,提高目标检测精度。本课题提出了一种新的卷积形式来自适应地确定卷积滤波器的感受野大小,称为感受野自适应卷积。CNN中卷积滤波器的感受野大小是目标检测任务的关键问题,卷积滤波器输出必须响应图片中适当大小的区域才能捕获有效的信息。由于CNN固定的几何结构,卷积滤波器的感受野大小是固定的。然而,一张图片可能有多个不同尺度的目标,高层的卷积滤波器在空间位置上编码语义特征。因此,目标检测任务期望能够自适应地确定卷积滤波器的感受野大小。感受野自适应卷积可以自适应地确定卷积滤波器的感受野大小,它通过为滤波器添加不同的膨胀值,分别计算卷积值,并选择其中最大值作为输出。实验结果表明,感受野自适应卷积可以根据目标尺度自适应的改变感受野大小,以提取更优的特征图,提高目标检测精度。本课题提出了一种对高分辨率特征图进行多级融合的目标检测架构。目标尺度变化大,特别是小目标检测是目标检测任务面临的主要挑战之一。当前主流的CNN架构具有较大的步长,导致提取的特征图分辨率比较低,这使得小目标检测具有一定的挑战性。在保持输入图片尺寸不变的情况下,高分辨率特征图多级融合模块可以将CNN顶部特征图的分辨率提升为原来的4倍并对特征图进行多级融合,以解决目标检测任务中小尺度目标检测困难和目标尺度变化大的问题。另外,此方法通过明确地建模特征图通道之间的相互依赖性自适应地重新校准通道间的特征响应。实验结果表明,此方法提取的高分辨率特征图,可以提高目标检测精度,特别是对于小尺度目标。
其他文献
在饲料中添加植酸酶可提高植物性饲料中磷的利用率和单胃动物对矿质元素的吸收率,并减轻动物排泄物中磷对环境的污染。在生产酶制剂的过程中提高植酸酶基因的表达水平以及改
随着信息化与经济全球化的趋势,服务业已经成为一个国家或地区发展的支撑产业及一个城市的衡量标志,具有高附加值、低资源消耗的特点,在很大程度上代表一个国家和地区市场化
依靠静载试验台,设计了羊角单滚轮导缆器试验工装,通过有限元分析,确定导缆器受力较大位置,然后借助应力测试手段,监测导缆器在加载过程中的应力变化,最后得到试验数据,验证
医学影像配准方法在肿瘤放疗中具有广泛应用。目前图像配准方法主要是基于图像强度的配准方法,该类方法存在难以寻找合适的相似性测度以及迭代计算耗时过长等问题。由于深度
随着科学技术的进步和工业化进程的不断推进,人类社会对化石燃料的依赖日益加剧,燃烧所产生的过量二氧化碳(CO2)引起的诸多环境与气候问题也日趋严重。从合成化学的角度审视,二