论文部分内容阅读
近年来,随着计算机视觉领域的蓬勃发展和网络技术的不断深入,目标检测作为计算机视觉领域重要研究问题也得到了飞速发展。而标识检测作为目标检测的子领域问题也得到研究者们的充分重视。标识检测问题在商品广告宣传、版权侵犯检测、智能交通系统等领域都有着广泛的发展与应用。标识具有特定和极具代表性的形态,在不同场景与附着物下具有多种变换形式,为该任务带来严峻挑战。传统的标识检测算法往往是基于手工定义的特征进行关键点的检测与识别。由于大数据时代的到来和深度学习技术的深入研究,基于深度学习的卷积神经网络模型计算机视觉应用领域中取得了令人瞩目的成绩,其具有局部感受野、权重共享和下采样等结构特点,对于提取数据的局部特征和语义信息有更好的能力。但由于其本身对训练数据量的强烈依赖给一些小样本问题的视觉领域任务带来了挑战,因此研究小样本下的标识检测问题具有一定的研究应用价值。本文介绍了传统的标识检测方法,再详细介绍了现主流的基于深度学习的目标检测框架,提出了一种面向小样本的标识检测的基本框架,实现了更具模型表现力的检测算法,并应用到特定标识数据集的检测任务中。主要工作如下:(1)根据小样本标识检测任务的特性,依据迁移学习的思想构建了适合小样本标识检测的三阶段标识检测框架。第一阶段利用基本的深度学习目标检测器在大型数据库ImageNet上进行预训练,使参数初始化;第二阶段用大量的人工合成的图片训练逐步精细模型;第三阶段用少量的真实标识样本训练更为精细化的模型。(2)从数据层面通过构建基于背景信息的人工合成样本来改善小样本标识检测问题。根据标识类型自带的环境属性选取合适的标识模板,进行多种图像处理变换后以随机位置插入到背景图片中,最后进行泊松融合方法使其与背景融合的更为真实。(3)从算法模型层面依据标识的特点,实现了更具模型表现力的检测算法,使其能够利用仅有的样本下更大化地利用其优势。首先使用Faster R-CNN检测算法进行标识检测,通过RPN区域建议网络进行区域候选框的定位,之后与Fast R-CNN检测网络共享特征进行检测;进而插入可变形网络模块,进一步增强对物体形变和尺度的建模能力。