基于卷积神经网络的弱监督目标定位及其应用

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:myxiu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着软硬件技术的发展及网络带宽的不断增加,图像和视频数据越来越多,如何使计算机有效的处理和理解这些数据,以协助相关行业人员,是一个重要的问题。2012年深度学习的兴起,使工业界和学术界关注的重点逐渐转移到基于卷积神经网络的视觉算法上。目前,卷积神经网络广泛应用于计算机视觉领域的各个方面。其中,目标定位作为一项基础性研究,应用于许多高层视觉任务中,如智能交通,智能安防,医学影像等。本文以“基于卷积神经网络的弱监督目标定位”为问题核心,提出了多层次特征融合的目标定位方法及基于目标定位的细粒度图像识别框架,本文主要内容如下:首先,本文结合SSD和Dens Net的思想,基于CAM设计了一种多层次特征融合的弱监督目标定位方法。目前的目标定位方法,如CAM和SPSM,是从卷积网络的最后一层卷积层提取信息的,缺少了低层信息,本文提出的方法将高层特征图和低层特征图融合,能弥补高层特征图缺少的目标形状信息及大小信息,同时能够抑制低层特征图带来的噪音。本文将提出的方法在CUB-200数据集、Caltech101数据集、Image Net数据集上与CAM和SPSM进行了对比。在三个数据集上,与CAM相比平均定位成功率分别提高了3.3%、11%及4.7%,与SPSM相比平均定位成功率分别提高了3.7%、1.4%和4.7%。其次,本文针对细粒度图像识别任务将目标定位方法进行优化,提出了定位切割填充学习框架。目标定位在细粒度识别任务中的主要功能是发现并放大图像中的物体,从而消除背景干扰。在一些图像中,物体很小,会影响识别结果。通过弱监督目标定位算法放大这些小物体,使得所有物体的大小相差不大,从而提高识别精度。切割填充运算能够切断物体各部分之间的关联性,可以使子图像更加独立,但不会破坏高层语义。本文在CUB-200数据集、Stanford Cars数据集、FGVC AIR数据集上与其他方法进行了对比,结果表明LCPL优于其他方法。
其他文献
在导航电子地图行业的主流产品愈发同质情形下,多数用户属于双边平台,而且产品之间的转换成本较小。此时,增值服务是提升用户粘性,增加产品区分度的有效途径。本文从数字生态
目标跟踪是计算机视觉领域的重要研究方向。因为目标跟踪技术在多个领域都具有举要重要应用价值,所以目标跟踪是目前计算机视觉研究的热点。本文通过近几年的目标跟踪方法进
研究背景和目的:心衰(heart failure,HF)是一种心脏泵血功能障碍与代偿性激活的神经体液因子相互作用为特征的临床综合征。心梗后心室重构及交感神经系统过度激活可加剧心功
脑-机接口(Brain-Computer Interface,BCI)通过解析输入的脑电信号,将用户的意图解码为控制指令来控制输出设备,实现人脑与外部设备的交互。脑-机接口技术的核心是脑电信号的
近年来,随着科技的发展,复杂动态网络广泛渗透于各行各业,在人类社会生活中占据着十分重要的地位。例如在互联网、交通、通信、生物医疗、智能制造、社交网络等领域得到了广
我国是世界能源生产和消费大国,随着经济社会的不断发展,我能源需求将持续增长。增加能源供应,保障能源安全、保护生态环境、促进经济和社会的可持续发展,是我国经济和社会发
涉藏舆情是社会管理部门了解藏区民众对社会政治态度等更为直接途径,同时也是制定舆情管控策略、引导舆情导向的重要依据。随着互联网尤其是境外网站中所包含大量的涉藏舆情
随着数字图像的发展,人们对图像质量的要求日益提高。高动态范围成像技术的出现满足了人们的需求,该技术还原了实际场景的亮暗信息,更符合人们视觉感受,并且促进了数字化信息
随着云计算、物联网、大数据和虚拟现实等信息技术服务的日益普及,传统的固定和无线接入网正面临带宽指数增加的挑战。无源光网络-可见光(Passive Optical Network-Visible L
随着物联网和智能电网的迅速发展,优化用电信息采集系统及采集主站、采集终端、结构、通信、精准采集成为了需要迫切完成的任务。现用的各类用电信息采集系统中针对实时采集