基于深度学习的管制物品图像语义分割算法研究

来源 :江西理工大学 | 被引量 : 0次 | 上传用户:a81569476
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文的研究基于现实安检过程中,管制物品图像的语义分割来展开。目前,管制物品的检测工作大部分是通过安检X光机对包裹扫描,人眼判断包裹是否夹带管制物品,其中,安检X光机对包裹中的一些小目标检测效果较差,甚至检测不到,存在安全隐患,管制物品的自动语义分割能有效提高安检效率和提升安全指数,并同时能够节约人力成本,保障人们在公共出行和公共场所的安全。图像的语义分割是计算机视觉基本任务之一,图像的语义信息是用定义的标签来对图像的每个像素进行分类得到,相似性视觉特征的像素划为同一类标签,通过划分每个像素点的类别,达到区域划分效果。本文针对管制物品图像的语义分割任务,所做的工作阐述如下:(1)对目前基于深度学习的语义分割现状和主要模型和使用到的技术进行了阐述。专门采集制作了特有的管制物品图像数据集CLD2020共1500张,用于对管制物品图像语义分割算法的研究,该数据集包含六类:刀、枪、剪刀、斧头、钝器、其它(小物品、疑似危险品等)。(2)提出了多尺度深度卷积神经网络(MDCNet)分割模型,编码器部分主要是通过深度卷积神经网络获取管制物品图像的低层信息,利用网络中的金字塔池化层对目标高级抽象特征的提取,从而完成对管制物品像素标签的正确分类。解码器主要是利用级联卷积和注意力机制,将不同的网络进行融合,并实现特征增强,提高管制物品图像的分类精度。用FCN、Deep Lab V2、PSPNet和Deep Lab V3+算法和本文提出的MDCNet算法在VOC2012测试集进行性能比较,实验结果表明MDCNet算法可以达到较好的性能效果,比PSPNet的MIo U提高了2.11%,和Deep Lab V3+的MIo U仅相差1.29%,MDCNet算法在普通物体的语义分割性能与对比算法相当。在CLD2020数据集的测试中,MDCNet算法比Deep Lab V3算法的MIo U提升了1.61%,MDCNet算法在针对CLD2020数据集时,对小管制物体的分割准确度与Deep Lab V3+对比有明显提升。(3)对全卷积网络Seg Net,FC-Dense Net和Deep Lab V3+用CLD2020数据集进行研究对比,从分类准确性、实际效果和计算效率来评估算法的性能。把条件随机场(CRF)作为改进分割的后处理模块,对Seg Net和FC-Dense Net的PA分别提升了4.3%和1.1%,MIo U分别提升了6.4%和1.5%;在Deep Lab V3+使用Xception和Mobile Net V2的PA分别提升了10%和0.9%,MIo U提升了9.4%和0.3%,可以看出CRF用于Deep Lab V3+(Xception)的性能提升最明显。全卷积网络在添加CRF后网络性能提升的同时,计算效率有一定的降低。
其他文献
近年来,我国心血管疾病的病亡率仍处于不断上升的趋势,当务之急就是要进行积极干预有效防治,降低发病率和死亡率。心音信号能较准确地将心脏组织的状态信息、健康状况反映出来,因此对心音信号的处理有着至关重要的作用。心音信号分析与处理主要步骤有以下几个方面:降噪、包络提取、分割、特征提取和分类。本文研究主要围绕心音信号处理中的分割和分类方法展开的,具体开展的研究工作如下:(1)基于逻辑回归的隐半马尔可夫模型
优化问题广泛存在于科学和工程应用中,通常具有大规模、多模态以及多个目标之间相互冲突等特性。传统算法求解这些问题时,在计算成本、时间消耗上面临着越来越大的挑战。近年来,进化算法,尤其是群智能优化算法,因其在解决复杂问题时的高效和稳定而受到越来越多的研究,例如人工蜂群算法,蚁群优化算法和粒子群优化算法。其中,粒子群优化算法凭借独特的群体仿真行为与高效稳定的优化性能,已经被广泛研究并应用于各种优化领域问
随着互联网、传感器等技术的发展,社会的信息化不断被推进,全球数据的生产速度也在飞快增长。众所周知,移动通信数据是承载着通信业务与互联网信息的大动脉,是网络信息时代发展的重要基础设施。因此,通信大数据的概念越发受到关注,数据价值信息的挖掘也逐渐成为研究热点。其中,数据集中项与项之间关联规则挖掘技术的分析和发现也是数据挖掘过程中的重要分支。同时,该项研究挖掘的规则中所蕴藏的潜在价值也是前所未知的。因此
伴随着机器人技术的快速发展,移动机器人在日常生活和工厂工作的身影越来越频繁。论文针对生活、工业上的移动机器人可以自主运动,完成特定任务,如监控环境、搬运小物件等,所提出的全向移动机器人的研究。分析麦克纳姆轮的的运动学方程及其全向运动车轮的转向关系、对移动机器人同时定位和创建地图(SLAM)以及路径导航规划展开研究,以ROS作为软件基础设计了自主导航系统,同时搭建了四轮全向移动机器人样机,验证自主构
求解最优化问题一直都是计算机工程、生产调度、人工智能等领域广泛关注的一个问题,其核心思想是在可行解范围内设计符合特定约束条件的方案,使得目标最优化。随着计算机科学技术的飞速发展,经典的传统优化方法已不足以解决约束条件越加复杂的优化问题。群智能优化算法普遍具有灵活度高、寻优性能良好、鲁棒性强等优势,该类算法可以更好的解决非线性、大规模的复杂优化问题,因此自其提出之日起便受到广泛的关注与研究。近年来,
伴随着互联网技术的迅速发展,网络的安全问题越来越引起人们的关注。在复杂网络中,存在着大量的攻击性病毒,一旦网络中的计算机被病毒感染并爆发,将会对人类的生产生活造成不可估量的损失。因此,本文针对网络安全中存在的问题,研究了恶意代码的分类和病毒的传播控制方法。通过从不同的角度来遏制或减小病毒在计算机中的传播,从而控制其造成的不良影响。本文主要进行两方面工作:(1)针对恶意代码家族存在的混淆问题,提出了
随着双目立体视觉理论的发展,以及计算机硬件计算能力与影像采集设备精度的提升,双目立体视觉技术在三维测量、目标定位与三维场景重建等领域应用愈加广泛。在环境复杂的井下矿山中,实现准确、稳定的出矿计量,是当前矿山企业在生产管理中必须考虑的现实问题。针对矿斗载矿量测量的问题,本文以形状不规则的钨矿石为研究对象,提出了一种基于双目立体视觉的非接触式体积测量方法,并对形状不规则的矿石进行了体积测量试验。双目视
影响最大化问题旨在从社交网络中找出能使信息扩散范围最广的Top-k个用户作为信息源发散信息。社交网络结构的多样化不断给影响最大化问题注入活力,让它在近二十年里经久不衰,一直是学术界的热门问题。本文从基于割点的社交网络影响最大化算法和通过优化网络结构实现影响最大化两个方面展开如下工作:(1)基于割点的社交网络影响最大化算法:现有算法主要关注于节点的特征,较少从社交网络的连通性角度来看待影响最大化问题