基于深度学习的铁路工具图像分类及检测方法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:tjtcqp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
铁路系统是物资运输和人员运输的主要方式,而铁路工具是对铁路系统进行保养和维修的关键,对于铁路工具的管理是提升工作效率的重要环节之一,其中需要解决的首要任务就是如何精准地识别出所需要的工具。同时,深度学习技术的发展在计算机视觉领域获得了巨大成功,关于图像识别的研究也在如火如荼地进行中。本文正是在这样的背景下分别研究了基于深度卷积网络的铁路工具图像分类方法以及面向自然场景的铁路工具检测方法。本文的主要研究工作如下:(1)针对现有的铁路工具图像数据集缺乏的问题,本文依据GB tool standards标准,从谷歌图库中爬取了铁路工具图像,预处理后构建了Railway Tool-10铁路工具图像数据集,其中包含10类共7975张铁路工具图像。同时,针对自然场景下的铁路工具图像检测数据集缺乏的问题,本文结合Railway Tool-10数据集及COCO数据集,通过数据合成方法构建了Railway Tool-Detection铁路工具检测数据集,该数据集包含10类共10000张自然场景下的铁路工具图像;(2)目前的图像分类研究中较少有针对铁路工具图像进行分类的工作,本文从深度学习分类算法出发,针对目前Res Net分类模型中深层特征丢失空间几何信息以及特征提取过程中没有考虑到特征通道维度关系的不足,提出了SARNet(Skip Attention Res Net)。SARNet在Res Net中引入空间注意力子模块及通道注意力子模块,学习特征的通道权重及空间权重,进一步使用skip方法融合模型的深浅层特征,加强深层特征的空间几何信息,通过这种方式,提升了Res Net特征提取的表现。然后基于Railway Tool-10数据集进行对比实验,实验结果表明,SARNet相比于原Res Net,分类准确率提升了7.2%。最后基于Grad-CAM方法对SARNet模型进行可解释性分析,Grad-CAM能够以热力图的方式展示模型关注于图像的哪些区域,分析结果表明SARNet能准确定位到图像的关键视觉区域;(3)当前目标检测研究中尚未有面向自然场景的铁路工具检测方法,本文从深度学习目标检测算法出发,针对自然场景下的铁路工具目标较小、特征较难提取的问题,提出了多任务结构下的铁路工具检测模型(Multi-task Railway tools Inspection Network,MRIN),该模型分为两个部分:1)多尺度细节特征提取器,该模块以Res Net101为骨干网络,使用添加了注意力机制的FPN结构进行图像特征的提取,解决了自然场景下铁路工具目标较小、特征较难提取的问题;2)多任务铁路工具预测模块,该模块主要基于Faster R-CNN的预测模块,对MDFE提取的特征进行目标区域的定位及识别。最后在Railway Tool-Detection数据集上进行实验验证,实验结果表明MRIN在Railway Tool-Detection数据集上m AP值达到了0.977。
其他文献
脉冲微分方程是一类有着广泛应用的数学模型.近年来,有关脉冲微分方程的理论研究取得了极大进展,特别是解的定性理论研究(包括周期解、正解、多解的存在性、有界性等).然而有些理论研究还处于初级阶段.本文主要建立两种脉冲微分方程模型,在已有研究成果的启发下,得到某种程度上更具实用价值的结论.本文重点研究固定脉冲微分方程mild解和随机脉冲微分方程多解的存在性,针对不同类型的脉冲微分方程分别建立相应的求解框
水面无人艇(unmanned surface vessel,USV)是近年来新兴的水上力量,能够在水上搜救、后勤补给、水质监测、水文采样、海洋环境测绘、水域生态保护等领域大展身手。同时伴随着计算机视觉技术的迅速发展,搭载视觉智能感知系统的水面无人艇更易于对水面目标进行有效地辨别,因此研究面向无人艇智能感知的水上目标识别方法具有重要的理论意义和应用价值。本文依托“ME120全自动无人船平台”,针对水
随着万物互联概念的兴起以及智能移动设备的普及,利用图像传感器的光相机通信(Optical Camera Communication,OCC)越来越受到学界的关注。OCC系统采用发光二极管(Light Emitting Diode,LED)光源发送信号,利用互补金属氧化物半导体(Complementary Metal Oxide Semiconductor,CMOS)相机接收信号。目前,基于卷帘效果
人类的生存和发展已经受到了全球气候变化的严重影响。为减缓气候变暖的势头,寻求一条可持续、绿色友好的发展之路,我国于2021年制定了碳达峰和碳中和的目标。人类一直在减少化石燃料燃烧的碳排放量上采取了很多措施,但是每年化石燃料的碳排放量不足土壤呼吸的十分之一。因此,揭示土壤呼吸的时空变化特征及其影响因素,对于准确评估全球碳循环和预测气候变化,如期实现碳达峰和碳中和的目标具有重要意义。自1999年开始,
感应加热技术以其加热效果好、效率高、节能环保等优越的性能优势被广泛应用于工业、民用、商用各领域。感应加热电源的输出特性对负载的波动非常敏感,而磁性元件的物理特性随温度变化明显,尤其是当温度到达居里点时,磁性元件的磁导率会发生突变,因此在熔炼、废气处理等加热温度达到居里点的工业场景时,会影响电源的正常运行,甚至存在损坏电源的可能。传统研究均通过变频以实现调频控制,而较大的频率波动会降低磁性元件的利用
在我国离婚率持续上涨,人口老龄化程度日益加深的背景下,养老金作为夫妻财产的重要组成部分,关于养老金分割的离婚纠纷日益增多。法官审理养老金分割案件的法律适用和国内学者关于养老金分割的研究,主要来源于对婚姻法以及司法解释进行的分析与理解。由于目前我国养老保险制度仍不完善,婚姻法及司法解释也没有对养老金分割范围和分割方式作出具体规定,这导致司法实践中产生了许多问题。在学习国内外学者对相关问题的研究后,笔
大脑神经元的数字化重建是神经科学研究的重要内容,对理解神经系统的连接关系、构建大脑连接图谱至关重要。当前,大脑神经元重建工作主要依赖人工手动或半自动重建,是神经元数据分析流程中最为耗时和最耗费人工的环节之一,这极大地阻碍了对神经元数据的深入挖掘和分析处理。由于大脑神经元图像中存在间隙,自动重建算法产生的大脑神经元重建结果可能不完整,产生未重建的分支,所以需要在后处理时进行修复。因此,本文提出了一个
相比于传统的复合材料结构,复合材料夹芯结构由两层薄的复合材料面板和中间的厚芯材所组成,具有比刚度高、比强度高和重量轻等特征,良好的耐撞性能使其在航空航天、汽车等工程领域得到广泛的应用。在受到外来荷载时,复合材料夹芯结构通过面板和芯材复杂的变形破坏来吸收能量,其中芯材构型是影响夹芯结构耐撞性和能量吸收的关键因素。经合理设计的芯材构型可以通过特定的变形模式充分耗散能量,增强结构的耐撞性。在工程领域对结
2,2-联苯酚的选择性脱氧还原在有机合成中具有非常重要的应用,特别是用于合成带有联苯骨架的配体和杂环化合物。目前,酚类脱氧还原的主要方法有过渡金属催化的脱氧还原,金属氢化物催化脱氧还原和电化学脱氧还原。目前,显然过渡金属催化的酚及其衍生物通过芳基C-O键断裂的功能化和交叉偶联反应已经发展了很多的方法。但是通过C-O键的还原去官能化仍未得到充分探索。因此,开发一种高效的脱氧还原的方法是非常有必要的。
在当今全球一体化的背景下,中西方的文化交流与碰撞已经是时代发展的必然趋势,搭乘体育舞蹈这趟“高铁列车”能够加快弘扬中国文化的步伐。与此同时,“终身体育”意识的形成推动了各类体育休闲项目的发展,而体育舞蹈集体育的竞技性与舞蹈的表演性于一体,故而受到越来越多民众的喜爱,逐渐形成了一种潮流趋势。体育舞蹈分为竞赛舞与表演舞,本文选取了具有一定灵活性与自由度的表演舞,以拉丁舞为例进行融入中国元素的编创研究。