论文部分内容阅读
要实现井下机车的无人化、自动化,保障机车安全有序的运行,对作为机车眼睛的图像识别器的研究是矿井安全生产监控的关键一步。图像识别器主要用于识别井下场景的各类物体目标,为机车提供场景的分析,是矿井安全高效生产的关键保障,也是减少井下运输事故的发生,减少人员伤亡及财产损失的有力保障。深度学习技术的不断发展与逐渐成熟使得图像识别效果越来越好,目前涌现出许多表现优秀的目标检测与识别网络。然而大多数的网络模型是基于路面上的,鲜少有可以直接用于井下场景识别的网络,并且大多数网络对于实际的移动端应用来说模型太大难以移植,目前也没有一款成型的用于井下场景识别的硬件设备。因此,研究一种基于嵌入式终端的井下场景视觉识别系统具有很大的研究价值和现实意义。本文针对上述现状,做出了理论和工程应用两部分的研究工作:1、研究并改进了基于VGG(Visual Geometry Group)的SSD(Single Shot MultiBox Detector)网络模型,使其可以更多的识别到小目标物体,使得小目标的平均识别精度在公共数据集上提高了近3个百分点,在井下数据集上提高了近5个百分点;研究了紧凑型单目标分类网络模型,讨论紧凑型网络模块的设计原则,给出模块结构并由此提出紧凑型单目标分类网络结构;研究了深度网络的压缩算法,对比已有的典型压缩方法并改进现有方法,通过剪枝与量化并行压缩提高网络的压缩效果,并将压缩方法应用于井下场景的目标检测与分类网络,在识别精度影响不大的前提下将目标检测网络从20.56MB压缩到1.78MB,目标分类网络从4.76MB压缩到372.06KB,并且网络在TX2平台上的运行速度提升了3倍。2、研究了井下场景物体检测与识别的工程应用,给出了应用于井下场景视觉识别的图像识别器的应用需求,提出了相关技术指标、主要特征及其主要功能。基于TX2平台设计并改进了图像识别器的硬件结构,介绍了硬件设计过程,给出了硬件设计的相关原理图,并介绍了图像识别器的软件开发流程,给出轻量压缩网络实际的检测与识别效果。