基于视觉注意力模型的图像去雾深度学习方法研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:Ryan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化时代的来临,计算机视觉系统在视觉导航,视频监控,自动驾驶等领域发挥了巨大作用,然而目前视觉系统的性能与其成像接口收到图像质量息息相关,视觉系统在处理恶劣环境下的拍摄图片效果不佳,特别是在雾天拍摄的图像,由于细节丢失较多和可见度低,影响计算机视觉系统正常工作。因此,对雾天图像进行去雾是有必要的。本文基于卷积神经网络,在图像去雾任务中引入了注意力机制,主要从以下三方面展开研究:1.提出了基于选择性注意力机制的图像去雾方法,首先,本文首次将通道注意力和空间注意力用于图像去雾任务中,并且根据图像去雾任务的特点,改进了空间注意力。此外,本文提出了基于选择性注意力的融合模块,能够更好的融合通道注意力模块和空间注意力模块。为了验证本文算法的泛用性,本文还在图像去雨任务上做了实验,大量实验结果表明本文算法的有效性和泛用性。2.提出了基于非局部网络的图像去雾方法,该方法首次将自注意力运用于图像去雾任务中,本文分别在空间维度和通道维度上使用非局部操作来捕捉对应的全局特征。本文使用分块的思想降低空间维度上非局部操作的计算量,并且通过基于选择性注意力的融合模块对两种非局部模块进行融合,此外,本文改进了上一章网络中的残差连接结构,将浅层信息和深层信息汇聚,从网络的不同层上提取特征进行融合作为网络的输出。实验结果证明了该算法的有效性。3.设计并实现了图像去雾系统,用户可以直接从文件夹中挑选图像作为系统的输入,该系统可以一键去雾,快速得到去雾后的图像。
其他文献
滚珠丝杠副作为现代工业母机——数控机床的核心部件,其状态识别方法的优劣一定程度上影响着数控机床的精度与可靠性。本文以国家重大科技专项为依托,对滚珠丝杠副状态优化识别方法开展理论与试验研究,重点研究振动信号多域特征提取方法及状态识别优化组合,通过试验数据与训练模型进一步验证状态识别策略,从而为实现滚珠丝杠副在线监测与健康预警奠定基础。研究滚珠丝杠副状态识别优化策略的根本在于:首先要明确各类特征状态及
为适应复杂数据环境下的社会发展需求,以提取信息为核心的数据驱动型应用成为新兴产业。与此同时,社会自上而下对于个人隐私保护的意识越来越强,相关法律法规对于用户数据的使用限制也越来越严格,这使得基于大规模数据的深度学习方法必须考虑数据可用性及隐私性的平衡。为解决这一问题,基于分布式数据环境的联合深度学习框架成为了新的研究重点。该框架避免隐私数据的明文搜集以及高复杂度的密文处理过程,允许数据持有者在本地
在石化塔的建造过程中,塔内受限空间施工作业的安全性与环境密切关联,要求对受限空间的氧含量、温湿度实时监测,在参数超出行业规定的范围时及时报警。集环境参数实时采集、无线远程数据传输及远程集中监测及报警功能于一体的石化塔受限空间环境自动监测报警系统是石化行业急需的装备。本文受中石化委托,研制石化塔受限空间环境自动监测报警系统,包括研制集环境参数检测、人员施工塔及施工层定位以及报警功能于一体的手持终端,
随着工控系统的复杂性和维护成本的不断增加以及信息技术的飞速发展,工控设备对性能下降、生产率降低以及安全隐患的容忍度越来越低,及时发现工控设备的故障对于工控系统安全、降低维护成本有着重大的意义。随着工业互联网的发展,接入到网络中的工控设备越来越多,工控设备运行状态的数据采集工作也更为容易,这为基于数据驱动的故障诊断提供了研究基础。论文从安全性、可靠性、准确性、扩展性等角度出发,对工控设备的故障检测方
固体火箭冲压发动机相对于其它传统的动力系统来说具有较好的工作性能,因而被广泛应用于战术导弹上。具备燃气流量调节功能的固体火箭冲压发动机可使导弹在大空域、宽马赫数范围内机动作战,可使导弹在飞行过程中补燃室内的空燃比处于合理的工作范围之内,种种优势使其备受各国国防工作者的重视。本文针对滑阀式固冲发动机流量可调燃气发生器控制系统展开研究,研究内容包含燃气流量调节原理、控制系统设计、系统建模、流量调节系统
脉络膜新生血管(CNV)是老年性黄斑变性(AMD)的重要特征。基于光学相干断层扫描(SD-OCT)图像的自动CNV检测可以极大地帮助CNV临床诊断。随着深度学习的飞速发展,目标检测领域也取得了长足进步。本文针对现有目标检测模型应用到医学图像中的问题,结合SD-OCT图像和CNV病变的特性,开展使用深度学习对CNV进行高效精准检测的研究和应用,具体工作如下:(1)提出了基于特征融合和邻域传播的CNV
图像超分辨率重建是一种根据低分辨率图像预测出细节丰富的高分辨率图像的方法。其可以克服成像设备等硬件的缺陷,通过软件的方法重建退化的图像,在安防监控、医学图像、视频播放等领域有着广阔的应用前景,是图像领域研究的热点。随着计算机硬件的发展和理论的完善,深度学习得到了极大的发展,在图像分类、目标检测、图像生成等领域成果显著。本文将基于深度学习中的卷积神经网络开展对图像超分辨率重建算法的研究,主要工作如下
目标检测的任务是从图像或者视频中定位目标并对目标进行分类,对只占据少量像素的小目标进行检测的任务称为小目标检测。小目标像素少、携带信息少,特征容易淹没在背景中,因此小目标检测一直是目标检测的难点。字符识别的任务是提取图像中存在的字符并组合为字符串输出。在自然场景的字符识别中,由于背景复杂、字体多样且字符分布随意等原因,识别精度较低,难以满足实际需求。在铁路接触网异常自动检测系统中,接触网支柱号是定
单标记学习方法通常用于解决一个对象仅与一个标记相关的问题。目前,对单标记学习的研究已经比较成熟,然而,现实生活中的对象往往具有多种语义,同时使用多个标记描述一个对象可能更符合实际需求,而已有的单标记学习方法可能无法有效地处理这类任务。因此,多标记学习框架被提出来用于处理一个示例同时与多个标记相关的问题。为了提升模型的分类性能,考虑如何提取和利用标记相关性以及通过标记特定特征学习是目前多标记学习中的
进入21世纪以来,随着计算机技术和人工智能的快速发展,人类和机器之间的交流不再局限于文字符号的输入输出。通过语音识别技术,机器能够轻松地“听懂”语音,甚至用语音和人类“交谈”。因此,语音识别技术,尤其是连续语音识别技术的研究成为一大热点。本文通过连续语音自动切分、声学模型和语言模型三个模块构建了连续语音识别系统。主要工作如下:(1)研究了连续语音的自动切分方法。分析了语音信号特征,选取合适的时域、