基于深度学习的水下图像增强算法研究

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:weidaxia888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,海洋科学研究越来越多地依赖自主水下航行器和遥控水下航行器拍摄的水下图像。然而,由于复杂的水下成像环境,自然光在水下会发生吸收及散射效应,导致水下图像出现严重的可视性问题,具体表现为色偏效应、对比度不足、清晰度低。严重的失真不仅影响水下图像的质量,而且限制了水下视觉任务的进展。目前,水下图像处理方法主要包括传统方法和基于深度学习的方法,其中,传统方法由于水下复杂的物理和光学因素,在不同的水下环境中泛化性较差;基于深度学习的方法因为网络结构等原因,在水下图像细节方面的表现不理想。本文围绕水下图像的成像特点,主要采用深度学习的方法来提升图像质量。论文的主要内容及创新点如下:(1)为了更好地恢复水下图像细节,本文提出了基于密集特征融合模块和深度增强模块的生成对抗网络框架,该框架能够端到端地对水下图像进行增强。为了增强生成器的空间信息提取能力,设计了一种具备误差反馈机制的密集特征融合模块,该模块能够利用非相邻网络层特征,避免了在下采样过程中丢失空间信息。同时,所采用的深度增强模块能够结合对应层的特征,逐步细化图像细节,使得网络保留更多细节信息。其次,为了解决生成对抗网络存在的梯度消失和模式崩溃等问题,本文还引入了带有梯度惩罚的WGAN来优化生成器和判别器的训练过程,提高生成样本的多样性。最后,将本文算法与现有算法作对比,本文算法在各项图像评价指标上的得分都是最高的。消融实验也验证了本文提出的密集特征融合模块和深度增强模块在细节特征恢复上的有效性。(2)为了进一步解决水下图像增强算法实时应用的问题,本文提出了一种基于超分辨率的水下图像增强模型,该模型不仅能恢复水下图像的颜色,而且还能以2倍、4倍的尺度提高图像的分辨率,这为实时应用提供方便。模型引入了残差密集块,该结构在提高模型特征保留能力的同时也使得模型的训练变得更加稳定。此外,该模型还引入注意力机制,注意力机制能够帮助网络学习图像的前景区域,重点对图像的前景区域进行增强,从而提高图像的全局对比度。最后该模型采用了多项式损失函数监督其训练,分别对颜色、清晰度以及对比度进行了优化。实验表明,该方法在水下图像增强和超分辨率上的效果好于现有方法。消融实验证明,本文提出的多尺度损失函数对水下增强图像的颜色(UICM)、清晰度(UISM)、对比度(UIcon M)等客观指标有明显提升。最后对水下机器人拍摄的海产品视频进行了目标识别实验,海产品识别率有较大提升,从而验证了基于超分辨率的水下图像增强算法具有良好的应用前景。
其他文献
刚性四足机器人具有较低的灵活性和较高的能耗,刚柔耦合四足机器人腿部设计有柔性系统,在往复运动过程中可以起到蓄能发力、节省能耗和提高运动高度的作用,对于复杂工况具有更好的通过性,被广泛应用于军事、工业探测和民用等诸多领域。现有的基于液压的柔性系统价格昂贵,人们需要一种价格更为便宜的柔性方式。本文的主要研究内容如下:(1)设计了一种基于弹簧机构的刚柔耦合四足机器人。建立D-H参数表,推导出刚柔耦合四足
近年来人工智能的发展越渐火热,计算机视觉领域的研究发展越来越贴近我们的日常生活。随着我国全面进入小康社会,人们对于饮食健康的问题日益重视,如日常生活的饮食监控、营养分析、菜品推荐系统等等。因此,基于计算机视觉的菜品图像识别技术成为了当前研究的热点之一。但是,目前的菜品图像识别的研究应用多放在西餐和日料中。中式菜品由于其种类繁多复杂,不同菜品之间也有可能非常相似,相同菜品也有可能差异过大。因此,对于
近年来,伴随着社会信息化程度的提高,作为计算机视觉代表性任务之一的视频行为识别,因其在智能监控、自动驾驶、媒体分析和机器人等领域具有广泛的应用前景,受到了越来越多研究者的关注。同时在深度学习等技术蓬勃发展的背景下,涌现出大量基于深度神经网络的视频行为识别研究。虽然前人已经完成了大量的研究工作,但是依然存在大量挑战。首先,由于人类行为在视频时序和场景变化上存在的联系,如何充分利用时序上下文信息,对视
CAN总线是现代汽车电子技术中最重要的串行通信总线,因CAN总线的可靠性、实时性、互操作性、灵活性、经济性等特点,被广泛应用于各种汽车电子部件的通信与控制系统中,CAN总线通信是基于优先级仲裁与调度的通信系统,因此,研究基于CAN总线的调度对提高CAN总线的利用率与系统通信性能具有重要的意义。论文主要研究基于FIFO和优先级序列的CAN总线系统,提出一种模型优化的思路,具体研究内容分为以下几个部分
基于优化的元学习是一种旨在从指定的数据/任务中学习一组敏感的模型初始化参数的机器学习算法。该算法的优点在于当遇到一组新数据/一个新任务时,训练好的模型能够仅仅通过若干步梯度优下降化便在新任务上的测试集上获得良好的泛化表现。然而,从泛化性能的角度来看,我们认为传统的基于优化的元学习算法包含两方面缺陷:(1)由于每一个训练任务中包含的训练样本数量过少,算法在学习过程中使用过参数化网络时容易产生过拟合现
情感分类是自然语言处理领域内的基本任务之一,情感分类又分为粗粒度和细粒度情感分类。随着时代的发展,粗粒度情感分类已逐渐无法满足人类的需求,所以细粒度情感分类逐渐成为了研究重点。细粒度情感分类又称为方面级情感分类,旨在判断句子中某个具体方面的情感极性。本文的核心研究内容就是使用基于深度学习的方法进行方面级情感分类。本文的主要创新与工作如下:(1)大多数基于传统的循环神经网络和注意力机制的方面级情感分
轨迹规划与轨迹优化一直是备受存眷的研究热门,轨迹规划是轨迹优化的前提。仅使工业机器人完成指定任务,已不能满足目前需求,需要尽可能缩短运行时间来提高工作效率和减少冲击以延长使用寿命。本文以六自由度工业机器人为研究对象,在关节空间中采用五次非均匀B样条进行插值,对已规划好的轨迹,以改进的自适应遗传模拟退火算法为优化手段,将时间-冲击作为优化目标,通过改变权重获得时间、冲击以及综合最优轨迹。本文主要研究
随着城市化进程的不断加快,城市路网内部结构也更加复杂,路网中发生的紧急事件很大程度地危及到人们的生命财产安全。紧急事件发生时,城市应急中心会派出特殊授权车辆到达事故发生地实施救援工作,车辆到达时间越短,突发事件造成的损失就会越小。虽然特殊授权车辆具有道路优先通行权,但是实际行驶过程中也会受到车辆拥堵的影响,难以实现优先通行造成极大的延误。因此,在减少对普通车辆产生影响的前提下,本文围绕如何使特殊授
随着成像技术的普及与发展,数字图像逐渐成为了一种重要的信息传递媒介。但是,在实际的应用场景中,由于成像条件及外界干扰等因素的影响,存在着分辨率低、数据缺失等质量退化问题,图像恢复旨在研究如何从退化图像恢复出来理想图像,从而达到改善图像质量的目的。深度卷积神经网络通过卷积运算的层级化处理能够有效获取图像的层级特征表示,为图像恢复带来了新的建模方法,带来了图像恢复算法性能的有效提升,使其研究进展有了实
随着城市化进程的不断推进,我国公共建筑能耗随着面积的增加而大幅上涨。在这种背景下,目前市面上常见的公共建筑用电监控系统,大多采用智能电表配合总线的方式进行现场数据采集,存在布线工程量大、维护不便等问题。同时,一些现有建筑用电监控系统对异常用电的行为不能进行有效的管控,无法及时排除安全隐患,并且容易造成电能的浪费,制定相关政策以及进一步推进公共建筑节能工作较为困难。本文在研究现有建筑用电监控系统的基