基于水下成像模型的深度神经网络图像增强与目标检测

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:wri666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
水下成像技术在许多领域有着重要的应用,例如水下资源勘探,水下工程建设,水下考古等。然而由于光线在水下传播时会被吸收和散射,导致获取的水下光学图像出现蓝绿色色偏和低对比度等问题。这不仅影响了图像质量,增大了人眼获取和理解图像内容的难度,还影响了计算机视觉系统检测识别的性能。因此,如何有效地矫正水下图像的色偏,提升对比度,以及提升水下图像目标检测识别任务的精度具有重要的研究价值。论文具体研究内容如下:(1)针对水下图像数据不足的问题,提出了一种基于成像模型的水下图像合成算法。首先,将大气散射模型引入到水下成像问题中,并将大气成像中表示光照的常数分解为光照强度和光照颜色以准确地描述水下非均匀光照条件下的成像过程,进而提出水下成像模型。接着,基于最大反射先验理论推导了模型中的光照颜色与强度这两个变量的估计方法。然后,利用单目深度估计方法估计自然图像的场景深度,并用导向滤波平滑深度图。最后,利用上述信息将自然图像合成为水下图像。(2)针对经典卷积神经网络模型无法直接处理水下图像增强的问题,提出了一种基于编解码结构的图像增强网络模型Res Unet。具体来说,先是使用改进的Res Net34作为编码网络的主体,接着设计了桥接模块进一步增大感受野,最后使用多组卷积+上采样作为解码模块。然后,设计了像素层面的均方误差损失函数和语义层面的感知损失函数混合的损失函数监督网络训练。最后,在真实水下图像增强数据集和合成的水下图像数据集上进行了详细的实验,和其它9种典型图像增强算法在主观、客观两个方面进行评估对比。实验结果表明本文算法具有较强的优势。(3)针对成像差异导致清晰图像预训练的检测模型无法直接泛化到水下场景的问题,提出了一种基于退化特征增强的水下目标检测算法。首先,通过实验验证了水下图像增强对于水下目标检测任务具有促进作用,但是作用小且鲁棒性差。接着,通过分析对比浅层模型提取的图像特征总结出原因在于水下降质成像改变了原图像像素的结构和统计特性,模型提取的图像特征发生退化,而图像增强并不能很好的恢复退化特征。然后,设计了一个轻量的特征增强模块FDMUnet。进一步,使用清晰图像和对应的合成水下图像配对训练FDM-Unet的特征增强能力。将训练好的FDM-Unet插入到预训练的检测器中直接进行水下图像目标检测,而不需要对网络进行重新训练或微调。最后,在真实图像和合成图像上验证FDM-Unet的作用。实验结果表明,FDM-Unet以增加极小的参数量和计算量为代价,不仅能直接提升预训练检测器在合成水下图像的检测精度,也能在提升其在真实水下图像上微调后的检测精度。
其他文献
在实际工程应用中,考虑到产品使用便捷与外形美观等原因,工业产品会尽量减少非必要零部件。相对而言,在信息监测与反馈环节会较为薄弱,只会留下部分必要传感器。因此,对于这类工业产品,仅依靠自身携带的传感器很难得到精确且充足的采样数据,往往只能得到稀疏甚至非均匀的采样数据。若想要对设备进一步开发,首要问题是需要一个较为准确的数学模型,为研究提供基础。考虑到这一较为广泛的工程现象,对于此类仅能得到非均匀稀疏
调节阀作为工业控制中的执行器,是过程控制的关键环节,并且其调控性能高度依赖阀门定位器的硬件特性和控制算法。近年来,压电式智能定位器因其低碳和智能特性逐渐取代喷嘴挡板式定位器,成为一种更加有应用前景的阀门定位器。但国内在该技术领域起步较晚,和进口产品相比仍存在较大差距,尤其是在系统性能分析及控制算法方面仍有改进余地。本文在参考国内外相关文献资料和团队前期工作基础之上,开展如下研究工作:(1)对气动执
近年来,新发展理念推动工业生产制造向高质量发展行进,中国的制造业从粗犷式的增长形式逐步开始转型。永磁伺服系统凭借精度好,运行可靠,结构简单等优点,成为工业控制中的中流砥柱。针对水晶制造业,在切割打磨水晶时需要响应快速且稳定的永磁伺服系统,电流控制作为系统最内环的控制,其电流采样精度及响应时间与整个永磁伺服系统的性能直接挂钩。本文先简要介绍了永磁同步电机的基本结构,并依据坐标变换原理在不同坐标系下建
随着无线通信技术的不断进步,每一代无线通信系统都发生着跨越式的发展。在5G通信系统中,提出了一系列的技术以提升无线网络容量以及通信服务质量。为了提升单位面积频谱效率,下一代无线通信系统将在部分热点区域采用密集部署接入点(AP:Access Point)的方式来形成超密集无线网络(UDN:Ultra-Dense Networks)。通过密集部署的AP,实现了AP围绕用户、以用户为中心。一方面减小了用
近年来,为切实治理水环境安全问题和促进水环境质量的不断改善,全国各流域生态环境监测站点扎实开展水质加密监测,从而保障环保部门及时掌握水质动态情况以及进行水质预警决策分析,因此如何准确地对流域水质数据进行监测和预警已成为当下研究热点之一。然而由于大多数水质传感器通常会受日常维护、录入数据库错误和传感器测量误差等因素影响,因此采集的水质数据会出现两种类型的数据错误:噪声数据和缺失数据,而现有的数据清洗
近年来,以冷、热、电多能流型区域综合能源系统为代表的多能联供技术高速发展,对多种能源的优化调度成为研究热点。本论文利用(火用)效率作为评估指标,基于(火用)流建立冷、热、电多能流系统模型,求解系统最节能-经济的优化调度策略。具体研究内容如下:(1)建立了包含冷、热、电的园区级多能流系统模型。本系统的能源输入包括天然气供热发电和分布式可再生能源风力发电系统,负载为冷、热、电负载。在多能流系统中引入先
情感识别在人机交互等领域应用前景广阔,使机器有效的理解情感可以极大改善人机交互的体验。情感可以通过多种方式表达,而语音是传达情感最为便捷的途径之一。因此如何从语音信号中正确识别说话人情感,在情感识别领域受到了研究者广泛关注。基于此本文开展语音情感识别技术及其应用研究。本文基于深度学习模型,提出了两种语音情感识别方法,分别是基于注意力机制的非线性特征融合方法和基于多通道二维卷积循环神经网络的方法。基
视频数据的爆发式增长给视频信号的存储和传输带来了巨大挑战。新一代高效视频编码(High Efficiency Video Coding,HEVC)标准应运而生,HEVC采用多项高效编码技术,提供了卓越的压缩性能,在保持相同视频编码质量的情况下,压缩效率相比前一代视频编码标准H.264/AVC提升一倍。基于信号处理的视频编码技术正逐渐接近压缩上限,编码性能的提高是以算法复杂度的指数级增加为代价来实现
静立平衡能力等级判断是治疗功能性平衡障碍患者的首要任务,为制定合理的康复治疗提供了基本依据。本文从内源性角度展开了对人体静立平衡能力评估的定量分析研究。对于现有医学康复领域平衡判断方法进行了讨论,认为现有方法完全关注于人体平衡的外在表现,评价结果中不可避免的带有一定的主观性和片面性因素,因此导致当前人体平衡评估误诊率高、临床适用患者面窄等情况。本文从中枢神经系统入手,探究了大脑对于静立平衡的响应机
随着人民生产生活水平的不断提高,空气调节设备的使用越来越广泛,它在带来舒适环境的同时,其能源消耗在建筑能耗的比重越来越大,已占40%~50%。其运行节能问题日益受到重视,各种节能方法和技术也正被深入研究和推广应用。本文旨在研究部分负荷条件下,基于节能为目标的冷水机组并联运行的操作优化算法,主要研究内容如下:(1)能耗模型及优化算法选择。论文首先阐述优化问题的求解目标及求解步骤,并对冷水机组工作原理