面向任务的深度学习图像压缩编码技术

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:cdna3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像压缩是数据压缩技术在数字图像处理上的应用,目的是减少图像数据中的冗余信息,从而用更加高效的格式存储和传输数据。近年来,随着深度学习的迅猛发展,基于深度学习图像压缩方法取得了较大突破,在图像重建质量上已经超越传统方法。与此同时,深度学习在分类、分割、检测等图像理解任务上的出色表现,使其被广泛应用在无人驾驶、安防监控、社交媒体等场景。在此类场景下,经过压缩编码的图像,已不再局限于提供给人类观看,很多情况下是通过计算机视觉方法自动执行图像理解任务。这需要在图像压缩编码框架优化过程中,考虑如何在满足观看需求的同时,提升解码图像在理解任务上的性能表现。本文针对上述需求,提出面向任务的深度学习图像压缩编码框架。论文的主要创新如下:(1)设计改进深度学习图像压缩编码框架的网络结构和训练方法。使用残差密集卷积模块为基本特征提取模块,通过设计紧凑表示网络和多尺度重建网络,改进网络优化方法,实现兼容传统编码器且支持端对端训练的深度学习图像压缩框架。提出基于特征全变分约束的深度学习压缩性能优化方法,以抑制紧凑表示网络输出特征中的噪声,从而达到提高率失真性能的目的,实验结果表明,该方法图像压缩性能超越相应的传统编码方法。(2)提出基于深层特征损失的面向任务压缩方法,通过使用预训练的理解任务网络对原始输入和解码图片提取深层特征,并将深层特征的差异作为面向语义理解的损失项,利用网络训练减小重建图像与原图语义信息之间的差异。相比于仅以信号保真为目的压缩解码图片,面向任务压缩方法的解码重建图片能够在常见图像理解任务网络上获得更高的性能评价指标。(3)提出基于空间注意力的面向任务压缩优化方法,通过为紧凑表示网络增加空间权重图分支,使之能够学习原始图像在预训练分类网络的多类激活图,得到图像语义信息的空间权重,并在训练过程中用该权重图对特征全变分约束加权,从而实现更精细的噪声抑制和语义信息保留。实验表明,通过该方法进行面向任务压缩时,能获得更好的压缩率与任务性能。
其他文献
成年人是整个社会力量的核心,这类人群在社会中扮演的角色和地位是最重要的,起到了一个承上启下的作用。在整个家庭当中,这类人群往往是上有老下有小,既要照看老人又要抚育儿
近年来,信息时代下云技术的发展日新月异,云技术在社会各行业应用广泛、前景广阔,该相关领域的科技英语文本也大量涌现,其翻译重要性日益凸显。科技英语具有其独特语言特点,根据文本特点选择适用的翻译策略,有助于译者作出适切的语言选择,促进翻译实践更为有效地开展,从而使该领域的翻译实践原则愈加系统科学。本次翻译实践报告选取笔者参与翻译的《云迁移方法概述:从本机到云端》中一至五章的内容作为翻译文本。在维索尔伦
乡村传统文化植根于乡村的历史,对乡村现在和未来发挥着不可替代的影响。乡村优秀传统文化是中华文化绵延不绝的文化基因,在乡村振兴战略和中国特色社会主义现代化建设的伟大
村民自治起源于二十世纪八十年代,通过农民自发创造和国家制度供给双重作用而形成,在三十多年的实践历程中,村民自治在基层社会治理中发挥出显著作用。然而,随着市场经济的深
现代化战争中,探测目标的信息一直是雷达最基本且重要的任务。其中,对目标角度的测量以及对于动目标的检测尤为重要,这也是当今世界各军事强国争相角逐的热点。军事科技的快速发展,对雷达测角精度提出了越来越高的要求。干扰与抗干扰技术的相互博弈,也使得复杂杂波背景下雷达对于运动目标的检测变得越来越艰难。传统的测角以及运动目标检测技术已经远远不能满足如今的高精度测角和检测需求。因此,提高雷达的测角精度,探索新的
设计三维场景是一项富有创造力的任务,它需要具备专业知识的人利用复杂的3D设计软件去完成创作,对于普通的人群则很难使用三维场景。文景转换研究的目的是让用户使用熟悉的自然语言去完成场景的创作,而不需要人们花费大量的时间去学习3D设计知识和复杂的创作过程。本文在已有的研究基础上提出交互式场景生成的研究,旨在让用户能够使用自然语言设计三维场景。交互式场景是文景转换中场景可视化表达的主要研究内容之一,主要研
随着物联网时代的到来,传感器作为数据采集和传输的关键器件,必将在未来得到快速的发展和应用。其中,磁传感器在日常生活和工业等领域应用广泛,是传感器中重要的组成部分。目
随着合成孔径雷达(Synthetic Aperture Radar,SAR)的发展,SAR成像技术的提高,得到的SAR图像具有更丰富的信息,在民事以及军用领域应用越来越广泛,因此对SAR图像的解译工作也
自上个世纪90年代以来,新媒体在世界上引起了越来越大的影响,特别是以博客、微博、微信群及公众号、QQ群、BBS论坛、播客、网络百科等为代表的自媒体方兴未艾,公民的自我表达
随着乡村振兴战略的提出,我国正在加快推进农业现代化的进程,并明确提出让农业成为有奔头的产业,让农民成为有吸引力的职业。在此背景下,国家积极探索并不断推进农民职业化,