【摘 要】
:
随着多媒体信息处理技术的蓬勃发展,多媒体信息的处理应用在人们的生活中变得越来越广泛。数字图像作为多媒体信息的一种重要形式,与其相关的研究处理在生活中的很多领域里都占据了重要地位。图像分类属于数字图像处理中的基础研究内容,具有很重要的研究价值,很多相关研究都是在图像分类的基础上展开,比如目标检测、图像分割、目标识别等。卷积神经网络模型作为近年来数字图像处理中研究最多的图像处理方法,相比传统分类方法,
论文部分内容阅读
随着多媒体信息处理技术的蓬勃发展,多媒体信息的处理应用在人们的生活中变得越来越广泛。数字图像作为多媒体信息的一种重要形式,与其相关的研究处理在生活中的很多领域里都占据了重要地位。图像分类属于数字图像处理中的基础研究内容,具有很重要的研究价值,很多相关研究都是在图像分类的基础上展开,比如目标检测、图像分割、目标识别等。卷积神经网络模型作为近年来数字图像处理中研究最多的图像处理方法,相比传统分类方法,其分类精度高,性能较为优秀,在生活中有很多的实际应用,但是也存在很多缺陷和难点需要攻克。本文针对运用较为广泛的AlexNet网络模型和VGG-16网络模型在图像分类上存在的不足进行了改进和深入的研究。本文首先从目标函数优化的角度详细的介绍了卷积神经网络的基本结构,针对卷积神经网络中的基本结构进行了深入的研究分析,对卷积神经网络涉及到的相关计算从目标函数优化的角度给出了详细的推导;然后针对卷积神经网络AlexNet在多标签图像上分类识别准确率低的问题,以AlexNet神经网络为基础网络框架将网络的卷积层设计为三分支结构,运用对特征提取更充分的ELU激活函数,加入批归一化操作加快网络学习速率,改进形成新的分类卷积神经网络。通过梯度下降算法在Caltech-256数据集上迭代优化改进的网络,结合实验结果分析验证网络改进策略的有效性;最后针对VGG-16卷积神经网络对多标签图像分类训练难度大,分类结果相对较差的问题,利用三分支结构改变网络特征提取方式和改变卷积层连接机制改进VGG-16卷积神经网络,在UCM多标签数据集上训练并测试改进之后的卷积神经网络。对比实验验证了改进网络的有效性,改进之后的网络精确率提高了 15%,召回率提高了 17%,F1值提高了 16%。
其他文献
随着公路交通枢纽和物流货运设施建设加快推进,四川省物流业正全方位快速发展,公路货运水平不断提高。四川省公路货运量是衡量四川省运输行业发展的主要指标,是反映四川省经济发展的重要依据,也是政府制定公路运输基础设施规划的重要参考。为了合理规划四川省公路运输基础设施建设,使得公路货物运输供给需求保持平衡,需要对四川省公路货运量进行准确的预测。目前公路货运量的预测方法有很多,但均存在各种问题。首先,原始公路
几十年来,基于布里渊光纤散射的分布式应变和温度传感技术,已经引起了广泛的关注。迄今为止,已经采取了多种方法来获取有关布里渊增益谱(BGS)分布的信息,从中可以得出应变或温度变化的幅度和位置。其中的布里渊光学时域分析(BOTDA)性能甚至达到了亚厘米级的空间分辨率。但是,实用的BOTDA分布式应变和温度传感技术存在测量时间长,温度与应变同时测量互相干扰,现场测试时需要的准备工作繁琐复杂等不足。论文比
木片作为一种常见的生物质燃料,广泛应用于工业生产和日常生活中。木片的水分含量会影响燃烧效率,与安全性和经济性息息相关,因此对木片水分的测量很有必要。电容法因其结构简单,成本低等优点,被广泛应用于各种工业生产中。但是电容法测量木片水分易受到木片种类、环境温度和容积密度等因素的影响。本文采用了一种螺旋式的电容传感器进行木片水分含量的测量。与平行式电容传感器相比,这一结构的传感器灵敏度分布更均匀,可以提
智能电网己成为未来电力系统的发展趋势,由于楼宇负荷在电力系统中占有较大的比重,同时具有较强的可调度能力,所以楼宇能量管理是电力系统需求侧能量管理的主要实施对象之一。本文以智能楼宇群为研究对象,为了使其更好地适应服务于电力系统需求侧能量管理,在以不损害智能楼宇用户舒适度的前提下,楼宇能量管理系统通过对用电负荷进行调度从而削减负荷峰值并降低用户用电成本。本文以智能楼宇群用户的能量优化为核心,研究了智能
当今许多Web服务提供商都将其业务服务发布在云端,这导致了大量的且功能相似的Web服务数量呈井喷式增长,使Web服务发现愈发具有挑战性。在现有的这些服务注册中心中,Web服务通常用Web服务描述语言或简单的自然语言文本描述。如何准确、高效的检索到符合用户需求的Web服务已经成为当前研究的热点问题。对具有相似功能的Web服务进行分类是促进Web服务发现的有效途径。早期的服务分类方法大多是基于传统的机
重型燃气轮机控制系统是燃气轮机的核心组成部分,随着重型燃气轮机技术的发展,控制系统的结构和功能越来越复杂,控制过程中的某一部分发生问题,会造成整个系统控制性能降级,甚至可能导致系统整体故障。此外,控制系统数据传输中存在丢包、时滞等问题,这些问题可能导致网络通道拥塞甚至瘫痪。同时,由于燃气轮机控制系统数据传输网络的开放性,可能遭受网络攻击的威胁,影响燃气轮机系统性能。基于上述考虑,本文展开如下研究:
与常见的面部表情不同,微表情是一种微妙的、不自觉的面部表情。常见的面部表情有时具有欺骗性,微表情却能反映一个人内心的真实情感。微表情由于持续时间短、强度低,很难被正确的理解和解释,所以微表情的准确识别是一个巨大的挑战。微表情识别是一个新兴的研究领域,目前正处于发展的早期阶段。我们提出了一种关注微表情峰值帧附近光流信息的3D-Apexflow微表情识别算法。首先,我们从每个微表情视频序列中获得峰值帧
随着社会信息化的不断发展和国家对生产安全的高度重视,煤矿企业建设了许多数字化系统确保煤矿的安全开采,然而这些系统前期并没有统一规划,都是自成一体,系统之间无法进行信息共享,形成了许多“信息孤岛”。随着第五代通信技术和大数据以及人工智能等现代信息技术的应用和发展,人类社会正在向智能化转型,煤矿开采也在朝着智能化方向发展,智慧矿山的建设是一个重要的标志。煤矿数字化系统在运行过程中产生了海量的数据,传统
舰船检测与识别是实现海上安全的基础与前提,可以为国家提供强有力的保障和支持。由于传统的舰船检测与识别需要大量的人工判读,且难以保证舰船识别的准确性与可靠性,因此,需要引进新的技术与方法,在保证舰船识别高效性的同时,减少人力的消耗。随着大数据时代的到来,深度学习在图像上的发展为舰船检测与识别提供了新的技术。本文主要从图像技术的角度出发,分别设计了基于混沌鲸鱼优化算法的非极大值抑制的舰船检测模型和基于