基于深度学习的场景识别研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:ivan888111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
场景识别是计算机视觉领域一个极富挑战性的课题,是图像检索、目标识别和图像语义理解等计算机视觉任务的研究基础。网络技术的快速发展和新型智能设备的普及使得场景图像的数量和类别不断增多,场景图像的类内差异性和类间相似性对场景识别精确性的影响也越来越明显,单一特征难以表示出丰富的图像信息,获得令人满意的识别精度。目前亟需为场景图像构建有效的表示,使图像特征更具有判别性。针对上述问题,本文利用深度学习方法对场景识别进行深入研究,主要工作如下:(1)为了更好地表示场景图像中值得关注的有效信息,获得更具有判别性的特征,本文将注意力机制引入场景识别任务中,提出一种用于场景识别的多尺度注意力网络模型,通过多个尺度分支构建兼顾通道与空间的场景图像注意力表示。在模型中使用改进的通道注意力结构,增强值得关注的重点对象信息;针对空间注意力计算过程中的信息丢失问题,提出了基于不同尺度的空间注意力结构,增强值得关注的重点区域位置信息,然后利用多尺度间特征互补得到场景图像的最终表示;并且引入中心损失函数联合监督策略,进一步减少类内差异误判,有效提升特征的判别性。(2)为了进一步克服类间相似性的影响,提出一种基于多级别上下文信息的网络模型,通过上下文特征描述对象间相互位置关系,有效的区分类间对象相似性较高的类别。首先,将场景分割网络迁移到场景识别任务中,初步建模图像的上下文关系。其次,针对对象间相互关系的多向性,提出多方向LSTM模块,从四个方向提取上下文信息特征,并连接到多个中间卷积层,形成多级别特征处理,使提取到的上下文特征既有来自底层的空间布局信息,又有来自高层的抽象语义信息。最后,融合多级别的上下文特征较全面的获得了图像上下文信息。(3)为了丰富场景图像的特征表示,研究及对比分析了多种融合策略,最终将注意力特征和上下文信息融合成场景图像的综合表示,充分发挥特征的互补性,使最终的特征表示既能够关注有效的判别性信息,又能够表征显著对象间的相对位置关系,有效解决了场景识别任务中特征表示不充分的问题,提升了场景识别准确率。最后将本文提出的网络模型和方法分别在Scene15、MIT indoor67和拥有大量复杂场景的SUN397数据集上进行实验,验证了本文算法的有效性,总体精度分别达到95.83%、85.69%和72.65%,实验结果表明,融合注意力和上下文信息的识别方法有效提高了场景识别精度,与其他场景识别算法进行对比也有一定优势。
其他文献
硫酸盐废水属于工业废水中的一种,主要来源于使用到硫酸盐物质的工业生产过程,如果不能将其进行妥善处理,一旦排入环境,将会对生态环境以及人类健康产生巨大危害。因此,选择合适的方法处理硫酸盐废水显得至关重要。在处理硫酸盐型工业废水方面,传统的零排放处理方法存在着能耗大,经济效益差的问题,为了改善这一情况,本文借助复分解电渗析(electrodialysis metathesis,EDM)能够在浓缩盐溶液
带有间隙约束的序列模式挖掘是重复序列模式问题的扩展,其具有灵活的表达性和良好的针对性,已成为数据挖掘方向中的热点课题。作为间隙约束序列模式挖掘的一种,无重叠条件下序列模式挖掘与同类方法相比,该方法更易于发现有价值的频繁序列模式。当前研究是一种挖掘频繁模式完全集的方法,会挖掘出大量较短模式,这不仅降低了挖掘效率,而且增加了用户获取需求信息的难度。最大序列模式挖掘是指挖掘其超模式为非频繁模式的频繁模式
在石化储罐维护领域,机器人壁面维护正以高效率、高安全性和低成本等优势逐步取代低效率、高危险性、高成本的人工壁面维护,但是储罐表面的诸多附件对机器人壁面维护的灵活性和安全性造成较大影响。在机器人维护作业过程中,机器人如果能够实现对复杂壁面场景的理解,就可以自主地针对具体目标采取不同作业方式,进而灵活地完成多种维护任务。传统的场景理解技术无法对复杂场景内的物体进行有效的语义识别,而人工智能技术的出现为
随着区块链技术和共享经济火遍全球,二者相结合产生的区块链P2P短租平台也逐渐成为近年来一种新兴的共享经济发展方式,区块链P2P短租平台是基于区块链技术提供去中心化旅行服务的一类平台。与当前主流的P2P短租平台相比,区块链P2P短租平台具有信息真实不可篡改、信息可追溯、低服务费、高度信任化等优势,为用户提供相互监督和真实可靠的信任环境,重构了信任机制,有助于解决数据欺诈、评价造假、数据丢失、维权困难
随着新能源产业的不断发展,设计探究兼具高机械性能、安全性能和电化学性能的电解质体系成为世界能源的发展趋势和关注热点。采用传统液态电解质锂离子电池在使用过程中容易引发电解液泄露,造成安全隐患。特别是以金属锂为负极的高比能量锂金属电池还存在严重的锂枝晶问题。聚偏氟乙烯(PVDF)作为一种具有不易燃和稳定电位特点的聚合物材料,可以有效提高锂离子电池的安全性能和循环稳定性,具有很好的应用前景。本研究在PV
花椒是我国特有的、资源丰富的调味品与中药原料,具有广泛的应用价值。由于花椒产地、气候、储藏等因素影响,花椒品质具有明显差异。而目前应用于花椒的检测多集中于红外光谱、气相色谱、质谱等检测方法,由于器材精密贵重,操作繁琐,无法达到高效快速的检测效果。所以,开发一款快速检测花椒品质的检测方法具有重要理论意义和实际应用价值。电子鼻作为一种新兴的检测手段,可以根据花椒散发的气味对花椒品质进行快速的鉴别。本文
利用格子Boltzmann方法对二维实体方柱、多孔方柱和覆盖多孔介质薄层的方柱绕流问题分别进行了比较深入的研究,并且多数工作是在表征体元(REV)尺度下进行的。主要工作如下:1.对二维实体单方柱和并列双方柱绕流分别进行了理论分析和数值模拟。绘制了单方柱绕流在不同雷诺数和阻塞比下流场的系列流线图和涡量图,找到了定常流失稳的临界雷诺数和开始出现明显卡门涡街的雷诺数。研究发现随着阻塞比的增大柱体后面的卡
口腔癌是指发生在人口腔内包括在牙龈、舌头、口咽部和牙槽黏膜等多个部位的恶性肿瘤的总称。在所有的口腔癌病例当中,有很大一部分是鳞状上皮细胞癌,活组织病理检查是确诊口腔癌的重要手段。现有的口腔鳞癌的临床诊断方式多是医生通过观察数字口腔病理切片图像来进行判断。研究口腔鳞癌的自动诊断方法,有助于口腔计算机辅助诊断系统的开发,能够减轻医生工作强度,具有重要的临床应用价值。随着GPU等硬件计算设备的计算能力的
人类健康的红细胞具有较强的变形能力,然而在储存过程中,红细胞结构成分的损伤逐渐累积,导致其形态发生改变,失去光滑的双凹面形态并形成针状体,使得红细胞变形能力降低和机械性能退化。因此,对双凹形红细胞和棘细胞I力学性能进行研究并揭示其变形机理是生物力学领域重点关注的课题之一。论文以人类正常的双凹形红细胞以及储存过程中初步出现棘形的红细胞(棘细胞I)为研究对象,采用多种超弹性材料本构模型进行建模,基于神
钠离子混合电容器(Sodium ion hybrid capacitors,SICs)具有高能量/功率密度特点,加之丰富且分布广泛的钠储量,钠离子混合电容器受到科研工作者的广泛关注,有希望成为一种新型的可应用储能器件。钛酸钠作为新型的负极材料,嵌钠电位相对低,多次脱嵌钠反应后体积变化小,且钛酸钠制备方法简单,成本低廉,是有潜力的钠离子混合超级电容器负极材料之一。但是钛酸钠固有的电导率低,影响其倍率