基于深度神经网络的场景分类方法研究

来源 :南昌航空大学 | 被引量 : 0次 | 上传用户:wq999999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
场景分类,或场景识别,是场景理解领域一个重要的研究方向,其依据就是按照人类视觉的组织原理,将不同的场景图像按照其语义信息划为不同的类别。在场景分类领域,一直都是采取人工提取图像特征的方式,这种方式提取特征单一,不能很好描述各类场景,导致场景分类精度较低低。深度学习理论是建立在人工智能的基础之上,能够有效的描述图像的语义信息,准确地判断场景与场景和目标与目标之间的差异性和相似性。基于此种原因,本文采用深度神经网络的方法去自适应提取图像特征。分别采用自编码神经网络、人工神经网络以及卷积神经网络等模型来构造场景分类的方法,并在原来框架的基础之上进行改进。本文构造了一种新的基于自编码网络的分类方法用来识别室内场景。传统的人工神经网络在一些简单的识别领域中,如车牌识别和手写字符识别,取得了较好的识别效果,但是应用到场景识别中,识别效果不是很理想。针对这种情况,采用一种基于自编码神经网络由粗到精的分类方法,粗分类主要采用自编码神经网络进行预训练,人工神经网络粗识别;细分类则采用支持向量机进行分类,HOG特征作为图像描述子,并在MIT-67室内场景数据集上进行验证。本文构造了一种新的卷积神经网络框架。传统卷积神经网络网络结构规模较小,采用单标签值的方式进行监督训练,这种单标签的机制只适合表示简单的图像类别,不足以表示复杂场景的类别。针对这种问题,本文在传统卷积神经网络框架的基础上进行改进,卷积层和采样层分别采用Re Lu激活函数和Maxpooling采样,设有四个卷积层和四个采样层,一个全连接层,一个分类层,并采用一种多标签值的标签进行训练。整个训练和识别过程采用一个统一的框架,并在Scene-15场景集上进行验证。本文利用MATLAB2014B+Deep Learning master来完成实验设计,在自编码神经网络和人工神经网络的训练中,使用了L-BFGS算法库来调整权值。本文提出的两种方法分别用于室内场景和自然场景的分类与识别。由粗到精的分类方法更符合人类认识事物的规律,并且采用自编码神经网络预训练;卷积神经网络处理图像的方式和生物视觉相类似,采用扩展的网络结构和多标签值机制来改造网络。最后,本文的两种方法的测试结果与其他文献进行了比较,结果证明本文的方法具有一定效果。
其他文献
关联规则是数据挖掘领域中的一个非常重要的研究课题,广泛应用于各个领域,既可以检验行业内长期形成的知识模式,也能够发现隐藏的规律。有效地发现、理解、运用关联规则是完
我国煤矿环境复杂,开采条件多变,加上工作空间狭小,照明条件差,各种隐患存在于生产过程的各个环节和井下各个场所,但在复杂的井下环境中存在着大量难以布置有线监控系统的地
随着互联网内容的爆炸式增长,如何从海量信息中选取自己所需要的成为每个用户经常遇到的困扰,因此个性化服务的需求越来越迫切。由于用户兴趣和行为的差异,如何为不同用户提供个
随着数据库管理系统复杂性的增加和DBA费用的上升,迫切需要具有自主计算能力的数据库系统,实现降低系统维护费用和使得系统依据不同类型的负载请求自动进行配置管理的目标。
改革开放三十余年来,我国经济和社会都取得了举世瞩目的发展和进步。地方政府认识到投资已经成为社会和经济建设的一个重要部分。招商引资的绩效和政策措施与当前宏观经济形
目前,校务办公自动化建设已逐渐成为各中高院校实施电子信息管理、提升管理水平的重要手段。校务管理系统是校务办公自动化建设中的重点项目,是校务办公自动化的具体实现,是学校
随着高通量蛋白质组学、微阵列技术和生物信息学技术的发展,一个新的学科“系统生物学”应运而生,它的目标是从系统的层次上理解生物系统。生物实验数据分析和生化网络的建模与
多传感器图像集体配准将来自多个成像设备图像进行同时配准。它是图像融合、图像超分辨率重构、人脸识别,目标跟踪和图像拼接等许多图像处理问题的重要步骤。多传感器图像集体
随着企业的不断发展,应用系统不断增多,企业中可能存在着大量的异构系统,这些系统有的使用不同的编程语言,有的运行在不同的平台上。因此,对这些异构的遗留系统进行整合是企
目前,城市交通环境日益恶化,能够适应复杂城市道路网络的路径规划愈显重要,而最短路径问题是路径规划的核心。本文首先对城市道路交通中的复杂道路情况和各种影响因素进行了