面向图像内容检索的卷积神经网络

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:SparrowHawk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像分类以及检索一直是图像领域的经典问题,随着移动互联网的快速发展,图片信息量也呈爆炸式增长,对海量图片信息的分类已经成为一个研究热点。传统的图像分类方法针对特定的图像由人工去设计特征,其鲁棒性较差,而且需要丰富的先验知识。卷积神经网络方法则在该领域取得了重大突破,它可以自动从海量图片中学习到属于原始图像的本质特征进行分类,相比传统方法具有更好地识别率和实用性。卷积神经网络模拟人的视觉系统,将特征的提取过程分为从低到高多个层次,以网络深度获得高度抽象特征,它直接将图片作为网络的输入,并且利用局部感受野、权值共享和子采样技术减少网络参数数量,从而避免权值数量过多导致过拟合,也使网络具有一定程度上的平移、旋转和扭曲不变性。目前,卷积神经网络已广泛应用于图像检索,其识别率和实用性均优于传统的分类方法,因此对卷积神经网络在图像内容检索上应用的研究具有十分重要的意义。本文主要从实际应用和网络改进两方面进行研究,论文的主要工作如下:(1)针对CNN网络模型设计的过程中,各参数如何选择的问题,通过调整CNN中卷积核的个数和大小、采样层的搭配方式以及激活函数进行对比实验,发现在增加卷积核个数、减小核尺寸、使用Relu激活函数、第一个采样层使用最大值采样这些情况下,CNN在MNIST和CIFAR-10数据库上的性能更好。(2)针对古玩图片数据集的分类,提出一种图片大小不一情况下数据预处理的方法,解决图片目标在格式统一时发生形变的问题;提出一种目标与背景分离后再输入到CNN的方法,并在古玩数据集进行实验验证该方法所用的CNN相比图片直接输入CNN,其网络结构更简单,识别率更高;通过实验验证CNN在图片包含多目标的情况下仍然具有优秀的分类性能;针对整个古玩数据集各类别样本数量不平衡的情况,提出CNN结合HOG+SVM的方法进行分类,并通过实验证明该方法比直接利用CNN分类的识别率要高。(3)针对CNN中常用的采样方式各有优缺点的情况,提出一种在采样层分别进行最大值采样和均值采样的网络模型(并行采样模型),实验验证该模型相比传统CNN泛化性能更好;另外,提出一种对CNN进行预训练,使网络训练时可以剔除噪声样本的方法,解决在训练样本中有噪声时直接训练网络会无法收敛的问题。
其他文献
<正>我旗"民族地区中小学生中华美德教育实效性实验研究"课题,于2007年8月在中国教育机制研究分会和中华伦理学会中华美德教育研究会总课题组立项,同年9月开题,现在已经完成
会议
问题链是指教师在教学过程中针对学生现有水平和教材内容提出的一系列层层递进,环环紧扣的串联式教学模式。笔者将通过文献法、资料法、实践法从问题链的涵义、分类、功能等
提出了钻柱纵向自由振动的离散力学模型,根据Lagrange方程建立了相应的数学模型和特征值的计算式,并用实际算例进行了计算,计算结果表明,按离散模型确定的固有振动经按连续等直杆
期刊
<正> G蛋白(guanine nucleotide-binding proteins)是由α、β、γ亚单位组成的杂三聚体,除了能够转导多种信息,如光子、激素、神经递质、气味分子、蛋白酶以及离子进入细胞内
在城市自来水管网中,管道的老化、超压运行带来了严重的漏损。依据管网的水力模型,通过压力分布定位漏损点可以实现检漏;将管网中的压力控制在合适的水平是一种减漏的措施。
食品安全预警体系是依据指标分析来进行警情判断和预防控制的,指标体系的设计至关重要。本文建立了四层的预警指标体系框架,设计了食品安全总警度指标和对应的数量安全警情指
应用齐次平衡法获得了2+1维扩散长水波方程的Bcklund变换和一个线性偏微分方程.从线性偏微分方程出发得到了2+1-维扩散长水波方程的多孤子解和单孤子解以及其它精确解,分析
建立了一类设备系统承受冲击损伤的数学模型,定义了系统的冲击损伤函数,给出了系统损伤的数学期望,一般地表达了系统的可靠度公式.
目的:探讨安全管理评价指标在减少手术患者差错事故中的应用。方法:将2012年1月~2015年3月我院手术室收治的患者作为研究对象并随机等分为观察组和对照组,对照组予以常规护理