基于卷积神经网络和哈希技术的图像检索方法研究

来源 :沈阳工业大学 | 被引量 : 2次 | 上传用户:ennnd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机信息技术的高速发展和多媒体处理设备的应用和普及,数字图像的数据量呈现指数级快速增长的趋势。面对与日俱增的数字图像资源,如何从中准确高效地查找到系统管理者所需要的图像资料成为一个急需解决的技术难题。首先应用的是基于文本的图像检索方法,随后基于内容的图像检索方法通过利用颜色、纹理、空间形状等特性,有效解决了人工语义标签工作量大和表达不规范的缺陷。然而,由于这种方法所提取的图像特征维度高并且未能充分表达深层语义特征,导致在图像数据量增多的情况下,存储消耗攀升,检索速度和准确率急速下降。针对未能准确表示图像深层语义特征和解决特征数据高维度的问题,本文提出一种基于卷积神经网络和哈希技术的图像检索方法。该方法首先结合卷积神经网络模型强大的深度学习能力进行图像特征提取,获取相似图像视觉特征之间的内在隐含联系,得到数字图像的深层语义特征数据;接着通过预训练的堆叠自编码器对特征向量进行降维处理,利用特征数据的稀疏性和Frobenius范数对堆叠自编码器进行约束规范,通过增添正则惩罚项强化算法的鲁棒性;然后运用迭代量化的哈希学习方法调整旋转矩阵,使得映射量化误差最小化,从而得到图像特征映射的二进制哈希编码;最后使用汉明距离计算图像间的相似性,为避免相同汉明距离带来的不利影响,通过加权优化的方法调整排列顺序,得到最终的检索结果集。实验结果表明,在Cifar-10和Caltech-256公共图像检索数据集上进行测验,该方法能够结合深层网络模型的学习优势,提取到简短高效的深层图像语义特征,减轻特征向量高维性带来的影响,有效提高图像检索系统的准确度和检索速度。
其他文献
目前绝大多数同步电机励磁系统的能量传输是采用金属导线连接的方式,该连接方式使该系统存在诸多缺陷,比如裸露的导线易造成安全问题,以及不能满足电动汽车、医疗等一些领域
自然灾害是全球性范围内面临的重大问题之一,对于沿海地区来说,台风灾害更是发生频率最高,影响最严重的自然灾害,同时,沿海地区是人口积聚、国民经济和社会发展的重要区域和
人脸表情是人与人之间交流信息的重要方式之一,对人脸表情进行识别可以更加全面的了解人的内心世界。因此,人脸表情识别成为了当前人脸识别领域的研究热点之一,受到国内外科
学位
我国不少学校的普通教室和阶梯教室存在着语言清晰度方面问题,而在规划初期经常忽略听闻环境对建筑的重要性。有高清晰度的听闻环境的可以确保学生从教师授课中获得更多有用
十八大之后,国家明确提出了“家庭农场”这个概念,自此,家庭农场的发展就受到社会各界的广泛关注,并逐渐发展成为社会主义新时期农业发展的重要环节,并体现了新农业发展的蓬勃动力和新型方向。这一经营主体作为新型农业经营的实体经济形式,随着经营规模和经营项目的多元化,为农民、农村、农业带来了新的发展机遇,但同时,由于存在着经营规模仍然较小、经营者缺乏有效抵押担保物带来的融资困难、靠天吃饭以及政策支持、资金投
众所周知,绿色经济已成为全球各国经济社会发展的新潮流。但与此同时,绿色技能人才的短缺却成为掣肘其快速发展中不可忽视的关键因素。为此,加快推进绿色职业教育的发展就显得尤为重要,其是实现可持续发展目标及促进绿色经济和社会发展的关键,是绿色技能人才最强有力的供应商。绿色职业教育的认知与发展的现状将对各国在新一轮绿色经济浪潮中占据优势位置发挥着不容小觑的作用。近年来,绿色职业教育在以联合国教科文组织职业技
受众个性化的穿着需求,为以服饰为主要内容的电视栏目的发展提供了新的机遇,成为了碎片化时间的最佳选择。丰富此类节目的内容,拓展文化内核也是其发展的重要目标之一。本文
欺骗作为一种复杂的社会行为,出现于幼儿时期,影响着幼儿社会性的发展。以往研究欺骗往往从行为层面或心理层面去考察,较少同时考察两个层面。研究发现欺骗与幼儿的自我控制以及父母教养方式有关,但是对父母教养方式和欺骗内在作用机制研究甚少。而且以往研究大多集中在大学生群体,缺乏对其他群体(如幼儿)的考察。因此,本研究立足于幼儿阶段,考察幼儿欺骗的发展特点以及与父母教养方式的内在作用机制。本研究从湖北省H市三
图像中的文本信息能为人们和计算机解读图像场景提供重要的帮助,对自然场景下的图像进行文本识别是当前最热门的研究领域之一。自然场景下的文本识别一般要经过检测图像中的