基于GAN和特征融合的深度感知图像相似性计算方法研究

来源 :鲁东大学 | 被引量 : 0次 | 上传用户:lengkuhui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
比较不同样本数据之间的差异是许多应用和研究工作的基础。本文对基于卷积神经网络模型和深度感知图像相似性计算进行了研究:首先针对传统欧式距离度量不准确、效果差的问题,提出基于卷积网络的深度感知度量方法;其次针对传统方法和网络提取特征单一、缺乏语义信息的问题,提出结合微调VGG的特征融合模型;最后,针对感知度量和特征融合模型计算量大、参数多的问题,提出Atrous-MobileNet模型,并且分别应用到图像生成、图像检索以及图像识别任务进行验证。本文的创新点主要有以下三个方面:(1)提出了一种基于GAN和深度感知度量的图像潜在特征学习方法。首先,利用VGG网络提取出的特征图作为训练损失,使得网络提取的特征在语义上更加相似。其次,利用最大均值差异度量,将图像映射到再生希尔伯特空间以度量图像差异。通过比较分析不同条件的实验结果,证明本文提出的模型具有提高潜在特征学习和特征相似度量性能,此外,还探讨了在训练数据集上像素损失和深度感知度量对图像生成的影响。(2)提出了基于多特征融合和模型微调的图像检索方法。针对传统图像特征提取方法所提取特征单一、语义信息薄弱的问题,本文首先通过固定VGG网络模型浅层特征(前三层),并加载预训练模型微调网络提取浅层特征;然后,添加多级特征金字塔结构的特征融合思想,实现多通道多尺度卷积特征融合以底层细节与深层语义特征融合。实验结果表明,与之前的模型相比,利用本文提出的方法在图像检索任务上性能更出色、准确率更高。此外,本文在检索过程中结合使用PCA与哈希映射方法,进一步提高图像检索任务的性能。(3)提出一种基于Atrous-MobileNet和人脸关键点的人脸眼镜检测与识别算法。首先,针对感知度量和特征融合在识别任务中计算量大、参数多的问题,提出Atrous-MobileNet模型用于眼镜的分类识别;其次,为了处理图像的尺度以及旋转问题,对图像进行区域归一化,根据人脸眼睛位置检测眼镜区域。通过大量实验表明,本文提出的眼镜识别模型在眼镜三分类(有、无、墨镜)以及眼镜七分类任务中取得较好的结果,在鲁棒性以及识别精度上都有提升,并且模型计算量和参数都有所降低。
其他文献
目的探讨咪唑斯汀治疗慢性荨麻疹前后血清一氧化氮(Nitricoxide,NO)、肿瘤坏死因子(Tumornecrosis factor-α TNF-α)水平的变化及其与病情的关系。方法对慢性荨麻疹治疗前后血清N
网球以其深厚的文化底蕴和独特的运动魅力已成为人们健身娱乐、休闲消遣的主要体育项目,特别受到追逐时尚文化的当代众多大学生的青睐。近年来,随着我国经济社会的不断发展,
<正> 新疆是我国面积最大的一个行政省区,是我们伟大祖国四化建设尚待开发而很有发展前景的好地方。为了配合国家开发新疆,建设新疆,中国科学院曾两次组织多种学科的科学工作
介绍了RCS动态测量的必要条件,提出在RCS试飞中所遇到的测量雷达引导问题。通过对雷达伺服系统传递函数的分析,给出了雷达引导控制问题的解决办法。
李永康教授是云南中医学院第一附属医院骨伤科教授,主任医师,云南省著名中西医结合骨伤科专家,云南省名中医,国家级名老中医学术经验继承工作指导老师。导师出生于中医世家,师从于
该文提出了农用地分等的土地利用系数"两步法"计算方法,该方法既能反映区域的土地利用实际水平和土地利用能力水平,又能反映土地利用中的经济关系。土地利用现实系数等于土地
隐私权并不是一个新出现的权利。在十九世纪末,摄影、录音等新技术的兴起催生了作为法律权利的隐私权。而到了信息社会,尤其是web2.0时代,信息技术又发生了深刻的变革,需要我
移动通信终端是整个移动通信中非常重要的一环,’其发展和繁荣,不仅直接促进移动运营商的业务发展和收入增长,同时也带来最终用户体验的不断提升,所以吸引了众多公司参与移动
目的:找到小儿先天性心脏病术后科学合理的营养和饮食指导。方法:将我院手术治疗后的100例患有先天性心脏病的婴幼儿进行分为观察组和对照组,每组各50例,观察组于术后根据护
计算机基础作为大学的一门公共基础课,重点是培养学生的计算机基本素质与能力.为他们的后续课程的学习及就业打下一个扎实的基础。本文围绕提高学生的素质与能力等问题。对高职