【摘 要】
:
视觉信息作为最直观的媒体,是人类感知外界的重要媒介。图像和视频处理一直是专家学者们研究的重要课题,而特征提取是其中的关键问题。特征提取的目标是获取能够反映图像和视
论文部分内容阅读
视觉信息作为最直观的媒体,是人类感知外界的重要媒介。图像和视频处理一直是专家学者们研究的重要课题,而特征提取是其中的关键问题。特征提取的目标是获取能够反映图像和视频中感知内容,且具有鲁棒性和区分性的描述符,对于图像和视频分类,识别,检索等领域的发展有着直接影响。以网络安全问题为例,互联网上的图像和视频包含大量的非法拷贝。无法阻断非法拷贝的传播会造成版权侵犯风险,并引起知识产权纠纷。拷贝检测是解决这类问题的主要方法,图像与视频的鲁棒特征提取是拷贝检测中的核心技术,具有重要的理论与实用价值。本文以图像及视频拷贝检测为应用场景,研究基于特征自学习的鲁棒哈希算法设计。作为研究内容的理论基础,论文首先回顾了现有的视觉特征学习方法,包括稀疏编码、神经网络和慢变特征分析。针对图像的鲁棒特征提取问题,本文提出一种图像空间慢变特征学习方法。本文在原始的组稀疏编码基础上,设计了编码和字典学习方法,能够提取图像在空间上变化慢的特征。本文结合人眼视觉系统中多层级结构设计了多层的组稀疏编码模型,可以学习出图像更大范围内的慢变特征。实验证明本算法提取出的空间慢变特征具有较好的鲁棒性和区分性,各项图像哈希的评价指标中均优于经典的图像哈希算法。在视频的鲁棒特征提取方面,本文设计了一种基于时空神经网络的视频哈希算法。此算法利用降噪自编码器鲁棒性强的优点,通过逐层训练降噪自编码构建独立提取各帧特征的深度网络。在此基础上,算法利用长短时记忆网络提取视频时序特征,并根据慢变特征分析理论设计了网络训练算法。实验表明,基于时空神经网络的视频哈希在视频拷贝检测中能够表现出较高的准确率,F1达到0.995,优于对比算法。综上所述,本论文根据慢原则的思想,以稀疏表达和深度学习为主要数学工具,分别提出了图像和视频的慢变特征的提取方法,为图像和视频的识别、检索等任务提供了技术支持。
其他文献
在可扩展处理器中实现自定义指令已经成为提高应用程序运行效率的常用方法之一,为了解决现有识别自定义指令方法设计周期长的问题,同时满足嵌入式应用对高性能和低功耗不断增
[研究背景]甲状腺癌(Thyroid carcinoma,TC)是内分泌系统最常见的恶性肿瘤,女性患者多发。甲状腺乳头状癌(Papillary thyroid carcinoma,PTC)是其中最常见的恶性肿瘤,甲状腺
风电场由许多风力发电机构成并耦合到电网中。在现代国家中强调清洁可再生能源,但其最大的缺点是自然资源的波动和变化,例如风力不强或太强,将无法转化为电能。另外一个严重
本论文基于石墨烯及其复合材料研究的最新进展,通过聚离子液体和杂多酸非共价修饰石墨烯的方法,成功地制备了聚离子液体修饰石墨烯和杂多酸/石墨烯复合材料,并对其形态结构和
数字图像作为电子证据的一种,在证明事实真相中扮演着重要的角色。随着计算机技术与人工智能技术的发展,图像的真实性受到了严重的挑战,图像的真实性检验成为了一个新的研究
背景和目的多发性骨髓瘤(multiple myelom MM)是血液系统恶性肿瘤中第二常见肿瘤,大约占10%,属于克隆性浆细胞恶性疾病,其特点为骨髓中克隆性浆细胞聚积,贫血,高钙血症,肾功
当今企业竞争日趋激烈,物资采购作为企业供应链的源头,在企业对外竞争中具有非常重要的作用。物资采购流程的各个环节一旦出现问题,就会影响到采购预期目标的实现,因此物资采
道路作为国民经济的命脉,在生产生活中发挥着十分重要的作用。机载激光雷达(Light Detection and Ranging,LiDAR)技术可以快速获取高精度的三维(3 Dimension,3D)点云数据,它
面对信息时代数据流量的爆炸增长,模式复用(MDM)技术可以突破传统单模光纤通信系统传输容量瓶颈,满足光纤通信系统的通信容量提出的更高的要求。另一方面,MDM技术要走向实用
本文基于微扰量子色动力学,计算了在大型强子对撞机(Large Hadron Collider,LHC)能区相对论核-核碰撞中,分解光子过程对胶子-胶子熔融产生Xc,b(1+)介子的贡献。具体的计算包含相