【摘 要】
:
随着互联网的进一步普及以及数字多媒体技术迅速发展,全球已经进入大数据时代。网络数据体量呈爆炸式增长,数据传播形式由单一文本发展为包含文本、图像、视频、三维模型等多媒体数据。如何有效地对庞大的多媒体大数据进行存储和分析,为用户提供感兴趣且类型丰富的媒体数据,已经成为学术界及工业界高度关注的重要问题。跨模态哈希技术,通过机器学习紧凑哈希编码的方式对多媒体大数据进行管理与分析,具有存储空间小、检索速度快
【基金项目】
:
国家自然科学基金项目“多视角自适应哈希学习及其应用”;
论文部分内容阅读
随着互联网的进一步普及以及数字多媒体技术迅速发展,全球已经进入大数据时代。网络数据体量呈爆炸式增长,数据传播形式由单一文本发展为包含文本、图像、视频、三维模型等多媒体数据。如何有效地对庞大的多媒体大数据进行存储和分析,为用户提供感兴趣且类型丰富的媒体数据,已经成为学术界及工业界高度关注的重要问题。跨模态哈希技术,通过机器学习紧凑哈希编码的方式对多媒体大数据进行管理与分析,具有存储空间小、检索速度快等优势,是解决多媒体大数据检索问题的关键技术。此外,互联网本身具有开放性,滥用多媒体数据等不良行为屡见不鲜。因此,跨模态检索技术的安全性同样面临着巨大的考验。通过模拟对抗攻击检索,设计攻击样本,对跨模态哈希模型进行安全性分析,进而提升模型的鲁棒性,已经成为当前跨模态哈希检索领域新的研究热点。现有跨模态哈希检索方法可分为两大类:基于手工设计特征的方法和基于深度学习的方法。本论文致力于研究基于深度学习的跨模态哈希检索方法,针对现有方法存在的问题:如特征表示能力低、模态关联不强、语义理解不准、模型鲁棒性差等,进行理论方法创新。本论文的主要创新可以概括为:1.提出一种基于自监督对抗学习的深度跨模态哈希方法。传统的跨模态哈希方法常依靠专家知识手工设计特征,受已有知识所限,这些方法往往无法得到识别能力强的特征表示,导致检索效果不理想。此外,已有的深度哈希方法通过构造简单的相似性约束来关联不同模态数据,只能构建较弱的跨模态关联关系,从而产生不可靠的哈希码。针对上述问题,提出一种基于自监督学习的深度跨模态哈希方法:首先,构造可靠的辅助语义知识挖掘网络,深入挖掘跨模态数据之间潜在的共享语义知识。其次,提出基于生成对抗网络的深度跨模态哈希框架,利用生成对抗学习将挖掘到的语义知识嵌入到跨模态哈希学习任务中,构建从语义特征到哈希编码双空间引导的统一哈希表征学习方式。实验表明,与传统跨模态哈希方法以及现有的深度跨模态哈希方法相比,所提方法能有效增强跨模态哈希网络学习关联性,实现跨模态数据准确检索。2.提出一种基于循环生成对抗网络的深度无监督跨模态哈希方法。尽管已存在海量的多媒体数据,但是数据标注质量参差不齐,而现有基于深度学习方法严重依赖大量高质量的人工标注样本。然而,获取高质量标注样本的代价巨大,限制了已有方法在实际跨模态检索任务上的应用。针对上述问题,提出一种基于循环生成对抗网络的深度无监督跨模态哈希方法,通过设计双循环生成对抗网络统一框架,构建跨模态数据关联关系,进而学习跨模态哈希编码。深入研究跨模态数据成对共现的特性,借助外循环生成对抗网络学习跨模态数据特征表示,借助内循环生成对抗网络学习跨模态哈希码。实验表明所提方法相比已有方法能有效挖掘跨模态数据的近邻关系,大幅度降低对人工标记数据的依赖。3.提出一种基于对抗攻击样本的跨模态学习方法。最新研究表明深度神经网络普遍存在鲁棒性差、易受攻击等问题。而现实中,已有的最先进跨模态哈希方法直接或间接地采用了深度网络框架,导致深度跨模态哈希方法同样存在安全隐患,进而限制了深度跨模态哈希方法在某些安全领域的应用。针对上述问题,提出一种基于对抗攻击样本的跨模态哈希检索方法,通过对比模态内、模态间两种检索任务的差异性,挖掘常规数据与对抗样本数据语义空间结构分布差异,进而提出构建最大化模态内语义一致性、同时最小化模态间语义一致性约束的对抗样本学习方法。实现在维持模态内检索性能不变的前提下,有针对性的攻击跨模态检索模型,即获得的对抗样本更具有攻击性。实验表明,通过所提方法设计的跨模态攻击样本能有效对目前流行的深度跨模态哈希检索模型进行攻击。相反地,用所学习到的攻击样本对模型进行对抗训练,可以进一步有效提高模型预防攻击的能力。4.提出一种基于解耦对抗样本学习的跨模态哈希检索方法。已有的深度跨模态学习方法通常采用相似性约束作为监督信息的学习方式。这些方法依赖深度网络强大的非线性拟合能力,总可以学习哈希码使其满足预先设定的相似性条件。但因为缺乏对跨模态数据内容本身的研究,深度网络脆弱性的本质未被充分挖掘。虽然不断有检索精度性能良好的深度哈希方法被提出,但是深度哈希网络安全性问题一直存在,易被恶意攻击。针对上述问题,提出一种基于解耦对抗样本学习的跨模态哈希检索方法,首先,从跨模态数据源头出发,研究数据之间自身的关联性,提出将原始数据分成跨模态相关样本和跨模态无关样本。然后,引入对抗攻击样本学习方式,通过设计最大化原始样本与模态相关样本间的相似性、最小化原始样本与对抗样本之间的相似性约束,从跨模态数据中解耦出模态相关成分。实验表明,所提方法可以有效提取模态相关成分,并且使用所提方法解耦得到的模态相关样本对目标网络进行训练,可以有效提升模型的鲁棒性。
其他文献
近年来,车联网领域的研究活动非常活跃,也取得了巨大进步。这些研究深入分析了如何设计车联网环境下的数据分发协议及其相关算法。如今,车联网仍然是一个保持快速发展且十分活跃的领域,与此同时车联网领域也存在大量的研究挑战及待解决的问题。另外,无线通信技术的不断革新也给车联网带来了前所未有的应用挑战。在车联自组织网络中,车辆与车辆、车辆与路边基础设施之间,利用无线通信技术进行数据分发的主要目的是为了进一步提
目前,随着雷达工作频段的日益增高以及宽带雷达的广泛应用,近场散射研究已不仅仅局限于实验测量方面。在实际应用中,尤其是雷达导引头制导、引信回波分析等方面都需要对目标与环境的时域近场散射特性进行深入的研究。本文针对电大尺寸目标与环境的时域近场电磁散射问题,基于时域电磁散射理论,对近场波束照射条件下的时域弹跳射线方法进行了深入的研究,并在此基础上开展了基于时域散射回波的雷达成像方法的研究。本文的主要研究
绘画是艺术创作的重要视觉表现形式之一,绘画作品的艺术风格包括颜色、纹理、构图等一系列图像信息,能够体现艺术家的创作背景和创作特点,是各类绘画流派的直接特征表现。创作一副具有特定艺术风格的绘画作品往往需要训练有素的专业人员花费大量的时间。而随着计算机技术的不断发展,借助图像处理和计算机视觉方法可以出色的完成艺术图像的创作。通过对绘画作品的艺术风格建立数学或统计模型,图像风格迁移算法能够使计算机自动地
碳化硅(SiC)作为代表性的第三代宽禁带半导体材料,以其优良的物理化学性质,在大功率、高温、抗辐照等国防和民用领域具有广泛的应用和巨大的发展前景。SiC绝缘栅双极型场效应二极管(IGBT)作为一种电压驱动的全控型功率开关器件,是当前电力电子器件研究领域的前沿和热点。研究和开发高性能高可靠性的SiC IGBT器件对电力电子设备高效化、小型化以及生产维护成本降低均有重要意义。目前SiC IGBT研究中
在杂波背景中获取感兴趣的目标,一直是雷达信号处理领域的热点问题。随着雷达探测环境愈加复杂,雷达系统设备愈加先进,雷达杂波的统计模型趋向于多样化。实际中,许多实测杂波数据的统计直方图均表现出重拖尾的特性,针对传统高斯杂波模型设计的检测器不再适用。此外,在一些复杂杂波环境中,由于孤立类目标杂波的存在,杂波虚警不可避免地出现在检测结果中,在检测之后需要设计合理的拒判算法来剔除杂波虚警。本论文在介绍、分析
激光在大气中传输,由于大气湍流扰动的存在,沿光束传输路径上的折射率分布随机变化,这将会导致光束的波前结构遭到破坏,进一步引起光束携带信息的损坏,甚至丢失。位相奇点光束与轨道角动量相关,由于可能的光束轨道角动量数理论上是无上限的,对其的研究在光通信中具有重要的潜在应用价值。位相奇点光束在传输的过程中,受制于湍流的影响,轨道角动量各模态之间将会发生串扰,不利于在接收端对光束携带信息的提取。本文目的是致
在2019年世界5G大会上,以5G技术为支撑的一系列新兴业务不断涌现。其中,数字城市、无人机救援、5G远程驾驶和远程医疗等构想,俨然搭起一座充满无限可能的未来之城。为了实现5G宏伟愿景,四个主要场景备受青睐:无缝广域覆盖、高速率大容量、低功耗大连接和低时延高可靠。面对未来移动网络数据需求的爆炸性增长,如何提升频谱效率和能量效率是5G部署的重要目标,故现有无线传输方式和组网技术均需突破性创新。面对海
装备相控阵雷达的飞机可以灵活、快速地部署,实现对战场中各种目标的检测、跟踪,感知敌方态势,为己方力量的指挥和控制提供情报支撑。但是在机载雷达工作当中,必须解决干扰抑制和杂波抑制问题。在信号处理的环节,可以利用自适应波束形成技术来抑制旁瓣区域的干扰。但是当阵列流型与实际情况不一致(如存在位置误差、幅相误差或接收机通道响应误差),自适应处理往往导致期望信号的输出信干噪比下降。因此设计稳健的波束形成器来
多目标跟踪技术是信息融合领域的重要研究内容之一,已广泛应用于空中侦察与预警、导弹防御、战场监视等军事领域,以及计算机视觉、空中导航、交通管制等民用领域。然而,随着现代高分辨率传感器的快速发展以及跟踪场景的日益复杂化,所获得的目标量测信息更加丰富,致使多目标跟踪中的数据关联问题变得更加复杂。随机有限集(Random Finite Set,RFS)理论为多目标跟踪提供了新的发展契机,但最新的RFS滤波
网络安全分析根据网络主机基数、网络流和网络行为等安全参数,分析网络通信的变化趋势,进而判断网络的安全性,是维护和保障网络空间安全的重要技术。然而,随着网络规模的不断扩大,海量安全参数导致网络安全分析面临效率低、准确性差、资源消耗大的问题。近年来,数据压缩融合方法已被广泛应用在网络安全分析中,通过按需压缩和融合数据,减少存储及分析数据所需的资源消耗,具有时间和空间上的优势,是克服海量安全参数给网络安