基于嵌入学习的近重复视频检索和跨域情感分类研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户：tsh8236

【摘要】

：

随着互联网技术和智能硬件设备的高速发展，丰富的多媒体数据出现在网络上。视频和文本作为两类重要的媒体信息载体，是多媒体信息处理领域中的重要研究对象。嵌入学习在多媒体数

【作者】

：

郝艳宾

【机构】

：

合肥工业大学

【出处】

：

合肥工业大学

【发表日期】

：

2017年01期

【关键词】

：

视频检索情感分类嵌入学习数据表示

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网技术和智能硬件设备的高速发展，丰富的多媒体数据出现在网络上。视频和文本作为两类重要的媒体信息载体，是多媒体信息处理领域中的重要研究对象。嵌入学习在多媒体数据存储、检索和分类等领域已被广泛应用，其旨在发掘并利用数据的本质特性生成其对应的低维向量表示。论文以近重复视频检索和跨域情感分类为研究课题，提出一些新颖的基于嵌入学习的视频和文本表示方法，挖掘数据的内容信息并生成准确的数据签名。　　近重复视频检索主要研究如何搜索与查询视频相同或相近的视频，其核心任务是视频信息的准确提取与表示。它是多媒体信息处理领域中一个重要的研究课题，其相关应用包括视频搜索、视频推荐和版权保护等。随着网络视频数量的增加，除了传统的准确性指标外，许多近重复视频检索系统越来越关注系统的高效性和可扩展性。跨域情感分类的任务是通过依靠源域中的监督数据来获得能够适用于目标域的情感分类器，其主要研究如何减小不同领域间单词分布的差异和如何生成准确描述文本数据的签名。　　为了解决上述问题，同时考虑视频和文本数据的特性，论文提出了基于嵌入学习的数据表示方法，包括三种用于近重复视频检索的哈希方法和一种用于跨域情感分类的嵌入方法。本论文的主要工作总结如下:　　1.基于高斯分布的随机多视角哈希方法　　为了提高大规模近重复视频检索的准确率和速度，论文采用基于高斯分布的随机多视角哈希方法将多种视频关键帧的底层特征进行融合，并结合关键帧间的结构信息和可利用的监督信息，生成视频的最终哈希码序列表示。该方法通过最大化广义的检索准确率和召回率来学习可靠的映射函数。并且，方法采用复合的Kullback-Leibler(KL)散度测度来近似估计此检索分数，其随机地匹配了原始特征空间和准哈希码空间的近邻结构。实验结果表明，与其他近重复视频检索方法相比，本文的方法获得了更好的检索性能和更高的检索效率。　　2.基于t分布的随机多视角哈希方法及其深度哈希扩展　　为了提升非监督学习的鲁棒性，论文提出基于t分布的随机多视角哈希方法。该方法采用基于高斯估计获得的连续相似度和基于互惠邻居获得的离散相似度来融合多种视频特征，并通过最小化原始特征空间和准哈希码空间的概率相似度结构的KL散度来学习哈希函数。为了减小远距离映射对象对尺度变化的敏感性，方法采用学生t分布来估计关键帧的准哈希码向量间的相似度，以便将原始空间中的非监督近邻结构更准确地保存到准哈希码空间中。此外，为了思考非监督深度学习的问题和促进大规模检索的发展，论文将该方法扩展到非监督的深度学习上。通过应用相同的优化目标方程和构建基于一个深度神经网络的哈希映射函数，开发一种用于训练深度哈希网络的鲁棒非监督的训练策略。　　3.基于嵌入的跨域情感分类方法　　为了实现跨域情感分类任务，论文提出一种基于嵌入的文本映射方法。该方法采用若干个轴点(pivot)连接源域和目标域，通过构建三个概率相似度匹配模型来学习文本数据的映射函数，并最终生成两个领域中单词和文档数据的嵌入向量表示。轴点被用来减小源域和目标域中单词分布的差异，而三个概率相似度匹配模型则被用来保存文本数据在原始特征空间中的近邻结构关系到生成的嵌入空间中。情感分类的实验结果验证了本方法的效率和有效性。

其他文献

源搅拌混响室设计与评估方法研究

随着各种电子产品和设备爆炸式的增长，电磁环境越来越复杂，电子设备的电磁兼容性能受到了前所未有的重视。无论是军用还是民用的电子设备，电磁兼容性能的测试都需要在符合标准要

学位

电子设备电磁兼容性源搅拌混响室结构设计评估方法

固定背景下单/多目标行人跟踪算法研究

智能视频监控是近年来计算机视觉领域的研究重点和热点之一,在安全防护、智能交通、行为分析等领域有着广阔的应用前景。行人目标检测与跟踪是智能视频监控的关键技术,也是后

学位

行人跟踪粒子滤波目标检测特征融合多目标跟踪

一体化标识网络流量异常监测技术研究与实现

随着信息化技术的飞速发展,网络逐步深入人们生活且规模不断扩大,P地址二义性是引发路由可扩展和网络安全等问题的主要原因之一。为了解决这些问题,基于身份与位置分离的一体

学位

一体化标识网络数据捕获信息熵支持向量机异常监测

基于集成机器学习的行人检测方法研究

行人检测就是指将行人从视频或者图像中检测出来的过程，它是计算机视觉中的重要组成部分。行人检测技术在智能监控、高级人机交互、智能家居等方面有广阔的应用前景和潜在的经

学位

行人检测HOG特征LBP特征AdaBoost算法级联分类器背景差分

LTe-A上行链路CoMP关键技术研究

由3GPP主导的LTE-A系统已经成为第四代移动通信系统IMT-Advanced的重要候选标准。为了满足IMT-A对系统带宽、峰值传输速率、用户平均吞吐量、边缘用户吞吐量以及频谱效率的要

学位

移动通信吞吐量正交频分复用上行链路载波聚合

基于FPGA的模块化雷达中频数字接收机的研究与实现

随着计算机和信息技术的发展，数字信号处理技术因为具有精度高、稳定性好、易于实现各类算法等优点在数据通信、图像处理等多个领域得到广泛应用。与此同时，数字集成芯片应运而

学位

数字信号处理A/D采样芯片信号采集功能模块中频数字接收机电路设计

相位法故障定位中通信协议及定位算法的研究

在配电网故障中，单相接地故障发生的机率最高，而随着用户对电能质量和供电可靠性要求的提高，快速、准确的故障定位技术就显得愈加重要。目前配电网故障定位有多种方法，本文采用的是基于零序电流相位的故障定位方法，它是通过三个电流互感器计算出零序电流，并用GPS秒脉冲进行同步采样，将得到的时间相位信息经无线通信方式将其传输到中心站，并最终判断出故障区段。它的判定依据是故障点前后零序电流的相位相反。该方法不受线

学位

零序电流相位故障定位通信协议定位算法MATLAB

基于LTE高速环境下无线信道测量和建模关键技术的研究

近年来,高速铁路宽带无线接入已成为国内外宽带无线通信研究的热点问题。而信道特性是无线通信系统设计的基础,高铁场景下信道特性的测量与建模是高铁无线通信系统研究的基础

学位

高铁无线信道LTE同步参数提取传播图

基于单目视觉的手势检测与跟踪算法研究

随着时代的变迁和技术的进步，人类已不满足于用键盘和鼠标对计算机进行操作，因此人机交互技术就成为了当下的研究热门，而手势交互就是其中最受关注的一个方向。手是人体最为灵活

学位

人机交互手势检测单目视觉跟踪算法

单极性光正交频分复用传输技术研究

正交频分复用(OFDM)技术可有效解决色散信道引起的码间干扰，因此被广泛应用于各种宽带有线和无线通信系统。当OFDM应用到强度调制直接检测(IM/DD)光通信系统时，需要解决如何将

学位

光正交频分复用非对称限幅光正交频分复用脉冲幅度调制-离散多音频离散哈特莱变换直接检测

基于嵌入学习的近重复视频检索和跨域情感分类研究

其他学术论文