论文部分内容阅读
随着网络视频业务的迅猛发展,网络视频呈现“爆炸式”增长,这些视频中存在大量的拷贝视频,使得视频版权侵害、数据冗余等问题日益严重。因此,如何准确、高效地检测网络中的拷贝视频已成为亟待研究的课题。在对主流的基于全局特征和局部特征的视频拷贝检测算法进行深入研究的基础上,从检测精度和效率两方面对现有方法进行了改进。同时,针对单一特征鲁棒性和区分性不足,难以检测多种不同变化类型拷贝视频的问题,设计了基于多特征融合的视频拷贝检测系统。本文的贡献体现在以下三个方面:(1)在全局特征检测方面,提出了基于核心区域OM特征和转换距离的视频拷贝检测方法。首先,该方法通过统计分析网络中拷贝视频的特点,选取拷贝视频中相对稳定的核心区域提取OM特征,增强了特征鲁棒性;其次,根据拷贝视频的变化机理,提出基于转换距离的OM特征相似性度量方法,并设计了相应的快速匹配方法。实验结果表明,该方法能够快速有效地检测网络中常见类型的拷贝视频。(2)在局部特征检测方面,提出了基于多视觉词典模型和E2LSH的视频拷贝检测方法。首先,该方法采用随机分组和AP算法对参考视频SURF特征集合聚类,生成多个高质量的视觉词典,克服视觉码本同义性和歧义性问题;其次,根据SURF特征与各视觉码本的距离比值,单独为每个特征划定映射范围,以不同的权重将特征映射到范围内的所有视觉码本上,提高特征映射精度;最后利用E2LSH算法提高大规模数据集下的帧匹配效率,并基于时序一致性原则将匹配帧融合成视频片段,以检测和定位查询视频中的拷贝片段。实验结果表明,与同类算法相比,该方法不仅能有效提升检测精度,同时具有更高的处理效率。(3)在多特征检测方面,设计了一种基于多特征融合的视频拷贝检测系统。该系统首先基于多视觉词典模型和E2LSH的视频拷贝检测方法重点检测查询视频中非线性变化的拷贝视频,并滤除大量的非拷贝视频;接着再利用基于核心区域OM特征和转换距离的视频拷贝检测方法重点检测疑似视频中全局线性变化的拷贝视频,并利用上一级检测中的反馈信息加速核心区域OM特征的匹配过程。实验表明,相较于单一特征的视频拷贝检测方法,多特征融合的视频拷贝检测系统能有效提升检测精度;相较于同类算法,该算法的检测效率更高。