论文部分内容阅读
数字信息时代的到来使人们可以很方便的获取到大量的视频数据,如何对大量的视频数据进行有效的组织、管理和检索成为视频检索研究领域的热点问题。基于内容的视频检索(Content Based Video Retrieval,CBVR)的出现能有效地解决视频存储管理以及检索的一系列问题,视频分析与检索的第一步是将无结构的视频流分割成基本单元一镜头,在镜头的基础上概括视频内容、建立索引并进行检索。镜头边界检测是基于内容视频检索中的关键技术。由于视频数据内容丰富,后期剪辑技术多样,很难设计一种通用性好、检测速度快、查准率和查全率都很高的检测算法,因此镜头边界检测具有一定的难度和挑战性,对它的研究已经近十年,仍有许多技术难题有待解决。本文的工作侧重于研究MPEG压缩域中镜头边界检测算法。文章首先回顾和总结了现有的各种镜头边界检测算法,对它们进行分类,并分析各自的优缺点。在此基础上提出了一种压缩域中基于DC图和HSV颜色直方图的镜头边界检测算法,在第一步镜头边界检测的基础上,根据影视剪辑编辑的理论提出了一种压缩域中相机运动定性分析的算法。算法利用MPEG视频流中的运动矢量建立了一个6参数的相机运动仿射变换模型,利用P帧中的运动信息来估计模型参数,这些参数分别代表了相机的缩放因子(zoom)、水平移动因子(pan)、垂直移动因子(tilt)、旋转因子(rotation)和它们的组合运动,运用此参数模型对视频中的主要运动进行定性分析。实验结果表明,该算法直接工作在压缩域上,具有快速、鲁棒和精度高等优点,能够满足视频信息检索应用的要求。