论文部分内容阅读
视觉信息(图像和视频)是人类了解外部世界最重要的信息来源。随着计算机技术、通信技术、多媒体技术和存储技术的发展,人们可以方便地记录、压缩和传输大量的图像和视频数据。通过对图像和视频数据进行有效分析,人们能够更加有效地了解和处理大量外部信息。目标跟踪是指通过物体的边缘、局部运动以及强度(对比度和亮度)的变化信息来对物体进行跟踪。通过跟踪建立运动物体的时域相关性,不仅可以有效提高运动估计的精确度,而且使得操作、控制对象成为可能。视频对象跟踪是基于内容的视频表示、处理以及视频压缩的重要组成部分。它存军事视觉制导、视频监控、机器人视觉导航、医疗诊断以及气象分析等方面都有广泛的应用。
本论文围绕视频目标跟踪进行了四个方面的研究,即快速块匹配、快速全局运动估计、基于彩色和运动信息的视频目标分割和基于对象网格模型的视频目标跟踪。
本论文取得的主要研究成果包括以下四个方面:
1.提出了一种基于多分辨率框架的快速块匹配算法。块匹配算法是H.263、MPEG1/2/4中的基本运动估计算法,由于它在算法复杂度和计算速度上较好的统一,应用非常广泛。为在保持高匹配准确度同时加快匹配速度,本文提出一种新快速运动估计算法HACDS。HACDS使用三层多分辨率结构适应快速运动,在最低分辨率层使用FS保证初始收敛精度,其它层采用ACDS加快匹配速度。实验证明在保持很好的匹配效果同时极大地降低了搜索次数。此外,由图像彩色信息和双向运动估计提高了运动估计的精度和稳健性。最后通过对场图像采用基于HACDS中值补偿算法与其它补偿算法的性能比较中,基于HACDS中值补偿算法降低了随机噪声的影响,优化了补偿图像的质量,被成功应用于视频格式转换技术中。
2.提出一种基于多分辨率框架稀疏采样M估计全局估计算法。对于图像中的前景点消除,通过混合三种方法在金字塔结构逐层进行。在金字塔结构的每层中,首先根据块匹配差异值消除部分前景块;其次利用Huber函数对误差的敏感度不同的特性,对背景和前景运动物体的像素点快速分类,使得背景的仿射参数估计过程只对背景像素点敏感,减少了前景运动物体对参数估计造成的误差,提高参数估计的精度;最后消除孤立背景块。在得到原始图像层的初步全局运动参数后,通过背景块的特征点集合,利用LMICA象素能量最小迭代法获得最终的精确全局运动参数。三层多分辨率结构扩展了运动运动范围,加快了运动估计收敛速度。此外,除顶层外的各层上利用预测查找表方式加快了运动估计的收敛速度。实验表明,提出的算法计算量小,获得的全局运动参数精确可靠。
3.提出一种基于网格运动场估计和彩色信息均值移动聚类的视频对象分割方法。二维稠密运动场通过基于内容的网格模型得到。对视频图像进行Gabor小波变换得到视频图像中网格的节点,可以有效消除噪声和光照变化带来的影响。在网格节点的生成过程中引入Gabor小波能量概率决策法和加权动态聚类法,使网格节点的分布尽可能在边界和角点等结构特征明显的位景,保证了网格节点的合理分布。在空间区域分割方面,对彩色空间聚类获得图像的准确区域信息,通过准牛顿法加速均值移动聚类速度,然后利用区域一致性检测进行区域融合。实验表明,通过空间区域分割和稠密运动场可以获得准确的运动视频对象分割结果,为运动对象跟踪或视频内容分析提供了非常好的基础。
4.提出一种基于对象网格的视频对象跟踪方法。构建跟踪使用的视频对象模型,包括对象网格模型、权值区域关系图等。提出了一种网格节点跟踪方法实现节点的稳健跟踪,通过网格节点的跟踪实现了视频对象的跟踪。在节点跟踪过程中,为了消除仿射模型参数在计算时的相互干扰,采用平移模型作初始匹配,利用仿射模型的变形参数校验特征窗口相似度,并进行节点的局部调整。仿射运动模型参数采用Newton-Raphson梯度下降法计算,并利用Gabor小波梯度算子克服梯度下降法对噪声的敏感,提高了运动矢量估计的精确度。针对几种网格节点跟踪失败的情况,通过构建的视频对象跟踪模型并结合均值移动彩色聚类、Ncut为权值的区域关系图给出了相应的解决方法。静止背景和运动背景视频中的视频对象的跟踪和补偿实验表明,提出的跟踪算法可以实现视频对象的稳健准确跟踪。