论文部分内容阅读
在当今视频多媒体处理领域,视频对象分割正得到日益广泛的应用。自从MPEG-4基于内容的视频编码首先提出视频对象的概念,在像素域上视频对象分割方面已经有许多的研究成果。但由于绝大部分视频数据都是以压缩形式传输和存储,压缩域分割对象可免除对压缩视频进行完全解码,更符合实时处理要求。
本文总结了近年来视频对象分割研究领域的各种方法,讨论了压缩域视频对象分割过程中的基本概念。针对最新编码标准H.264的新特性,对基于H.264/AVC压缩域运动对象分割算法进行了研究,主要贡献如下:
第一,提出一种改进的基于期望最大化(EM)聚类的运动对象分割方法,首先通过后向迭代投影和中值滤波得到显著平滑的矢量场,接着通过一种基于局部窗口的自适应阈值方法分类运动矢量,最后根据非零运动矢量采用EM聚类算法分割出运动对象。结果表明本算法针对静止背景和运动背景的视频序列都能达到较准确和快速地分割。
第二,提出一种基于改进马尔可夫模型的运动对象分割方法。首先用分水岭算法在运动矢量梯度图像上得到初始标记场,接着用一种改进的区域合并方法来改善过分割问题。最后将基于时空信息的马尔可夫模型后验概率最大化得到最终的标记场,其中优化求解用迭代条件模型(ICM)。另外,分析了运动场景中遮挡的形成原理,结合运动矢量场的时域相关性对MRF模型的条件能量项进行优化。实验证明,能得到较精确的运动对象结果,并能改善对象部分遮挡分割效果。