论文部分内容阅读
视频运动对象分割的目标是从视频帧序列中间分割出满足一定特征的语义区域。它是数字视频处理领域的难点和热点问题,广泛利用在视频编码、检索、模式识别、机器人视觉等领域。视频运动对象分割有像素域和压缩域两类方法,像素域的方法由于计算复杂度比较大,不能满足实时性要求,所以近几年研究视频对象分割的方法转向压缩域。压缩域方法中进行运动对象分割无须全部解码码流,运算复杂度大大减小,更能满足实时性的要求。研究压缩码流的视频对象分割,主要有基于MPEG系列编码标准和H系列编码标准的码流。MPEG系列压缩码流中能提取到离散余弦变换(DCT)系数和运动矢量两大特征作为分割的基础,对于H.264编码中由于对Ⅰ帧的DCT变换是在块空间预测残差进行的,所以不能直接利用DCT系数作为分割的纹理特征,仅仅只能利用运动矢量作为分割基础,所以保证运动矢量场的正确性和可靠性是最重要的问题。目前对H.264压缩域的视频运动对象分割的研究比较少。本文主要研究的是从H.264压缩码流中提取出运动视频对象,论文的主要工作如下:第一、研究了视频帧中背景为静止的视频运动对象提取方法,首先对从压缩码流中提取出的运动矢量场进行去除随机噪声处理,并对运动矢量场进行幅度和方向上的校正,最后再对运动矢量场做后向投影累积以提高对象提取精度。最后利用均值聚类算法对帧中的多运动对象进行有效分割。实验表明此方法能从压缩码流中提取出良好质量的视频运动对象。第二、研究了视频帧中背景为运动的视频运动对象提取方法。首先对帧运动矢量场做全局运动补偿,利用对象运动和背景运动的不一致性,可以检测出帧的运动区域,为了防止运动区域空洞现象,采用了基于多帧运动矢量检测的方法,以此来提取视频对象。实验表明此方法能够从运动背景的压缩码流中提取出良好质量的视频运动对象。本文使用MATLAB7.0仿真实验平台和基于VC++6.0的JM8.6平台对上述研究进行了验证和分析。