基于H.264的视频运动对象分割的研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:a306783805
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频运动对象分割的目标是从视频帧序列中间分割出满足一定特征的语义区域。它是数字视频处理领域的难点和热点问题,广泛利用在视频编码、检索、模式识别、机器人视觉等领域。视频运动对象分割有像素域和压缩域两类方法,像素域的方法由于计算复杂度比较大,不能满足实时性要求,所以近几年研究视频对象分割的方法转向压缩域。压缩域方法中进行运动对象分割无须全部解码码流,运算复杂度大大减小,更能满足实时性的要求。研究压缩码流的视频对象分割,主要有基于MPEG系列编码标准和H系列编码标准的码流。MPEG系列压缩码流中能提取到离散余弦变换(DCT)系数和运动矢量两大特征作为分割的基础,对于H.264编码中由于对Ⅰ帧的DCT变换是在块空间预测残差进行的,所以不能直接利用DCT系数作为分割的纹理特征,仅仅只能利用运动矢量作为分割基础,所以保证运动矢量场的正确性和可靠性是最重要的问题。目前对H.264压缩域的视频运动对象分割的研究比较少。本文主要研究的是从H.264压缩码流中提取出运动视频对象,论文的主要工作如下:第一、研究了视频帧中背景为静止的视频运动对象提取方法,首先对从压缩码流中提取出的运动矢量场进行去除随机噪声处理,并对运动矢量场进行幅度和方向上的校正,最后再对运动矢量场做后向投影累积以提高对象提取精度。最后利用均值聚类算法对帧中的多运动对象进行有效分割。实验表明此方法能从压缩码流中提取出良好质量的视频运动对象。第二、研究了视频帧中背景为运动的视频运动对象提取方法。首先对帧运动矢量场做全局运动补偿,利用对象运动和背景运动的不一致性,可以检测出帧的运动区域,为了防止运动区域空洞现象,采用了基于多帧运动矢量检测的方法,以此来提取视频对象。实验表明此方法能够从运动背景的压缩码流中提取出良好质量的视频运动对象。本文使用MATLAB7.0仿真实验平台和基于VC++6.0的JM8.6平台对上述研究进行了验证和分析。
其他文献
疲劳驾驶是当今交通安全的重要隐患之一,驾驶员处于疲劳状态时对周围环境的感知判断能力和对车辆的操作控制能力都会有所下降,因此极易发生交通事故。统计数据表明,每年都有
医学图像分割是正常组织和病变组织的定量分析、三维重建等医学图像分析的基础,也是临床医学应用的瓶颈,分割结果的准确性对医生判断疾病的真实情况并作出正确的诊断计划至关
同时定位与地图构建(simultaneous localization and mapping),简称SLAM,是目前机器人领域的热点研究问题。它指的是让一个自主移动机器人从一个未知的位置出发,利用传感器对
由于回响、混响等多种噪声源的存在,使得数字助听器的性能受到一定影响,因此抑制噪声,提高语音清晰度具有十分重要的意义。本文主要分析了数字助听器中的一些关键技术,并且重
无线通信业务和应用的快速发展导致有限的频谱资源与急剧增加的需求量之间的矛盾日益突出,认知无线电是解决频谱资源不足和频谱利用率低等问题的一条有效途径。认知无线电系
人脸检测在各个领域有着广泛的应用。当人们在用照相机或其他数码产品拍照时,由于光线不足和暗的背景使人脸检测变得很困难。本研究的目的是用图像处理方法实现人脸检测,从而
近些年来,新的通信技术和无线设备终端发展迅速,与此同时,我们的日常生活中也有越来越多的产品使用无线网络技术。不可否认,无线网络能够给我们带来耳目一新的体验,但同时关