MPEG压缩域运动对象提取算法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:idalu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频对象(Video Object, VO)的提取是视频信号处理领域研究的热点,在基于对象的视频编码、智能视频监控系统、人脸检测、目标识别、视频数据库检索等领域有着广泛的应用。由于现在的视频数据通常是以压缩的方式来存储和传输的,把这种压缩的数据还原到空间域上再提取对象难以实现实时操作,因此近年来运动对象提取的研究热点从像素域逐步过渡到了压缩域。在压缩域进行提取,可利用的信息有限且由于噪声的存在,导致提取的对象过于粗糙。本文研究的主旨就是解决上述从压缩域直接提取VO 的难题,使之既发挥从压缩域快速提取VO 的优势,又能逼近从像素域提取VO 的精度。 本文针对当今应用最广泛的MPEG-2 标准,研究压缩域进行运动对象提取的算法。主要工作如下: 第一,研究了在压缩域中进行全局运动估计与补偿的方法,利用背景区域的运动矢量和全局运动间的相似性和一致性,从背景区域的运动矢量场来估计全局运动,然后对运动矢量场进行补偿,得到前景物体的运动矢量。经全局运动估计与补偿,使后续的运动对象提取算法既适用于静止背景序列,也适用于动态背景序列。 第二,提出了一种压缩域基于时、空信息融合的运动对象提取算法。首先,在空域上重建I 帧的DC+2AC 低分辩率灰度图,用阈值分割方法来获取对象的轮廓特征,然后在时域上将P 帧的运动矢量置密,迭代投影于I 帧。融合空域和时域处理的信息,快速准确地实现了直接从压缩域中提取粗糙运动对象。再对粗糙的运动对象部分解码,在时间与精度间进行折中,以少许时间代价获得较高的精度,实验表明,该提取算法效果较好且具有实时性,可应用于实时分割系统。 第三,提出了一种压缩域中基于运动一致性模型的改进算法,先对可从MPEG码流中直接得到的运动矢量场进行可靠性度量校正、致密化和滤波处理,并采用基于块的区域增长算法得到每个对象的大致运动区域;然后部分解码属于运动区域的块,并把被还原的每个位置的像素值分布视为高斯分布,用统计的方法建立其高斯模型,通过阈值判断可靠地提取出最终具有像素精度运动对象。仿真实验表明,该算法可以有效地去除运动矢量噪声的影响,分割精度显著提高,并且具有较高的处理速度。
其他文献
面向对象的开发方法是当今企业级应用中的主流开发方法,关系数据库则是永久存放数据的主流数据存储系统。由于面向对象模型和关系模型之间存在对象一关系不匹配障碍,而且面向对
随着以太网技术的发展和普及,将以太网技术用于工业控制的底层网络,直接将现场设备接入工业以太网进行管理、监控和通信已成为必然趋势。目前,在很多工业现场仍旧有大量采用串行
LonWorks总线作为一种工业总线在工业控制监控系统中得到广泛应用,LNS作为其操作系统也逐渐在普及。传统基于DDE技术的访问方式已经不能满足客户端访问服务器对LNS网络进行监
人脸表情识别是近几十年来才逐渐发展起来的一个科研热点,指利用计算机分析特定人的脸部表情及变化,进而确定其内心情绪或思想活动,实现人机之间更自然更智能化的交互。它在
虚拟森林生长仿真从生态系统的角度出发,采用虚拟现实技术对森林生长的动态变化过程进行模拟,模拟结果可对林业生产的管理起到指导作用。传统的森林仿真系统往往侧重于场景的
在传统的电工电子学的实验教学中,很多学校都存在着资源不足、投资大、见效低、实验环境及过程具有一定的危险性等问题。随着多媒体技术和网络技术的迅速发展,通过网络和虚拟的
图是一种强大的数据结构,它可以表达现实世界中事物之间错综复杂的关系,如城市之间道路的连接关系,网页之间的引用关系,人与人之间的社交关系。近年来GPU体系结构的蓬勃发展让人
移动自组织网络(Mobile Ad Hoc Network, MANET)是一种无需基础设施支持的新型无线网络,具有组网灵活,易于移动与部署,抗毁能力强等特点,在军事行动、灾害救援、临时会议等场
传统的Web体系结构在代码的移植、程序的可扩展性方面产生了众多问题;另一方面,JDBC作为持久层解决方案存在着很大的局限性,而EJB必须遵循各种J2EE规范,这增加了其开发的复杂
科学技术的发展极大地促进了计算科学的进步。新一代计算机无论是计算能力还是计算速度都比以前的计算机优越,但是人类对计算的要求也在不断地提高。在实践中,有些单处理器不能