论文部分内容阅读
随着现代信息社会的不断发展,人们获得的多媒体信息日益增加。因此,对各种多媒信息的处理技术就变成了相关领域内学者的重要研究任务。在这些多媒体中,视觉信息因其形象、生动和直观的特点而更为人们所关注,但同时视觉信息巨大的数据量给传输、存储、处理带来了挑战。因此对视觉信息尤其是视频信息的各种处理技术研究就从来没有停止过。 为了更有效地存储、传输和使用视频数据,必须进行视频压缩。MPEG组织提出了第二代视频压缩标准MPEG-4。相比与第一压缩标准,MPEG-4最显著的特点之一就是提出了基于对象的编码方式。要实现基于对象的视频编码,首行要进行视频对象分割。视频对象分割是指在时空域上将视频分割为一些视频语义对象的组合,也就是将每一个视频帧分割为一些不同语义对象区域。同时为视频数据检索服务的MPEG-7标准则提出了对各种媒体对象进行统一和规范化的描述。而一些计算机视觉等也需要基于对象的各种功能。因此,基于对象的视频信息描述方式已成为多媒体信息处理技术中的一种巨大需求。 然而,由于视视对象分割是相当困难的问题,MPEG-4尽管引入了视频对象的概念,但它并没有指定从视频序列获取视频对象的具体方法。视频对象分割的困难性主要体现在两方面:(1)现实世界中视频场景极度复杂和多样,很难用一种方法进行统一的分割;(2)视频对象的定义是一种基于高级语义的描述,很难用低层次的视觉描述方式如边缘、颜色、运动等特征来描述,而目前的图象分析技术又远远不足以将高层次语义对象用机器语言来准确的定义和描述。 尽管困难重重,但由于广泛的应用前景,近几年对视频对象分割技术的研究就从来没有停止过。本论文研究了视频对象分割中的一些技术难点和重点,包括如何提高自动视频运动对象分割的准确性,如何对视频分割中的难点问题如遮挡等进行处理,以及如何在多种复杂运动情况下进行对象分割。研究目标既有单视频对象,又有多视频对象,重点对多视频对象分割进行了研究。具体地,本论文的主要工作和创新点包括: 针对视频对象分割准确性不高的问题,提出了一种基于区域多重选择的视频运动对象分割提取方法:首先利用一种有效的方法在空间域(帧内)进行区域划分,得到基于区域表示的空间图;然后利用改进的帧差法计算序列时间域(帧间)信息,对所有区域进行分类选择,区域内运动属性非常明显的确定为对象区域,非常不明显的为背景区域,而介于两者中间的区