论文部分内容阅读
多媒体和通信技术的发展为信息的表达、存储和传递提供了有效的手段,人们面对的信息量正在以前所未有的速度增加。研究和开发能够自动检测、分类和汇总相关信息的方法具有重要的现实意义。本文以数字视频为对象,研究了视频结构化和视频语义信息的提取技术,提出了视频结构化和视频语义提取的一系列方法;在此基础上研究了新闻视频中新闻单元的划分、新闻主题的检测和跟踪,提出了新闻事件的检测方法。 根据视频结构特征,按从粗到细的顺序把视频划分为帧、镜头、场景和视频4级结构。其中的关键是镜头和场景的边界的检测,本文提出了基于支持向量机的镜头检测方法和基于统计学习的场景检测方法。在检测检测镜头时,首先利用混合投影函数,定义和计算数字视频帧的特征向量,再用对应的特征向量的差来定义两个帧的帧间差向量;然后用帧间差向量构造视频序列的特征向量,利用支持向量机方法对镜头渐变过程和帧内运动进行分类。在场景划分方法中,利用镜头在视觉上的相似性和在时间上的相关性,把镜头分组,再利用统计学习方法划分镜头组,从而检测场景。 新闻节目由多个新闻单元组成,对新闻视频内容分析首先要将新闻节目分割成独立的新闻单元,但新闻视频中新闻单元边界处没有特定的分割标志。本文利用新闻视频中特定的视音频事件在时间上的表现出来的规律性,采用数据关联挖掘技术,对新闻视频进行单元划分方法。首先,检测视频中出现的典型的视音频特征,符号化这些事件,并在数据流中引入事件的时序特征,根据事件的时序特征把视频转换成为相关事件对应的数据流;接着,定义时序支持度和置信度,应用关联规则挖掘方法,发现数据流中和新闻单元相关的序列模式;最后,通过搜索和匹配确定事件流中对应的序列片断。 在对新闻视频分析的基础上,本文提出了视频新闻报道的一种表示方法,按照特征的语义把新闻报道表示为五个语义类,重点介绍了视频中场景特征的识别方法和用于视频中画面类型别的视频图像特征选择和提取方法,给出了一个基于边界方向直方图表示图像中纹理特征、并利用神经网络进行场景类型识别的算法。在把视频新闻报道表示成5个语义类后,采用自然语言或文本形式的新闻报道中主题检测和跟踪方法,讨论了视频新闻中主题识别和跟踪方法和主题跟踪和识别中的关键内容之一的事件检测方法,提出了基于增量k-均值算法的NED方法和基于统计方法的RED方法。