视频内容的结构化分析

来源 :复旦大学 | 被引量 : 0次 | 上传用户:mrchenbx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为多媒体家族中一个十分特殊的成员,视频本质上融合了图像、语音、文本、动画等多种类型的媒体数据,成为多媒体信息检索研究的难点。随着研究的不断深入,建立了现代视频检索和内容查询的一个基本框架。这是在现代多媒体研究方面的一篇经典文章,也是在此领域中人们引用最为广泛的文章之一。框架的基本思想是:不需要完全明白视频的内容,只需分析视频的结构,再把每一个镜头当作段落,将关键帧当作关键字,从而形成一套全新的多媒体检索和查询的方法。 基于内容的多媒体检索技术的日益成熟不仅将创造出巨大的社会价值,而且将对人类生活的改善发挥重要作用。 本文以基于内容的视频处理和检索技术为研究目标,以视频内容的结构化分析为主线,结合自己的研究工作,重点介绍视频中镜头分割(或称镜头边界检测)、场景分割(或称场景边界检测)、节目分割(或称节目边界检测)、以及关键帧提取和相似度计算等关键技术。 论文第一章着重介绍视频检索研究的发展现状,同时简要介绍几个具有代表性的视频检索系统模型。随后从现代视频检索研究的一大核心课题——视频结构化分析角度出发,罗列视频结构化分析研究中的若干关键技术。第二章在总结前人在镜头分割方面所作贡献的基础上,着重介绍我们在镜头分割方面所作的工作。第三章介绍当前几种常用的关键帧抽取方法以及关键帧的特征提取和相似度计算方法,并重点介绍MPEG-7标准定义的图像视觉特征描述子。第四章首先针对新闻、电影这两类特殊视频分别介绍了几种典型的场景分割算法,随后详细描述了我所在研究小组提出的一种通过自动分类学习检测播音员镜头的算法,其检测结果可用于新闻视频的场景分割中。第五章首先将传统的视频层次结构进行扩充,针对电视视频流,在场景和视频层次间加入节目层(Program),并随后提出一种针对特定电视频道的电视节目自动分割算法。第六章,总结全文并展望未来的工作。
其他文献
  本文设计了基于Cookie服务票据的单一认证方案,并引入基于角色的统一授权的访问控制模式,安全的实现了用户只登录一次便可对多种资源进行访问。该方案利用Http协议头部的Co
  本文对区分真实照片与人工图片的算法与实现进行了研究。文章考虑了图片的微观特性,包括纹理的粗细、能量、走向、信息量以及纹理的颜色、亮度分布特征。针对图片受到计算
  本文提出一个基于待诊断系统的知识和以往诊断经验的诊断系统DSKE,揭示了DSKE是一阶逻辑推理系统,因此它具有很强的推导能力,当我们拥有完备的待诊断系统的知识时,它可以确切
本文力图充分发挥GIS海量数据,同时提高其解决实际复杂问题能力的前提下,构建了AutoSearch系统。它能过利用GIS的空间数据和属性数据,综合考虑城市目前的交通,经济,人口,文化,生态,城
目前有关对等计算的研究主要分为底层网络体系结构和应用层数据管理两个方面;本文针对对等计算的特点,立足于对等计算环境下的数据管理问题。对等计算中的数据管理主要涉及到网
在现实世界中复杂网络无处不在,如万维网、交通网络、科学合作网络、电力网络、人际关系网络、细胞神经网络及传染病网络等。这些复杂网络都是由现实中的复杂系统抽象而来。因
  本文分析了ERP系统中数据转换的基本需求,结合面向对象的方法和构件技术,设计并实现了基于XML的通用数据转换系统。 本文总结了在实施ERP系统的实践中所使用的技术,提出
软件测试是保证软件质量的重要手段,软件测试一般分为手工测试和自动测试。软件自动测试技术是当前软件界的研究热点之一。在我国,软件测试自动化的研究尚处于起步阶段。因此,对
医学图像滤波与增强技术是图像处理的主要部分之一,随着社会的不断发展,为了能够给医生提供更加精确的诊断,医疗设备得到了广泛的应用,然而由于设备本身和外界环境的影响,使得所产
从上个世纪90 年代起,网络应用不再仅仅局限于传统的文本传输方式,出现了以音频、视频的宽带数据传输需求和对网络安全问题的需求。在不断扩充主干网络带宽的同时,着手对网络