论文部分内容阅读
随着现代计算机技术,特别是数据存储与传输技术的发展,数字视频已广泛应用新闻、教育、娱乐、医学等诸多领域。视频具有形象、生动、表现力强和信息量大等优点,但同时,由于其数据结构复杂、数据量巨大以及内容难以描述等特点,给视频数据的组织、浏览、检索带来很大不便,这种不便已经严重阻碍了视频数据的进一步应用。视频分析技术的目的便是实现视频媒体信息的有序化,它是基于内容的视频检索技术、视频非线性编辑和浏览技术等多种技术的基础和前提,在视频研究领域占有重要地位。新闻视频是一种典型的视频类型,它作为一种重要的电视节目,是现代每个家庭及时获取信息的主要来源。正在开发的新一代电视技术希望具有对新闻视频的智能录制与交换式浏览功能,这些都需要建立在新闻视频内容与结构分析的基础上。 本文围绕新闻视频场景分割技术展开研究。研究内容主要包括:镜头边界检测;主持人镜头检测;标题条检测及文字内容提取;静音段检测;基于标志性事件的新闻场景分割等。并获得了如下一些研究成果: 1.提出了一种针对叠加型闪光灯的镜头边界检测算法,该算法克服了多个闪光灯叠加出现和消失对镜头边界检测产生的影响。与其它镜头检测算法相比,本算法对闪光灯的适应性大大增加,进而使镜头边界检测的准确率有较大提高。 2.提出一种基于半屏幕主颜色直方图的主持人镜头检测方法,本方法基于主持人镜头在新闻节目中频繁出现的统计特性对主持人镜头进行检测。具体采用把屏幕分为左屏幕和右屏幕两部分,然后分别对这两部分进行检测的方法,以消除背景变化及小窗口的出现对检测结果的影响。该方法实现了完全自动检测,无需人工交互,具有检测速度快,准确度高和适应性强的优点,可以适应于当前各种新闻节目。 3.提出了一种基于形状特征的标题条检测方法。本方法利用标题条的形状特征及文字区域的位置关系等先验信息,实现了新闻标题条的快速、准确检测。本方法克服了现有方法对人工干预依赖大,适应性差的局限性,可被应用于图片目录自动创建和新闻视频内容表示当中,使用户可以通过浏览数目很少的图片来了解一段新闻视频节目的主要内容。该算法对各种新闻节目都具有较高的准确率与查全率。 4.给出了一种改进的基于标志性事件的新闻场景自动分割算法。该算法通过对主持人镜头、标题条和静音段在新闻场景变换处出现规律的分析,实现了新闻场景分割,弥补了目前新闻场景分割算法适应性差的缺点。 本论文的主要立足点是:在尽可能提高或少牺牲检测速度的前提下,实现检测的完全自动化,并提高检测方法的准确度和适应性,使其可以有效的处理各种不同种类的新闻视频节目。这样做的目的是为了实现对海量视频数据库的组织和检索。基于此,本论文对新闻视频解析及场景分割几个关键技术做出了一些有意义的研究,提出了几个有效的新闻场